Le 28 juin dernier, Google a annoncé la disponibilité en avant-première d’un nouveau jeu de données publiques issues de Google Trends. Le top 25 des termes de recherche Google pour les Etats-Unis, actualisé quotidiennement et avec un historique de 5 ans. Pour la première fois, des données de recherche appartenant à Google seront ainsi accessibles en ligne dans les ensembles de données « Google Cloud Datasets ». Ces données peuvent être utilisées avec les outils d’analytique de votre choix. Google en profite pour rappeler que son outil BigQuery, un entrepôt de données d’entreprise (entreprise data warehouse) dans le cloud, permet d’effectuer des requêtes SQL ultra-rapides grâce à la puissance de traitement de l’infrastructure de Google.
Une précision importante face aux enjeux de protection de la vie privée : ces données de recherche ont été anonymisées, indexées, normalisées et agrégées. L’accès à ces données est gratuit jusqu’à 1TB/mois en requêtes, et jusqu’à to 10GB/mois en stockage de données, avec BigQuery. Au-delà de ces limites il faudra un abonnement à BigQuery.
D’autres ensembles de données Google sont déjà disponibles pour vos besoins d’analyses ou pour entrainer une IA. Par exemple les recherche de Google à propos des brevets. Pour savoir « Quels sont les 20 brevets les plus récemment déposés ? » et « Quelles entreprises du classement Fortune 500 ont déposé activement des brevets entre 2017 et 2019 ? ».