Google améliore ses plateformes de base de données et d'analytique pour doter les développeurs et les entreprises des capacités de l'IA générative. En 2024, Google a lancé plusieurs mises à jour de son modèle de langage de grande taille Gemini, élargissant ainsi son utilité. Récemment, Google a annoncé l'intégration de ses modèles Gemini dans le service d'analyse BigQuery, accompagnée de nouvelles fonctionnalités pour la préparation de données par IA et la génération augmentée de récupération (RAG). De plus, Google élargit considérablement ses capacités de base de données IA en introduisant le support de la recherche vectorielle dans toutes ses bases de données cloud.
« Nous croyons que l'indexation vectorielle et la recherche vectorielle devraient être fondamentales pour chaque base de données », a déclaré Andi Gutmans, GM et VP pour les bases de données chez Google Cloud. « Les bases de données jouent un rôle crucial dans la génération augmentée de récupération efficace et maximisent les avantages de l'IA en entreprise. »
Recherche Vectorielle Désormais Disponible dans Toutes les Bases de Données Google
Bien que Google ait précédemment proposé un support vectoriel dans certaines bases de données, cette fonctionnalité est maintenant étendue à toutes ses offres. La base de données Google AlloyDB, qui présente déjà des capacités vectorielles et IA, est désormais généralement disponible. En outre, le service de recherche vectorielle Vertex AI de Google, une base de données vectorielle dédiée, complète ces avancées.
Les nouvelles capacités incluent le support de prévisualisation pour les vecteurs dans Memorystore for Redis, CloudSQL, les bases de données relationnelles Spanner, la base de données Firestore et la base de données clé-valeur Bigtable.
Intégrer la recherche vectorielle dans toutes les bases de données Google nécessite un effort d'ingénierie considérable. Gutmans a souligné qu'avec AlloyDB, construit sur le cadre open-source PostgreSQL, Google a tiré parti de la technologie open-source pgvector pour mettre en œuvre le support vectoriel. Cependant, Google a entrepris un travail approfondi pour optimiser les performances et les fonctionnalités pour les utilisateurs.
« Nous devons innover dans différents flux de travail adaptés à chaque base de données en raison de leurs nuances architecturales spécifiques », a noté Gutmans.
Pour faciliter les requêtes avec la recherche vectorielle, les bases de données nécessitent généralement une indexation supplémentaire. Gutmans a insisté sur le fait que la force de Google réside dans la création d'index capables de gérer les vecteurs, s'appuyant sur des années d'expérience à grande échelle pour des services majeurs.
« Ayant opéré à cette échelle, nous comprenons profondément les capacités vectorielles, les utilisant en interne depuis plus d'une décennie dans nos divisions publicitaires et de recherche », a-t-il expliqué.
BigQuery Amélioré avec les Modèles Pro de Gemini
Sur le front analytique, Google renforce BigQuery avec le support de ses derniers modèles Pro de Gemini.
« Cela ouvre un nouveau jeu de scénarios analytiques », a déclaré Gerrit Kazmaier, GM et VP pour l'analyse des données chez Google Cloud, lors d'une récente table ronde avec la presse.
Ces capacités avancées comprennent l'amélioration de la sommation, l'extraction de sentiments, la classification, l'enrichissement et la traduction des données structurées et non structurées. Kazmaier a souligné qu'une grande partie des données d'entreprise reste sous-exploitée, en particulier les données non structurées.
« Avec Gemini Pro et BigQuery, les utilisateurs peuvent désormais analyser sans effort des données non structurées riches aux côtés de données structurées », a-t-il ajouté.