Databricks élève les outils de développement d'IA générative pour les entreprises grâce à des améliorations significatives de sa plateforme Mosaic AI, dévoilées lors de sa conférence annuelle sur les données et l'IA dirigée par le PDG Ali Ghodsi. Ces mises à jour visent à permettre aux entreprises de déployer efficacement des applications alimentées par de grands modèles de langage (LLMs).
La plateforme Mosaic AI, résultat de l'acquisition par Databricks de MosaicML pour 1,3 milliard de dollars, améliore les capacités de l'entreprise en matière d'IA générative, simplifiant le développement d'applications d'IA. Les nouvelles fonctionnalités se concentrent sur trois domaines principaux : 1. la construction de systèmes d'IA composés, 2. l'évaluation de ces systèmes selon divers critères, et 3. l'assurance de la gouvernance tout au long du pipeline d'IA.
Cet écosystème robuste permet aux organisations de créer des applications d'IA générative fiables en utilisant leurs données. Il place également Databricks en concurrence directe avec Snowflake, qui élargit ses propres offres d'IA générative, notamment avec le lancement récent de son LLM open source de niveau entreprise, “Arctic”, visant à défier le DBRX de Databricks.
Quelles sont les nouveautés de Databricks Mosaic AI ?
Les organisations désireuses d'exploiter l'IA générative cherchent à développer des applications utilisant leurs données internes. Cependant, de nombreuses équipes peinent à obtenir le retour sur investissement attendu des grands modèles, faisant souvent face à des défis pour fournir des résultats de qualité dans le respect des contraintes budgétaires et de confidentialité.
Pour surmonter ces défis, les entreprises adoptent de plus en plus des systèmes d'IA composés basés sur la génération augmentée par récupération (RAG), intégrant divers petits modèles, récupérateurs, bases de données vectorielles et outils pour l'évaluation, la surveillance, la sécurité et la gouvernance. Databricks a amélioré Mosaic AI pour faciliter la création de ces systèmes avancés.
Récemment, Databricks a introduit la recherche Vector AI comme une base de données vectorielle sans serveur intégrée à sa plateforme. Les ajouts récents comprennent la formation de modèles Mosaic AI et le cadre d'agents. La fonctionnalité de formation de modèles permet aux utilisateurs de peaufiner de petits modèles de base open source via une API conviviale, optimisant les connaissances pour des tâches spécifiques tout en restant rentables. Parallèlement, le cadre d'agents, combiné à la recherche vectorielle Mosaic AI et à la diffusion de modèles, alimente des applications RAG de haute qualité en utilisant ces modèles affinés.
« D'abord, le cadre d'agents simplifie la mesure et l'évaluation de la qualité des applications grâce à l'évaluation des agents, » a expliqué Joel Minnick, VP du marketing produit chez Databricks. « Il inclut des outils d'évaluation assistés par IA qui évaluent automatiquement la qualité des résultats et une interface intuitive de traçage pour les retours des parties prenantes. Cela permet aux développeurs de tester des hypothèses, d’itérer rapidement et de redéployer efficacement les applications dans un flux de travail LLMOps complet. »
La plateforme dispose également d'un catalogue d'outils IA permettant aux organisations de gouverner, partager et enregistrer des outils via le Databricks Unity Catalog, récemment rendu open source. Ce catalogue renforce les systèmes d'IA composés en les dotant de capacités telles que la génération de code intelligent, la recherche sur le web et les appels d'API. Toute fonction Python ou SQL enregistrée dans le Unity Catalog est compatible avec le catalogue d'outils Mosaic AI, améliorant ainsi la qualité des résultats.
Gouvernance améliorée avec le Mosaic AI Gateway
Pour garantir une gouvernance robuste et une confiance dans les applications d'IA, Databricks introduit le "Mosaic AI Gateway". Cet outil fournit une interface unifiée pour interroger, gérer et déployer des modèles open source et propriétaires, permettant aux équipes de remplacer des LLM sans modifications majeures du code applicatif.
L’AI Gateway est équipé de fonctionnalités de gouvernance et de surveillance intégrées. Il permet le suivi de l'utilisation et l'établissement de garde-fous, permettant aux organisations de surveiller l'utilisation des modèles et de fixer des limites pour contrôler les coûts tout en filtrant les informations sensibles identifiables.
Toutes les nouvelles offres pour Mosaic AI, à l'exception du catalogue d'outils IA, sont actuellement en aperçu public et seront généralement disponibles dans les mois à venir. Le catalogue d'outils IA est en aperçu privé, sans calendrier annoncé pour un déploiement plus large. De plus, Databricks a présenté plusieurs autres produits remarquables lors de l'événement, notamment Databricks AI/BI pour des analyses alimentées par l'IA générative, Databricks LakeFlow pour l'ingénierie des données, et un modèle de génération d'images spécialisé développé en partenariat avec Shutterstock.
Le sommet Databricks Data and AI se déroulera du 10 au 13 juin 2024.