Databricks Data et AI Summit 2024 : Révélation des Innovations les Plus Marquantes

Le sommet annuel de Databricks se présente comme un rassemblement dynamique pour les acteurs de l'écosystème des données. Chaque année, l'entreprise dévoile des technologies innovantes, des partenariats et des avancées destinées à simplifier la gestion des données, qu'elles soient structurées ou non. Le sommet de cette année a respecté cette tradition, avec un accent particulier sur l'intelligence artificielle (IA).

Lors de son discours d'ouverture, le PDG Ali Ghodsi a présenté plusieurs innovations à l'intersection des données et de l'IA, renforçant ainsi l'engagement de l'entreprise à optimiser les jeux de données gouvernés sur la plateforme Databricks Data Intelligence. Parmi les points forts figuraient des améliorations de Mosaic AI, un modèle de génération d'images, ainsi qu'une solution d'IA générative destinée à améliorer l'analyse des données.

Voici les principales annonces de ce sommet :

1. Unity Catalog devient open-source

Dans un mouvement stratégique pour rivaliser avec le Polaris Catalog de Snowflake, Databricks a rendu son Unity Catalog open-source sous une licence Apache 2.0, incluant des spécifications OpenAPI. Cela permet à d'autres entreprises d'utiliser l'architecture et le code pour créer des catalogues prenant en charge divers formats de données, comme Iceberg et Delta/Hudi. Le code a été partagé en direct lors du discours d'ouverture, et on s'attend à ce que Snowflake emboîte le pas dans les 90 jours.

2. Mises à jour de Mosaic AI pour les systèmes de production

Mosaic AI, l'outil de développement d'applications IA, a bénéficié d'améliorations significatives visant à aider les équipes à créer des systèmes IA composites, fiables et prêts pour la production. Les nouvelles fonctionnalités incluent le produit Mosaic AI Model Training, un cadre pour les agents IA, un cadre d'évaluation, ainsi qu'un catalogue d'outils IA et un portail IA pour la gouvernance. Toutes ces offres, sauf les outils IA, sont désormais disponibles en avant-première publique.

3. Nouveau modèle de génération d'images pour les entreprises

Databricks a introduit l'aperçu privé de Shutterstock ImageAI, un modèle d'IA générative permettant aux entreprises de créer des images de haute fidélité adaptées à diverses applications commerciales. Ce modèle, pré-entraîné avec Mosaic AI et la collection d'images de confiance de Shutterstock, est accessible via le générateur d'images de Shutterstock et peut être ajusté à l'aide de Mosaic AI ou intégré par le biais d'APIs.

4. Databricks AI/BI pour des analyses intelligentes

Pour aider les entreprises à démocratiser l'accès aux insights analytiques, Databricks a lancé Databricks AI/BI, un système IA composite intégré à la plateforme Data Intelligence. Utilisant des agents IA — Dashboards et Genie — ce système interprète les requêtes métiers pour produire des réponses en langage naturel et des visualisations. Chaque agent se concentre sur des fonctions spécifiques comme la planification, la génération de SQL et la visualisation, soutenu par des composants supplémentaires tels que le classement des réponses et l'indexation vectorielle. Ce service est disponible pour tous les clients Databricks SQL Pro et Serverless, avec Dashboards maintenant disponibles et Genie en avant-première publique.

5. Databricks LakeFlow pour une ingénierie des données simplifiée

Databricks a également dévoilé LakeFlow, une expérience unifiée conçue pour rationaliser tous les aspects de l'ingénierie des données, de l'ingestion à la transformation et à l'orchestration. LakeFlow simplifie le processus traditionnellement complexe de construction et de maintenance des pipelines de données en automatisant leur déploiement, leur fonctionnement et leur suivi, tout en offrant un support robuste pour CI/CD et les contrôles de qualité à grande échelle. Bien que non encore en avant-première, Databricks a ouvert une liste d'attente pour un accès anticipé.

6. Partenariats avec Nvidia et Gretel

Enfin, Databricks a annoncé des partenariats significatifs avec Nvidia et Gretel. La collaboration avec Nvidia vise à intégrer une prise en charge native du calcul accéléré par CUDA dans le moteur de requête vectorisé de nouvelle génération de Databricks, Photon, améliorant ainsi les performances pour le stockage et l'analyse des données. Le partenariat avec Gretel désigne l'entreprise comme partenaire technologique ISV, offrant des ensembles de données synthétiques de haute qualité pour le développement et la personnalisation des modèles d'apprentissage automatique sur la plateforme de Databricks.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles