DataStax améliore le développement de l'IA générative avec une nouvelle API de données
DataStax a lancé une nouvelle API de données conçue pour faciliter la création d'applications de génération augmentée par la récupération (RAG) en IA générative pour les développeurs. En tant que fournisseur leader de la base de données open source Apache Cassandra, DataStax alimente son service de base de données cloud AstraDB avec cette technologie. En 2023, ils ont ajouté des capacités de base de données vectorielle à leur plateforme, se positionnant ainsi aux côtés des grands acteurs du secteur. Lors d'un récent événement, le PDG de DataStax a déclaré avec confiance que Cassandra est « la meilleure base de données pour l'IA générative ».
Déverrouiller la puissance des bases de données vectorielles
Les capacités de base de données vectorielle sont essentielles pour les applications RAG, qui exploitent de grands modèles de langage (LLM) et des plateformes de données pour produire des résultats précis et sur mesure. DataStax propose des capacités vectorielles dans AstraDB depuis juillet 2023 ; cependant, les utilisateurs devaient encore naviguer dans le langage de requête Cassandra (CQL) pour les appels de données. La nouvelle API de données modifie cette dynamique, permettant aux développeurs d'utiliser Python et JavaScript pour interagir avec la base de données. Cela redéfinit le paysage concurrentiel, rapprochant DataStax des bases de données vectorielles spécialement conçues comme Pinecone, qui a récemment introduit des fonctionnalités sans serveur.
« Il y a eu un bras de fer entre les bases de données vectorielles natives qui ne supportent que les requêtes vectorielles et les bases de données hybrides qui excellent dans la modélisation des requêtes », a déclaré Ed Anuff, Chief Product Officer chez DataStax. « Notre objectif était de combler cette lacune, et c'est précisément ce que réalise l'API de données. »
Transformer le développement d'applications RAG
Bien que la nouvelle API n'introduise pas de nouvelles capacités vectorielles dans AstraDB, elle rationalise le processus de développement. Anuff a noté que depuis l'introduction des capacités vectorielles, environ la moitié des nouveaux utilisateurs d'AstraDB se sont concentrés sur des applications d'IA générative. Le défi était que ces développeurs s'appuyaient principalement sur Python et JavaScript, qui n'étaient pas directement pris en charge pour accéder aux données d'AstraDB.
Avant le lancement de l'API, la création d'applications d'IA exigeait une connaissance approfondie du CQL, impliquant une modélisation complexe des données peu adaptée au développement d'applications RAG. Les requêtes étaient également moins optimisées pour la récupération de données vectorielles.
La nouvelle API de données résout ces problèmes en gérant automatiquement la vectorisation, offrant une interface conviviale en Python et JavaScript, et améliorant les performances grâce à un stockage et un indexage efficaces des données vectorielles au niveau de la base de données. Cela réduit la courbe d'apprentissage et améliore les performances par rapport à l'utilisation des API Cassandra existantes.
Moderniser l'interaction avec la base de données
Les API de bases de données traditionnelles traduisent souvent des langages de programmation comme Python ou JavaScript en langage de requête de la base de données, une pratique similaire aux anciennes méthodes de mapping objet-relationnel (ORM). L'API de données de DataStax se distingue par l'architecture unique de Cassandra, qui facilite des connexions plus profondes au sein de la base de données, entraînant une meilleure performance des requêtes.
« L'API de données présente aux développeurs un format de données simple basé sur JSON. Tout ce qui peut être exprimé en JSON peut être envoyé et récupéré de la base de données », a expliqué Anuff. « Nous stockons cela de manière efficace dans Cassandra, maintenant des performances optimales. »
Améliorer la recherche vectorielle avec JVector
Un élément clé des avancées de DataStax dans les bases de données vectorielles est le moteur de recherche JVector, un outil open source intégré dans AstraDB. Anuff a souligné que JVector utilise DiskANN, une version optimisée pour disque de l'algorithme de recherche des voisins les plus proches approchés (ANN). Cette stratégie améliore considérablement les performances de récupération, en particulier à grande échelle.
DataStax affirme que le moteur JVector permet à AstraDB de fournir une pertinence et un rappel supérieurs par rapport à d'autres bases de données vectorielles. Une grande partie des développements vectoriels en cours chez DataStax, y compris JVector et la nouvelle API de données, est open-source pour la communauté Cassandra et les clients d'AstraDB.
« Nous sommes fortement engagés à fournir des ressources aux écosystèmes open source », a déclaré Anuff. « Notre objectif est de garantir que les développeurs aient la voie la plus simple lors du choix d'un service cloud. »