Améliorer les bases de données d'entreprise : Comment Open-Source SuperDuperDB intègre l'IA pour des performances optimales

SuperDuperDB, une entreprise du portefeuille Intel Ignite basée à San Francisco, a lancé la version 0.1 de son framework open-source visant à simplifier le développement et le déploiement d'applications d'intelligence artificielle (IA). Ce package Python permet aux utilisateurs d'intégrer facilement l'IA — des modèles d'apprentissage machine (ML) aux interfaces de programmation d'applications IA (APIs) — ainsi que des capacités de recherche vectorielle au sein de bases de données existantes, facilitant ainsi la création d'applications IA directement sur ces plateformes.

Soutenu par 1,75 million de dollars de financement précoce via des investisseurs tels que Hetz.vc et Session.vc, ainsi que par le bras de capital-risque de MongoDB, SuperDuperDB démontre un potentiel prometteur dans le paysage de l'IA. "Le soutien de MongoDB reflète le potentiel transformationnel de SuperDuperDB. Notre objectif est de combler le fossé entre le stockage de données et l'IA, en facilitant la construction et la gestion des applications IA par une relation symbiotique entre données et IA", a déclaré Timo Hagenow, PDG de SuperDuperDB. Le framework est maintenant disponible sur Product Hunt.

Répondre au Défi de l'IA avec SuperDuperDB

Alors que l'IA devient essentielle aux opérations modernes des entreprises, le développement d'applications s'appuyant sur des modèles ML puissants et des données propriétaires devient de plus en plus complexe. Bien qu'il existe de nombreux modèles ML et APIs, les développeurs rencontrent souvent des obstacles importants pour intégrer ces technologies en production. L'intégration de données provenant de bases de données principales dans des bases de données vectorielles spécialisées implique souvent des pipelines complexes et fragiles, entraînant des processus longs qui retardent les lancements de projets.

"Les entreprises se concentrent souvent uniquement sur la simplification du déploiement des algorithmes sur des ressources informatiques ou sur l'intégration de données et d'algorithmes via des pipelines compliqués, communément appelés MLOps", a expliqué Hagenow. Pour rationaliser ce processus, Hagenow et son équipe ont créé SuperDuperDB, un framework qui intègre directement les modèles IA — y compris l'inférence en streaming et la formation de modèles scalables — dans la base de données de l'entreprise.

"SuperDuperDB peut être facilement installé en tant que package Python, permettant aux développeurs de mettre en place un déploiement unique et scalable de tous leurs modèles IA et APIs pour communiquer directement avec la base de données. Cela transforme la base de données en un environnement robuste de développement et déploiement IA pouvant être déployé en mode expérimental, pour un client unique, ou scalé dans le cloud ou sur site via Kubernetes. Il offre aux développeurs un contrôle total en open-source sur les algorithmes, les données, le calcul et l'infrastructure", a ajouté Hagenow.

Avec ce framework, les développeurs peuvent utiliser divers modèles d'apprentissage machine pour des applications telles que la classification, la régression et les recommandations, ainsi que des modèles IA génératifs avancés pour des chats basés sur LLM et des recherches vectorielles. La fonctionnalité de recherche vectorielle peut utiliser soit les fonctionnalités internes des fournisseurs, soit les capacités de vector-index de SuperDuperDB.

Un Écosystème de Partenaires Fort

Bien que le produit soit encore à ses débuts, SuperDuperDB a attiré l'attention des acteurs clés de l'écosystème, offrant aux équipes d'entreprise un soutien complet pour les bases de données et modèles populaires. Le framework prend en charge diverses plateformes de données, notamment MongoDB, PostgreSQL, MySQL, SQLite et Snowflake, entre autres. Du côté de l'IA, il s'adapte aux modèles de l'écosystème Python, PyTorch, Sklearn, ainsi qu'aux APIs populaires de fournisseurs comme OpenAI et Anthropic.

"MongoDB est devenu notre partenaire technologique officiel, et nous avons réalisé des webinaires et des sessions de code en direct avec des grands clients comme Cisco. Nous explorons également plusieurs POC avec Intel et d'autres PME", a déclaré Hagenow.

Expansion de l'Écosystème

Hagenow a souligné que SuperDuperDB cherche activement à enrichir son écosystème par des collaborations avec des grandes entreprises de bases de données pour des intégrations plus approfondies. L'objectif ultime est d'atteindre une intégration transparente avec des plateformes de données d'entreprise telles que Databricks et Snowflake. Notamment, l'entreprise prévoit une application native pour Snowflake qui sera disponible sur son marketplace.

Applications Potentielles

Si largement adopté, SuperDuperDB pourrait simplifier le développement d'applications IA à travers divers secteurs. "La combinaison de la technologie de SuperDuperDB avec MongoDB Atlas Vector Search accélère considérablement le parcours des développeurs IA. Cette avancée permet aux industries, allant de la détection de fraude en finance à la découverte de médicaments en santé, de construire et déployer rapidement des applications modernes", a noté Boris Bialek, CTO de solutions industrielles chez MongoDB.

Alors qu'il existe des solutions IA en base de données comme MindsDB, celles-ci nécessitent souvent que les développeurs s'adaptent aux dialectes SQL. En revanche, SuperDuperDB est axé sur Python, s'alignant avec le langage de programmation prédominant dans la recherche et le développement IA. "SuperDuperDB offre une interface Python familière tout en permettant aux experts d'accéder à des éléments d'implémentation détaillés, tels que les poids des modèles et les spécificités de formation. Il permet aux utilisateurs de travailler directement avec divers types de données, y compris les images, vidéos et audios encodés en bytes dans Python. Cette approche unique distingue SuperDuperDB dans le domaine open-source de l'IA", a-t-il conclu.

Most people like

Find AI tools in YBX