ApertureData offre un gain de vitesse multiplié par 10 pour les entreprises exploitant des données multimodales.

Les données sont la pierre angulaire de l'innovation en IA. Des startups agiles aux multinationales, les organisations investissent des milliards pour exploiter des ensembles de données dans des applications IA performantes. Cependant, malgré ces investissements conséquents, l'accès et l'utilisation des données provenant de sources et modalités diverses—telles que le texte, la vidéo et l'audio—représentent un défi complexe. Les équipes rencontrent de nombreux obstacles d'intégration, entraînant des retards et des opportunités commerciales perdues.

ApertureData, une startup californienne, vise à relever ce défi avec sa couche de données unifiée, ApertureDB. Cette solution innovante combine les atouts des bases de données graphiques et vectorielles avec la gestion des données multimodales, permettant aux équipes IA et données d'accélérer le déploiement de leurs applications. Récemment, ApertureData a annoncé un financement de démarrage de 8,25 millions de dollars et le lancement d'une version cloud-native de sa base de données graphique-vectorielle.

« ApertureDB peut réduire les délais d'infrastructure et de préparation des ensembles de données de 6 à 12 mois, apportant une valeur immense aux CTO et CDO qui doivent élaborer des stratégies IA efficaces dans un environnement en évolution rapide et avec des exigences de données contradictoires », a déclaré Vishakha Gupta, fondatrice et CEO d'ApertureData. Elle a souligné que cette offre peut multiplier par dix la productivité des équipes de science des données et de machine learning dans le développement IA multimodal.

Qu'est-ce qui distingue ApertureData ?

Beaucoup d'organisations luttent pour gérer l'afflux croissant de données multimodales—des téraoctets de texte, d'images, d'audio et de vidéo—entravant leur capacité à exploiter l'IA efficacement. Le défi ne réside pas dans la rareté des données, mais dans l'écosystème d'outils fragmentés nécessaire à leur traitement pour des applications IA avancées.

Actuellement, les équipes doivent rassembler des données provenant de diverses sources, les stocker dans des dépôts cloud, et gérer des métadonnées en constante évolution dans des fichiers ou des bases de données. Ce processus nécessite souvent l'écriture de scripts personnalisés pour la récupération et la prétraitement des données. Une fois les tâches initiales achevées, les équipes doivent intégrer des bases de données graphiques et des fonctionnalités de recherche vectorielle pour mettre en œuvre les expériences IA désirées, entraînant des retards significatifs.

« Les entreprises attendent de leur couche de données qu'elle facilite la gestion de diverses modalités de données, rationalise la préparation en ML, et soutienne la gestion des ensembles de données, les annotations, le suivi des modèles, et la recherche et visualisation avancées des données. Malheureusement, elles recourent souvent à des solutions manuelles intégrées impliquant divers systèmes de stockage cloud, bases de données et bibliothèques de traitement, ce qui complique le flux de travail et retarde les délais des projets », a expliqué Gupta, qui a reconnu ce problème en travaillant avec des données de vision chez Intel.

Pour y remédier, Gupta s'est associée à Luis Remis, également chercheur chez Intel Labs, pour créer une couche de données complète qui répond à toutes les tâches de données IA multimodales sur une seule plateforme.

ApertureDB permet désormais aux entreprises de centraliser les ensembles de données—grandes images, vidéos, documents, embeddings, et leurs métadonnées—pour une récupération et une interrogation efficaces. Il offre une vue unifiée du schéma et inclut des capacités de graphes de connaissances et de recherche vectorielle pour diverses applications IA, allant des chatbots aux systèmes de recherche.

« Grâce à des conversations approfondies, nous avons identifié le besoin d'une base de données qui comprend de manière exhaustive à la fois la gestion des données multimodales et les exigences IA, rendant l'adoption et le déploiement en production sans effort. C'est exactement ce que nous avons réalisé avec ApertureDB », a remarqué Gupta.

Comment ApertureDB se compare-t-il aux solutions existantes ?

Bien que de nombreuses bases de données axées sur l'IA soient disponibles, ApertureData cherche à se démarquer en proposant un produit unifié qui gère nativement les données multimodales et intègre parfaitement les graphes de connaissances avec une recherche vectorielle multimodale rapide pour les applications IA. Les utilisateurs peuvent facilement explorer les relations entre les ensembles de données et utiliser les frameworks IA préférés pour des applications spécifiques.

« Notre principale concurrence provient des plateformes de données internes qui reposent sur un mélange d'outils, tels que des bases de données relationnelles ou graphiques, du stockage cloud et des scripts internes. En général, nous remplaçons des solutions comme Postgres, Weaviate, Qdrant, Milvus, Pinecone, MongoDB, ou Neo4j, en particulier dans des contextes IA multimodaux et génératifs », a souligné Gupta.

ApertureData affirme que sa base de données peut augmenter la productivité des équipes de science des données et d'IA en moyenne de dix fois. Elle est rapportée comme mobilisant des ensembles de données multimodales jusqu'à 35 fois plus rapidement que les solutions traditionnelles et offrant des performances de recherche vectorielle et de classification 2 à 4 fois plus rapides que les bases de données vectorielles open-source existantes.

Bien que Gupta ait évité de divulguer les identités des clients, elle a noté qu'ils avaient établi des déploiements avec certaines entreprises du Fortune 100, y compris un détaillant de meubles, un grand fabricant, et diverses startups en biotechnologie et en IA générative émergentes.

« À travers nos déploiements, les retours des clients mettent en avant des gains significatifs en productivité, évolutivité et performance », a-t-elle ajouté, notant que l'entreprise a permis à un client d'économiser 2 millions de dollars.

À l'avenir, ApertureData prévoit d'élargir sa plateforme cloud pour accueillir de nouvelles classes d'applications IA, d'améliorer les intégrations dans l'écosystème pour une expérience utilisateur fluide, et d'étendre les partenariats pour des déploiements plus larges.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles