Les bases de données tabulaires traditionnelles peinent à s'adapter à l'ère de l'IA, notamment avec des types de données complexes tels que les vecteurs, les images, les vidéos et l'audio à grande échelle. Bien que le stockage de ces formats divers soit difficile, leur récupération et leur gestion ajoutent une nouvelle couche de complexité, surtout lorsqu'il s'agit de plusieurs types de fichiers.
C'est là qu'intervient LanceDB, une solution conçue pour le paysage de l'IA. Soutenue par Y Combinator, la société a récemment annoncé avoir complété un tour de financement de démarrage de 8 millions de dollars, sur un total de 11 millions de dollars. LanceDB développe une base de données spécifiquement conçue pour les données multimodales, tirant parti du format ouvert Lance, optimisé pour les tâches d'apprentissage machine. La plateforme intègre nativement le stockage d'objets, garantissant une gestion et une récupération des données IA performantes, évolutives et cloud-native.
Les développeurs peuvent utiliser LanceDB de trois manières : en l'intégrant à leur backend existant, en l'exécutant via une application cliente comme Jupyter Notebook, ou en le déployant en tant que base de données sans serveur distante. Contrairement aux systèmes traditionnels où client et serveur fonctionnent comme des processus distincts, LanceDB sépare efficacement le stockage du calcul, permettant une intégration directe au sein des applications.
Des organisations de premier plan, telles que Midjourney, Character.ai, Airtable, Tubi, Hex et WeRide, utilisent déjà LanceDB. Grâce à cet investissement, la société vise à améliorer ses offres, facilitant le passage des projets IA de la phase expérimentale à la phase de production. Le tour de financement a été dirigé par la société de capital-risque CRV, avec un soutien supplémentaire de Y Combinator, Essence VC et Swift Ventures.
“Les modèles multimodaux représentent la nouvelle frontière. Les praticiens de l'IA visionnaires ont besoin d'une infrastructure de données innovante pour former, mettre à jour et suivre le rythme de la prochaine génération d'applications IA”, a déclaré Murat Bicer, partenaire général chez CRV.
Les offres commerciales de LanceDB incluent actuellement une base de données open-source entièrement fonctionnelle avec des SDK pour Rust, Python et JavaScript, une solution sans serveur hébergée, ainsi qu'un produit d'entreprise destiné aux équipes qui gèrent de grands ensembles de données et ont besoin de fonctionnalités de sécurité robustes.