Lorsque Edo Liberty achevait son doctorat en informatique à Yale, en se concentrant sur les projections aléatoires, il ne pouvait pas anticiper qu'une décennie plus tard, ce concept jouerait un rôle clé dans l'intelligence artificielle moderne. Liberty est le fondateur et PDG de Pinecone, un leader de la technologie des bases de données vectorielles, ayant levé plus de 138 millions de dollars, dont un tour significatif de 100 millions de dollars en 2023. Les projections aléatoires, qui ont constitué le sujet de sa thèse, sont désormais un élément fondamental de la recherche vectorielle. D'ici 2024, la technologie des bases de données vectorielles est passée d'un domaine de niche à un composant essentiel pour activer les capacités de génération augmentée par récupération (RAG) dans l'IA générative.
Lors du lancement de Pinecone en 2019, les bases de données vectorielles n'étaient pas largement reconnues. Cependant, aujourd'hui, chaque grand fournisseur de bases de données—y compris Oracle, MongoDB, DataStax et Google Cloud—propose des fonctionnalités de base de données vectorielle.
Pinecone se démarque des autres technologies de bases de données vectorielles de plusieurs manières clés. Récemment, la société a annoncé la disponibilité générale de sa base de données sans serveur sur les trois principaux fournisseurs de cloud : AWS, Microsoft Azure et Google Cloud. Avec cette disponibilité, Pinecone introduit une gamme de nouvelles fonctionnalités pour améliorer la fonctionnalité et l'utilité de sa plateforme.
« Nous avons évolué d'une petite équipe développant un produit obscur à devenir un leader dans la catégorie de base de données la plus en vogue au monde », a partagé Liberty avec les médias.
Fonctionnement de la Base de Données Vectorielle Sans Serveur de Pinecone
Pinecone a d'abord présenté sa base de données vectorielle sans serveur en janvier, en la lançant initialement sur AWS. Avec l'annonce récente, elle est désormais également disponible sur Google Cloud et Microsoft Azure.
L'essence d'une approche sans serveur est d'offrir aux organisations une solution optimisée et gérée, où les coûts sont basés sur l'utilisation. Liberty souligne la simplicité d'utilisation, car cela élimine les complexités liées à la gestion de l'infrastructure. « En tant que client, vous n'avez aucune interaction avec des concepts de calcul ; vous ne sélectionnez pas de tailles de nœuds ni de CPU », a expliqué Liberty. « Vous gérez les lectures, écritures et le stockage en fonction de votre capacité. »
La scalabilité est un autre avantage significatif du modèle sans serveur. Les utilisateurs peuvent démarrer des applications sans se soucier du nombre de vecteurs, que ce soit cinq mille ou cinq milliards. « Vous créez un index, et vous commencez à utiliser le service », a-t-il déclaré.
Nouvelles Fonctionnalités Améliorant la Base de Données Vectorielle Sans Serveur de Pinecone
La disponibilité générale de la base de données vectorielle sans serveur de Pinecone introduit également plusieurs nouvelles fonctionnalités. Parmi les ajouts notables figure la capacité d'importation de données en masse, permettant aux utilisateurs de transférer facilement de grands ensembles de données d'un cloud à un autre, facilitant ainsi la création d'index étendus de manière efficace et à faible coût.
Pinecone met également en place le contrôle d'accès basé sur les rôles (RBAC) dans son offre sans serveur. Bien que le RBAC soit généralement lié à la sécurité, Liberty affirme que son principal avantage réside dans l'amélioration de la gouvernance des données grâce à des mesures de contrôle d'accès pratiques. « Lorsque vous construisez avec une infrastructure, contrôler qui a le droit de lire, écrire et supprimer est crucial. Le contrôle d'accès basé sur les rôles permet cela », a-t-il expliqué.
Avec cette mise à jour de la base de données, Pinecone lance un nouveau kit de développement logiciel (SDK) conçu pour simplifier l'intégration de Pinecone dans les workflows d'application, en particulier pour les applications .NET.
Pourquoi Pinecone Se Distingue Face à la Concurrence
Malgré le nombre croissant de fournisseurs proposant un support pour les bases de données vectorielles, Liberty reste convaincu des avantages distincts de Pinecone. Il soutient que les fournisseurs de bases de données adoptant une approche multi-modèle—où les vecteurs sont considérés simplement comme un autre type de données—sont désavantagés par rapport à Pinecone, qui s'est toujours concentré sur la technologie vectorielle. « Dès le premier jour, nous avons privilégié une expérience développeur exceptionnelle. Une fois que les utilisateurs s'engagent, ils découvrent que nous sommes la solution la plus évolutive, efficace et économique pour la recherche vectorielle », a souligné Liberty. « Notre objectif reste la préparation à la production et à l'entreprise. »