Le marché des bases de données vectorielles a prospéré en 2023, stimulé par le besoin de contexte et de mémoire à long terme dans les modèles de langage, ce qui améliore l'efficacité et la précision des techniques de génération augmentée par récupération (RAG). Cette avancée vise à atténuer les hallucinations de l'IA. En tête de ce paysage concurrentiel se trouve la startup new-yorkaise Pinecone, qui a sécurisé 100 millions de dollars de financement en avril dernier.
Pinecone a récemment dévoilé ce qu'elle décrit comme une architecture de base de données vectorielle sans serveur « révolutionnaire ». Cette solution innovante permet aux entreprises de développer des applications d'IA plus perspicaces et économiques. Selon un communiqué de presse, le modèle sans serveur de Pinecone devrait offrir des réductions de coûts allant jusqu'à 50 % tout en éliminant les complexités d'infrastructure, permettant aux entreprises de lancer plus rapidement des applications d'IA générative de haute qualité.
L'entreprise a mis en avant plusieurs innovations clés, notamment :
- La séparation des lectures, écritures et stockage pour réduire les coûts de charge de travail.
- Une architecture inédites dans l'industrie avec clustering vectoriel sur un stockage Blob, facilitant des recherches vectorielles rapides et économiques dans d'énormes ensembles de données.
- Des algorithmes d’indexation et de récupération sur mesure.
- Une couche de calcul multi-locataire qui permet la récupération à la demande pour des milliers d'utilisateurs.
Edo Liberty, PDG de Pinecone, a souligné l'importance de cette nouvelle architecture sans serveur, affirmant : « Je ne dis pas cela à la légère. Nous avons été dédiés à ce projet pendant un an et demi ; c'est notre initiative la plus ambitieuse. » Il a précisé que l'objectif va au-delà de la création de la meilleure base de données vectorielle. « Nous visons à permettre une nouvelle génération d'applications d'IA générative qui étaient auparavant impossibles », a-t-il expliqué, exprimant sa confiance dans le rôle de Pinecone pour résoudre les hallucinations de l'IA qui ont empêché les entreprises de lancer des solutions génératives centrées sur le client.
Des entreprises telles que Notion, Blackstone, Canva, Domo et Gong utilisent déjà la technologie sans serveur de Pinecone. Liberty a noté que le nouveau produit est équipé de l'infrastructure robuste nécessaire pour indexer des milliards de vecteurs pour des milliers, voire des centaines de milliers, d’utilisateurs, garantissant une RAG évolutive et une gestion des connaissances. « Elles peuvent le faire plus facilement et à un coût 10 à 100 fois inférieur à ceux des systèmes précédents », a-t-il ajouté.
L'introduction de la solution sans serveur de Pinecone reflète une maturation de la pile technologique de l'IA générative. Le lancement comprend des intégrations avec d'autres leaders du domaine de l'IA, tels qu'Anthropic, Anyscale, Cohere, Confluent, Langchain, Pulumi et Vercel. Liberty a commenté : « La collaboration entre ces acteurs clés signifie que la pile technologique est en évolution, permettant aux développeurs de créer des produits puissants qui fonctionnent ensemble de manière fluide. »