Vectorize lance sa plateforme Agentic RAG pour la gestion des données d'entreprise en temps réel.

Alors que les bases de données vectorielles deviennent essentielles dans les déploiements d'IA d'entreprise pour la génération augmentée par récupération (RAG), le véritable défi réside dans la gestion efficace des données non structurées. Chris Latimer, co-fondateur et PDG de Vectorize, a précédemment dirigé des initiatives cloud chez DataStax. Il a observé un problème commun : la base de données vectorielle elle-même n'était pas le principal obstacle à l'implémentation du RAG en entreprise. Au contraire, la difficulté résidait dans l'optimisation de l'ingestion des données non structurées dans la base de données vectorielle pour tirer parti de l'IA générative.

Pour répondre à ce défi, Latimer a lancé Vectorize il y a dix mois. La société a depuis annoncé une levée de fonds de 3,6 millions de dollars, dirigée par True Ventures, ainsi que la disponibilité générale de sa plateforme de RAG pour entreprises. Cette plateforme facilite une approche agentique du RAG, permettant une capacité de traitement quasi en temps réel des données. Vectorize se concentre sur l'ingénierie des données, aidant les organisations à préparer et gérer leurs données pour les bases de données vectorielles et les modèles de langage large (LLM). De plus, elle permet aux entreprises de construire rapidement un pipeline de données RAG grâce à une interface intuitive et propose un outil d'évaluation RAG pour tester diverses stratégies.

"Nous avons constamment constaté qu'à la fin des projets d'IA générative, les résultats étaient souvent décevants," a noté Latimer dans une interview exclusive. "Le contexte fourni à la base de données vectorielle n'était pas utile pour le modèle de langage large, ce qui entraînait des hallucinations et des interprétations erronées des données."

Comment Vectorize s'intègre dans l'écosystème RAG d'entreprise

Vectorize n'est pas une base de données vectorielle ; c'est une plateforme qui connecte des sources de données non structurées aux bases de données vectorielles existantes telles que Pinecone, DataStax, Couchbase et Elastic. Elle ingère et optimise les données provenant de diverses sources, garantissant un pipeline de données prêt pour la production qui inclut ingestion, synchronisation, gestion des erreurs et bonnes pratiques en ingénierie des données.

De plus, Vectorize n'est pas une technologie d’embedding vectoriel. Elle aide plutôt les utilisateurs à évaluer différents modèles d'embedding et méthodes de découpage de données pour découvrir la configuration optimale pour leurs cas d'utilisation spécifiques. Latimer a souligné la flexibilité de la plateforme, permettant aux utilisateurs de choisir parmi de nombreux modèles d'embedding, y compris ceux d'OpenAI comme Ada et les embeddings de Voyage AI utilisés par Snowflake.

"Nous nous concentrons sur des stratégies de vectorisation de données innovantes pour obtenir les meilleurs résultats," a déclaré Latimer, en soulignant que la plateforme propose une solution prête pour la production, apaisant ainsi les préoccupations concernant l'ingénierie des données.

Exploitation de l'IA agentique pour le RAG d'entreprise

Une fonctionnalité remarquable de Vectorize est son approche "RAG agentique", qui combine des méthodes RAG traditionnelles avec des capacités d'agent IA, favorisant la résolution autonome de problèmes. Groq, un précurseur et startup de silicium d'inférence IA ayant récemment levé 640 millions de dollars, utilise les capacités RAG agentiques de Vectorize pour améliorer un agent de support IA. Cet agent peut résoudre de manière autonome les demandes des clients en utilisant les données et le contexte des pipelines de Vectorize.

Latimer a expliqué : "Si un client pose une question récurrente, l'agent doit résoudre efficacement le problème sans intervention humaine. Cependant, s'il rencontre un problème plus complexe, il doit le signaler à un humain pour assistance, incarnant l'essence d'une architecture d'agent IA."

L'importance des pipelines de données en temps réel dans le RAG d'entreprise

Pour les entreprises, un avantage considérable de l'utilisation du RAG est l'accès à des données actualisées. "Des données obsolètes entraînent de mauvaises décisions," a mis en garde Latimer. Vectorize propose des capacités de mise à jour des données en temps réel et quasi en temps réel, permettant aux clients de personnaliser leurs préférences de fraîcheur des données.

"Nous permettons aux utilisateurs de configurer la plateforme selon leurs niveaux acceptables de données obsolètes," a-t-il dit. "Qu'ils nécessitent des actualisations hebdomadaires ou des mises à jour en temps réel, notre plateforme peut répondre à ces besoins, fournissant des mises à jour en temps opportun dès que les données sont disponibles."

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles