Dans le domaine de la génération augmentée par la récupération (RAG) pour l'IA d'entreprise, les modèles d'embedding jouent un rôle essentiel. Ces modèles transforment différents types de contenu en vecteurs, rendant l'information interprétable par les systèmes d'IA. Bien que le modèle d'embedding ada d'OpenAI ait été un précurseur, de nombreuses entreprises ont constaté qu'il manquait de spécificité pour certaines applications. C'est là qu'intervient Voyage AI.
Récemment, Voyage AI a annoncé un tour de financement de 20 millions de dollars en série A pour améliorer ses modèles d'embedding et de récupération adaptés aux applications RAG d'entreprise. Un soutien significatif provient de Snowflake, qui prévoit d'intégrer les modèles de Voyage AI dans son service Cortex AI. Cette intégration améliorera la fonctionnalité de recherche de Cortex AI, en tirant parti de la technologie issue de l'acquisition de l'entreprise de recherche AI Neeva par Snowflake.
Voyage AI s'engage à améliorer les capacités RAG des entreprises. Son modèle d'embedding multilingue prend en charge 27 langues avec une précision remarquable. « Nous améliorons le RAG en optimisant la qualité de la récupération », a déclaré Tengyu Ma, fondateur et PDG de Voyage AI. « Des documents plus pertinents se traduisent par de meilleures réponses ; sans eux, les grands modèles de langage peuvent générer des résultats inexactes. »
Amélioration du RAG d'Entreprise grâce à des Embeddings Supérieurs
Les modèles d'embedding sont essentiels pour former des grands modèles de langage (LLMs) et mettre en œuvre des systèmes RAG. Ma a souligné que Voyage AI se concentre sur la création de modèles d'embedding et de reranking avancés pour améliorer la qualité de récupération d'informations spécifiques à un domaine. Il a noté qu'au fur et à mesure que les exigences de précision des entreprises augmentent, les solutions existantes, y compris l'ada d'OpenAI, ne répondent plus adéquatement. « Nos embeddings offrent une plus grande précision et une compréhension approfondie des concepts complexes », a expliqué Ma.
Voyage AI accroît la précision grâce à des techniques avancées, optimisant l'ensemble du processus de formation, y compris la collecte et le filtrage minutieux des données. L'entreprise adapte ses modèles à des secteurs spécifiques tels que la finance, la programmation et le droit, atteignant une performance supérieure dans ces domaines.
Le Rôle de l'Apprentissage Contrastif dans la Formation
Former des modèles d'apprentissage automatique peut s'avérer difficile, surtout avec des données non étiquetées. Pour tirer pleinement parti de ces données, Voyage AI utilise l'apprentissage contrastif, une technique distincte des méthodes traditionnelles de prédiction du mot suivant. « Nous créons des paires contrastées à partir de données non étiquetées pour former nos modèles », a partagé Ma.
Le Partenariat de Snowflake avec Voyage AI
Pour Snowflake, le partenariat avec Voyage AI et l'intégration de ses modèles dans les services Cortex AI visent à améliorer l'utilité pour les utilisateurs d'entreprise. « Chaque fournisseur s'efforce de développer des systèmes RAG. Notre approche permet aux utilisateurs d'interagir sans couture avec leurs données, qu'elles soient structurées ou non », a déclaré Vivek Raghunathan, SVP de l'ingénierie chez Snowflake.
Raghunathan a exprimé son enthousiasme pour les modèles de Voyage AI en raison de leurs capacités avancées, y compris le support multilingue et des fenêtres de contexte élargies, cruciaux pour les applications d'entreprise. Bien que Snowflake propose son modèle d'embedding Arctic, Voyage AI représente une alternative convaincante pour les utilisateurs. « Il faut considérer l'équilibre entre efficacité et qualité ; nos modèles excellent dans des cas d'utilisation complexes », a conclu Raghunathan.