La Révolution Luna de Galileo transforme l'évaluation de l'IA générative : réduction des coûts de 97 % et amélioration de la vitesse par un facteur de 11.

Galileo Révolutionne l'Évaluation de l'IA avec Luna : Un Changeur de Jeu pour les Entreprises

Galileo, leader de l'IA générative pour les entreprises, a lancé Galileo Luna, une suite révolutionnaire de Modèles Fondamentaux d'Évaluation (EFM) conçue pour transformer l'évaluation des systèmes d'IA générative. Luna aborde des défis cruciaux—rapidité, coût et précision—qui ont freiné l'adoption de l'IA générative en production.

« Galileo a créé Luna pour surmonter les limitations des méthodes d'évaluation GenAI existantes, souvent lentes, coûteuses et imprécises, » a déclaré Vikram Chatterji, Co-Fondateur et PDG de Galileo. « Nous avons reconnu le besoin d'évaluations à faible latence, économiques et de haute précision dans les environnements de production. »

Un Jalonnement Majeur dans l'Évaluation de l'IA

Le lancement de Luna marque une étape décisive pour Galileo, une entreprise qui innove dans l'IA générative depuis début 2021. L'engagement de l'entreprise à faire avancer l'évaluation de l'IA se manifeste par près d'une année de R&D rigoureuse ayant abouti au développement de Luna.

Luna a démontré des performances supérieures lors d'un test de référence, atteignant un score AUROC de 0,78, surpassant ainsi des concurrents comme GPT-3.5, Trulens Groundedness et RAGAS Faithfulness.

Modèles Spécialisés Redéfinissant les Normes d'Évaluation

Au cœur de l'innovation de Luna se trouvent ses petits modèles linguistiques spécifiquement conçus pour des tâches d'évaluation telles que la détection d'hallucinations, l'évaluation de la qualité contextuelle, la prévention des fuites de données et l'identification des invites malveillantes. Cette spécialisation permet à Luna d'exceller dans trois métriques clés : rapidité, coût et précision.

« En utilisant des modèles linguistiques sur mesure, Luna réalise des évaluations 97 % moins chères et 11 fois plus rapides que celles effectuées avec GPT-3.5, » a expliqué Chatterji. De plus, Luna surpasse les méthodes précédentes de jusqu'à 20 % dans la détection de problèmes tels que les hallucinations et les informations personnellement identifiables (PII).

Dans une analyse des coûts pour évaluer 1 million de requêtes par mois, Luna ne coûte que 175 $, se révélant ainsi nettement plus économique que GPT-3.5 (6 248 $), RAGAS Faithfulness (7 994 $) et Trulens Groundedness (16 641 $).

Innovation Sans Ensembles de Données Tradicionnels

Une caractéristique remarquable de Luna est sa capacité à fonctionner sans ensembles de données de vérité de référence traditionnels. En utilisant des modèles d'évaluation pré-entraînés, affinés sur des ensembles de données spécifiques à divers domaines, Luna simplifie le processus d'évaluation, éliminant la nécessité de jeux de tests personnalisés chronophages.

Les applications potentielles de Luna sont vastes. Chatterji a souligné son efficacité dans des secteurs nécessitant une haute fiabilité, tels que la santé, la finance et les télécommunications. « Luna est particulièrement puissante pour des applications d'entreprise à grande échelle traitant des millions de requêtes par mois, » a-t-il ajouté.

Rapidité Inégalée et Amélioration Continue

Luna de Galileo offre une rapidité exceptionnelle, traitant une requête en seulement 0,232 secondes, une amélioration significative par rapport à des concurrents comme GPT-3.5 (2,5 secondes) et RAGAS Faithfulness (5,4 secondes).

Les cas d'utilisation de Luna vont de la surveillance en temps réel des sorties de l'IA à l'assurance de la sécurité des interactions des chatbots. Avec le produit Fine Tune de Galileo, Luna peut être personnalisée pour répondre aux besoins spécifiques des clients, atteignant des niveaux de précision de 95 % ou plus dans des secteurs critiques, y compris les produits pharmaceutiques et les services financiers.

Alors que le paysage de l'IA générative évolue, Galileo reste déterminé à l'innovation continue avec Luna, en se concentrant sur l'expansion du soutien aux tâches, l'amélioration de la précision et la réduction des coûts et de la latence.

« Galileo s'engage à faire progresser l'évaluation de l'IA, aidant les organisations à déployer des solutions d'IA fiables, » a déclaré Chatterji. « Alors que l'IA générative continue d'évoluer, nous fournirons aux clients des capacités de pointe qui inspirent la confiance des utilisateurs. »

Avec le lancement de Luna, Galileo renforce sa position de leader dans l'évaluation de l'IA générative pour les entreprises. Alors que les entreprises cherchent à exploiter le potentiel de l'IA générative, les évaluations rapides, économiques et précises de Luna seront essentielles pour favoriser l'adoption généralisée de cette technologie transformative.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles