La Révolution Luna de Galileo transforme l'évaluation de l'IA générative : réduction des coûts de 97 % et amélioration de la vitesse par un facteur de 11.

Home Actualités IA La Révolution Luna de Galileo transforme l'évaluation de l'IA générative : réduction des coûts de 97 % et amélioration de la vitesse par un facteur de 11.

Galileo Révolutionne l'Évaluation de l'IA avec Luna : Un Changeur de Jeu pour les Entreprises

Galileo, leader de l'IA générative pour les entreprises, a lancé Galileo Luna, une suite révolutionnaire de Modèles Fondamentaux d'Évaluation (EFM) conçue pour transformer l'évaluation des systèmes d'IA générative. Luna aborde des défis cruciaux—rapidité, coût et précision—qui ont freiné l'adoption de l'IA générative en production.

« Galileo a créé Luna pour surmonter les limitations des méthodes d'évaluation GenAI existantes, souvent lentes, coûteuses et imprécises, » a déclaré Vikram Chatterji, Co-Fondateur et PDG de Galileo. « Nous avons reconnu le besoin d'évaluations à faible latence, économiques et de haute précision dans les environnements de production. »

Un Jalonnement Majeur dans l'Évaluation de l'IA

Le lancement de Luna marque une étape décisive pour Galileo, une entreprise qui innove dans l'IA générative depuis début 2021. L'engagement de l'entreprise à faire avancer l'évaluation de l'IA se manifeste par près d'une année de R&D rigoureuse ayant abouti au développement de Luna.

Luna a démontré des performances supérieures lors d'un test de référence, atteignant un score AUROC de 0,78, surpassant ainsi des concurrents comme GPT-3.5, Trulens Groundedness et RAGAS Faithfulness.

Modèles Spécialisés Redéfinissant les Normes d'Évaluation

Au cœur de l'innovation de Luna se trouvent ses petits modèles linguistiques spécifiquement conçus pour des tâches d'évaluation telles que la détection d'hallucinations, l'évaluation de la qualité contextuelle, la prévention des fuites de données et l'identification des invites malveillantes. Cette spécialisation permet à Luna d'exceller dans trois métriques clés : rapidité, coût et précision.

« En utilisant des modèles linguistiques sur mesure, Luna réalise des évaluations 97 % moins chères et 11 fois plus rapides que celles effectuées avec GPT-3.5, » a expliqué Chatterji. De plus, Luna surpasse les méthodes précédentes de jusqu'à 20 % dans la détection de problèmes tels que les hallucinations et les informations personnellement identifiables (PII).

Dans une analyse des coûts pour évaluer 1 million de requêtes par mois, Luna ne coûte que 175 $, se révélant ainsi nettement plus économique que GPT-3.5 (6 248 $), RAGAS Faithfulness (7 994 $) et Trulens Groundedness (16 641 $).

Innovation Sans Ensembles de Données Tradicionnels

Une caractéristique remarquable de Luna est sa capacité à fonctionner sans ensembles de données de vérité de référence traditionnels. En utilisant des modèles d'évaluation pré-entraînés, affinés sur des ensembles de données spécifiques à divers domaines, Luna simplifie le processus d'évaluation, éliminant la nécessité de jeux de tests personnalisés chronophages.

Les applications potentielles de Luna sont vastes. Chatterji a souligné son efficacité dans des secteurs nécessitant une haute fiabilité, tels que la santé, la finance et les télécommunications. « Luna est particulièrement puissante pour des applications d'entreprise à grande échelle traitant des millions de requêtes par mois, » a-t-il ajouté.

Rapidité Inégalée et Amélioration Continue

Luna de Galileo offre une rapidité exceptionnelle, traitant une requête en seulement 0,232 secondes, une amélioration significative par rapport à des concurrents comme GPT-3.5 (2,5 secondes) et RAGAS Faithfulness (5,4 secondes).

Les cas d'utilisation de Luna vont de la surveillance en temps réel des sorties de l'IA à l'assurance de la sécurité des interactions des chatbots. Avec le produit Fine Tune de Galileo, Luna peut être personnalisée pour répondre aux besoins spécifiques des clients, atteignant des niveaux de précision de 95 % ou plus dans des secteurs critiques, y compris les produits pharmaceutiques et les services financiers.

Alors que le paysage de l'IA générative évolue, Galileo reste déterminé à l'innovation continue avec Luna, en se concentrant sur l'expansion du soutien aux tâches, l'amélioration de la précision et la réduction des coûts et de la latence.

« Galileo s'engage à faire progresser l'évaluation de l'IA, aidant les organisations à déployer des solutions d'IA fiables, » a déclaré Chatterji. « Alors que l'IA générative continue d'évoluer, nous fournirons aux clients des capacités de pointe qui inspirent la confiance des utilisateurs. »

Avec le lancement de Luna, Galileo renforce sa position de leader dans l'évaluation de l'IA générative pour les entreprises. Alors que les entreprises cherchent à exploiter le potentiel de l'IA générative, les évaluations rapides, économiques et précises de Luna seront essentielles pour favoriser l'adoption généralisée de cette technologie transformative.

Zyphra lance Zyda : un ensemble de données de modélisation linguistique de 1,3 To qui prétend surpasser Pile, C4 et arXiv.

Adobe répond aux inquiétudes croissantes concernant le nouveau langage controversé des conditions de service.

Most people like

Chub

7.1M

Débloquez tout le potentiel de vos modèles linguistiques en gérant efficacement et en collaborant sur le développement des personnages. Que vous créiez des histoires interactives, conçeviez des personas uniques ou formiez une IA à comprendre des voix variées, maîtriser la gestion des personnages est essentiel pour obtenir des résultats réalistes et captivants.

Personnages AI Character

Subtxt

45.5K

Subtxt est un outil d'écriture de pointe conçu pour aider les narrateurs à créer des récits captivants. Grâce à ses fonctionnalités intelligentes, Subtxt permet aux utilisateurs d'améliorer leurs compétences en narration et d'engager efficacement les lecteurs.

outil de planification AI Book Writing

Luvvoice

892.8K

Découvrez notre outil gratuit de synthèse vocale, avec plus de 200 voix naturelles. Transformez facilement votre contenu écrit en audio captivant !

synthèse vocale Translate

Jobed

85.2K

Jobed est une plateforme innovante alimentée par l'IA, conçue pour rédiger des descriptions de poste convaincantes et précises pour les entreprises. Grâce à ses algorithmes intelligents, Jobed aide les entreprises à attirer efficacement les talents appropriés.

générateur de description de poste AI Content Generator

Find AI tools in YBX