La percée de l'IA de Tenyx : le modèle open-source Llama 3 surpasse les performances de GPT-4.

Home Actualités IA La percée de l'IA de Tenyx : le modèle open-source Llama 3 surpasse les performances de GPT-4.

Lors d'une interview exclusive, Itamar Arel, fondateur et PDG de la startup d'IA Tenyx, a dévoilé une avancée remarquable dans le traitement du langage naturel. Tenyx a perfectionné le modèle de langage open-source Llama-3 de Meta, désormais nommé Tenyx-70B, pour surpasser le GPT-4 d'OpenAI dans des domaines spécifiques, marquant une première pour un modèle open-source dépassant les normes propriétaires.

« Nous avons développé une technologie de perfectionnement qui nous permet d'améliorer un modèle fondamental au-delà de sa formation initiale », a expliqué Arel. « Nous sommes enthousiasmés par l'utilisation de cette approche pour permettre un apprentissage continu ou incrémental en tirant parti des redondances dans les grands modèles. »

Le modèle Llama-3 de Tenyx surpasse le GPT-4 en mathématiques et en codage, tout en excédant le modèle de base Llama-3 dans toutes ses capacités. Selon Arel, cette réussite souligne une nouvelle ère pour l'IA open-source.

S'attaquer à l'« Oubli Catastrophique »

Tenyx aborde le problème de "l'oubli catastrophique", où un modèle peut perdre des connaissances acquises précédemment lorsqu'il est exposé à de nouvelles données. En actualisant sélectivement une petite fraction des paramètres du modèle, Tenyx parvient à s'entraîner sur de nouvelles informations sans sacrifier les compétences existantes.

« Si vous modifiez seulement 5 % des paramètres du modèle tout en conservant le reste intact, vous pouvez le faire de manière plus agressive sans distordre d'autres fonctions », a noté Arel. Cette méthode permet à Tenyx de peaufiner le modèle Llama-3, doté de 70 milliards de paramètres, en seulement 15 heures en utilisant 100 GPU.

Engagement en faveur de l'IA Open-Source

Tenyx fait la promotion de l'IA open-source en publiant son modèle perfectionné, Tenyx-70B, sous la même licence que le Llama-3 original. « Nous croyons aux modèles open-source », a déclaré Arel. « Partager les avancées avec la communauté favorise l'innovation et profite à tous. »

Les applications de la technologie d'optimisation post-formation de Tenyx sont vastes, allant du développement de chatbots spécialisés à la facilitation de mises à jour fréquentes pour les modèles déployés, garantissant qu'ils restent à jour avec les informations émergentes.

Redéfinir le Paysage de l'IA

Cette avancée de Tenyx a des implications significatives, offrant aux entreprises et aux chercheurs l'accès à des modèles linguistiques avancés sans les coûts prohibitif des solutions propriétaires. Cette évolution pourrait également stimuler davantage d'innovations dans la communauté open-source, d'autres s'appuyant sur le succès de Tenyx.

« Qu'est-ce que cela signifie pour l'industrie et des entreprises comme OpenAI ? » s'est interrogé Arel. Alors que la concurrence dans le secteur de l'IA s'intensifie, le perfectionnement par Tenyx des modèles open-source pourrait redéfinir la dynamique de l'industrie et la façon dont les entreprises abordent le traitement du langage naturel.

Bien que le modèle Llama-3 optimisé par Tenyx conserve certaines limitations de son modèle de base, y compris des réponses parfois illogiques, ses améliorations sont remarquables. Arel a rapporté que le modèle obtient près de 96 % d'exactitude en mathématiques et en raisonnement, contre 85 % pour le modèle de base.

Alors que Tenyx ouvre la voie à une nouvelle vague d'innovation en IA open-source, l'impact à long terme de leur percée sur l'écosystème de l'IA reste à évaluer. Il est cependant évident que Tenyx prouve que les modèles open-source peuvent rivaliser, voire surpasser, leurs homologues propriétaires, ouvrant ainsi la voie à un avenir plus accessible et collaboratif en intelligence artificielle.

Espresso AI Sort de l'ombre avec un financement de 11 millions de dollars pour répondre à la crise des coûts dans le cloud.

Sprinklr dévoile 'Digital Twins' : des représentations de marques par IA améliorant l'expérience client.

Most people like

FotoExamen

55K

Libérez votre potentiel avec une plateforme IA pour des solutions simples d'examens et de devoirs par le biais de photos.

Tutorat IA Homework Helper

Maths-Whizz

141.3K

Découvrez notre tuteur virtuel de mathématiques alimenté par l'IA, conçu spécialement pour les enfants de 5 à 13 ans. Cet outil innovant offre des expériences d'apprentissage personnalisées, aidant les jeunes apprenants à comprendre les concepts mathématiques de manière engageante. Grâce à des leçons interactives, des retours en temps réel et des exercices pratiques sur mesure, notre tuteur IA renforce la confiance et cultive l'amour des mathématiques. Que votre enfant ait besoin d'aide pour des calculs de base ou des sujets plus avancés, notre tuteur virtuel s'adapte à son rythme d'apprentissage individuel, rendant les mathématiques agréables et accessibles à chaque enfant.

tuteur virtuel IA AI Coaching

OpenArt

5.1M

OpenArt est un générateur d'images AI innovant conçu pour stimuler la créativité et la productivité en proposant une large gamme de modèles AI et de styles artistiques. Grâce à son interface conviviale, OpenArt permet aux utilisateurs de transformer facilement leurs visions créatives en visuels époustouflants.

Générateur d'images IA AI Art Generator

ClipMove AI

351.1K

Révolutionnez votre processus de création de contenu avec notre assistant alimenté par l'IA, doté d'un générateur de vidéos innovant et d'une suite d'outils essentiels. Idéal pour les professionnels du marketing, les blogueurs et les créateurs, cette plateforme puissante simplifie votre flux de travail, vous permettant de produire des vidéos engageantes et du contenu captivant en toute simplicité. Adoptez l'avenir de la création de contenu et élevez vos projets dès aujourd'hui !

Création de contenu IA Text to Video

Find AI tools in YBX