Présentation de 'Smaug-72B' : Le Champion Émérite des Solutions IA Open Source

Un modèle linguistique open-source révolutionnaire a désormais été sacré meilleur au monde, selon les derniers classements de Hugging Face, la plateforme leader en matière de recherche et d'applications de traitement du langage naturel (NLP). Le modèle, nommé "Smaug-72B", a été publié aujourd'hui par Abacus AI, une startup dédiée à la résolution de défis complexes en intelligence artificielle et machine learning. Smaug-72B est une version optimisée de "Qwen-72B", un autre modèle linguistique marquant introduit il y a seulement quelques mois par une équipe de recherche d'Alibaba Group.

Significativement, Smaug-72B surpasse les modèles propriétaires avancés d'OpenAI, GPT-3.5 et Mistral Medium, dans plusieurs benchmarks clés. Il dépasse également Qwen-72B de manière substantielle dans de nombreuses évaluations. Selon le classement Open LLM de Hugging Face, qui évalue les performances des modèles linguistiques open-source sur diverses tâches, Smaug-72B est désormais le premier et le seul modèle open-source avec une note moyenne supérieure à 80 dans toutes les évaluations majeures. Bien qu'il n'atteigne pas encore la moyenne de 90-100 points, indicative d'une performance de niveau humain, son lancement marque un potentiel changement dans le paysage de l'IA open-source, laissant entrevoir la possibilité qu'il rivalise bientôt avec les capacités des grandes entreprises technologiques longtemps considérées comme inaccessibles.

L’Avantage Open-Source

"Smaug-72B d'Abacus AI est désormais en tête du classement LLM en tant que premier modèle à atteindre une note moyenne de 80," a déclaré Bindu Reddy, PDG d'Abacus AI, dans un post sur X.com. "Notre prochain objectif est de publier ces techniques sous forme d'article de recherche et de les appliquer aux meilleurs modèles Mistral, y compris Miqu, une version fine-tunée de 70B de LLama-2. Les techniques que nous avons employées ciblent spécifiquement les compétences en raisonnement et en mathématiques, ce qui explique les résultats impressionnants de GSM8K ! Nous fournirons davantage d'informations dans notre prochain article."

Depuis sa sortie, Smaug-72B se distingue non seulement par ses performances globales, mais également par ses capacités exceptionnelles en raisonnement et en mathématiques, renforcées par des techniques de fine-tuning spécifiques appliquées par Abacus AI. Ces techniques comblent les faiblesses courantes des modèles linguistiques volumineux, entraînant une amélioration des performances.

D'autres développements open-source notables incluent Qwen 1.5, une suite de modèles linguistiques petits mais puissants allant de 0,5B à 72B de paramètres, lancée par Qwen. Qwen 1.5 surpasse des modèles propriétaires populaires comme Mistral Medium et GPT-3.5, avec une longueur de contexte de 32k et une compatibilité avec divers outils pour une inference locale rapide. De plus, Qwen a introduit Qwen-VL-Max, un nouveau modèle de langage vision large qui concurrence Google Gemini Ultra et OpenAI GPT-4V.

Implications pour l’Avenir de l'IA

L'essor de Smaug-72B et Qwen 1.5 a suscité enthousiasme et discussions au sein de la communauté IA et des cercles technologiques. De nombreux experts ont salué les contributions d'Abacus AI et de Qwen à l'IA open-source, soulignant les avancées rapides réalisées au cours de l'année passée. "C'est incroyable de penser qu'il y a moins d'un an, nous étions enthousiasmés par des modèles comme Dolly," a déclaré Sahar Mor, influenceur et analyste IA, sur LinkedIn, réfléchissant aux progrès fulgurants des modèles open-source.

Smaug-72B et Qwen 1.5 sont accessibles au public sur Hugging Face, permettant aux utilisateurs de les télécharger, de les utiliser et de les modifier librement. Abacus AI et Qwen prévoient également de soumettre leurs modèles au classement d'évaluation humaine llmsys—une nouvelle métrique conçue pour mesurer les performances des modèles linguistiques dans des tâches similaires à celles des humains. Ils ont laissé entendre des projets futurs visant à produire d'autres modèles open-source et à explorer des applications diversifiées.

Smaug-72B et Qwen 1.5 illustrent l'évolution rapide de l'IA open-source ces derniers mois. Ils symbolisent une vague d'innovation transformante et de démocratisation, défiant la domination des grandes entreprises technologiques et élargissant les opportunités pour les développeurs et chercheurs. Alors que l'avenir du leadership de Smaug-72B dans le classement Hugging Face reste à déterminer, il est clair que l'IA open-source prend un ample essor.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles