Le mystérieux modèle d'IA 'gpt2-chatbot' surprend les experts : innovation révolutionnaire ou simple effet de mode ?

Home Actualités IA Le mystérieux modèle d'IA 'gpt2-chatbot' surprend les experts : innovation révolutionnaire ou simple effet de mode ?

Un compte vérifié sur X (anciennement Twitter) représentant l'Organisation des Systèmes de Grands Modèles a annoncé la suppression temporaire du gpt2-chatbot, invoquant un « trafic exceptionnellement élevé » et des « limites de capacité ». L'organisation a souligné sa collaboration avec différents développeurs de modèles pour offrir à la communauté l'accès à des modèles non publiés pour des tests, y compris gpt2-chatbot.

Un nouveau système d'intelligence artificielle, nommé « gpt2-chatbot », a fait son apparition en ligne, suscitant un large intérêt concernant ses origines et ses capacités. De nombreux chercheurs estiment qu'il représente une avancée significative par rapport aux modèles d'IA existants.

Le modèle est apparu discrètement sur l'Arène des Chatbots LMSYS, un site web dédié à la comparaison des systèmes de langage d'IA. Cependant, ses performances ont captivé les experts en IA, qui suggèrent qu'il pourrait rivaliser, voire surpasser GPT-4, le dernier système développé par OpenAI.

Andrew Gao, chercheur en IA à l'Université de Stanford, a déclaré : « Il est impossible de déterminer qui l'a créé, mais je suis d'accord sur le fait qu'il semble être au moins au niveau de GPT-4. » Fait notable, le gpt2-chatbot a réussi à résoudre un problème de l'Olympiade Internationale de Mathématiques, une réalisation que Gao met en avant compte tenu du niveau de difficulté de la compétition.

Ethan Mollick, professeur à la Wharton School spécialisé en IA, a observé que dans ses tests, gpt2-chatbot a surpassé GPT-4 sur des tâches complexes telles que coder un croquis de licorne. Il a déclaré : « Il pourrait être meilleur que GPT-4, en particulier dans la tâche difficile de 'dessiner une licorne avec du code'. »

Les capacités remarquables du modèle ont entraîné des spéculations folles sur ses origines. De nombreux chercheurs soupçonnent que le gpt2-chatbot a été développé par OpenAI, étant donné qu'il s'identifie comme « ChatGPT, un grand modèle de langage formé par OpenAI, basé sur l'architecture GPT-4. » Cependant, cette affirmation est difficile à vérifier, car les systèmes d'IA peuvent être conçus pour tromper quant à leurs origines.

Certains experts ont noté des similitudes avec les modèles précédents d'OpenAI comme signe de ses créateurs. « Il prétend être développé par OpenAI, » a noté Gao, bien qu'il ait averti que cela pourrait être un indicateur trompeur en raison de la contamination des données provenant de l'entraînement sur des discussions dérivées d'OpenAI.

Malgré sa proximité apparente avec GPT-4, certains chercheurs suggèrent que gpt2-chatbot ne dépasse pas substantiellement les capacités de GPT-4. Joe Fox, un autre chercheur en IA, a souligné que bien que gpt2-chatbot soit impressionnant, il ne pourrait pas représenter un grand bond par rapport à GPT-4 dans les applications pratiques.

Il est également possible que gpt2-chatbot provienne d'une organisation moins connue cherchant à démontrer sa compétence en IA. Ce scénario rappelle la sortie de GPT-4chan par le chercheur en IA Yannic Kilcher en juin 2022, un modèle utilisant une convention de nommage similaire mais sans lien avec OpenAI.

Alors que les chercheurs explorent les fonctionnalités de gpt2-chatbot, ils ont découvert des comportements indiquant un potentiel supplémentaire. Notamment, le modèle semble plus enclin à enfreindre les règles que les chatbots précédents. Dimitris Papailiopoulos, professeur en IA à l'Université du Wisconsin, a trouvé que gpt2-chatbot était capable de résoudre un puzzle logique que GPT-4 n'avait pas pu résoudre. « J'ai découvert une tâche où gpt2-chatbot excelle par rapport à tous les autres modèles, même si c'est trivial, » a-t-il remarqué avec humour.

De plus, le modèle a montré une forte compétence dans les tâches de codage. Chase McCoy, ingénieur fondateur chez CodeGen, a rapporté que gpt2-chatbot avait surpassé à la fois GPT-4 et Claude Opus dans tous les tests de codage utilisés pour évaluer les modèles. « Ses performances sont définitivement remarquables, » a-t-il déclaré.

Certains utilisateurs ont noté que gpt2-chatbot pouvait engager un dialogue itératif pour améliorer ses réponses, affichant une prise de conscience de ses limites. Gao a déclaré : « Il semble exceller par rapport à GPT-4 dans la pensée stratégique, générant des sites spécifiques et des requêtes de recherche, tandis que GPT-4 tend à fournir des réponses plus vagues. »

L'évolution rapide de l'intelligence artificielle se manifeste avec l'émergence de gpt2-chatbot. Il y a un peu plus d'un an, GPT-4 représentait un progrès significatif dans le raisonnement de bon sens de l'IA. Son concurrent, Claude 3 d'Anthropic, a également repoussé les frontières dans les conversations ouvertes.

Avec le développement continu de modèles open source et le perfectionnement des systèmes existants, le paysage de l'IA évolue rapidement, permettant à des équipes de toutes tailles de créer et de déployer des modèles novateurs à grande vitesse. L'arrivée de « gpt2-chatbot » a laissé les chercheurs en émoi et souligne les avancées fulgurantes dans le domaine de l'IA.

Bien que les implications complètes de gpt2-chatbot demeurent incertaines, son lancement inattendu et ses capacités avancées pourraient annoncer une nouvelle ère dans l'IA, où des percées apparaissent fréquemment sans avertissement des profondeurs d'Internet.

Salesforce dévoile la prochaine génération d'analytique à intelligence artificielle pour Tableau.

Cohere lance les modèles Command R sur Amazon Bedrock : Découvrez dès aujourd'hui de nouvelles capacités d'IA !

Most people like

OpenGPT

35.6K

OpenGPT est une plateforme intuitive conçue pour créer rapidement et facilement des applications ChatGPT. Grâce à son interface simplifiée, les utilisateurs peuvent tirer parti de la puissance de l'IA pour créer des expériences conversationnelles captivantes en un rien de temps.

ChatGPT AI App Builder

IdeaApe

27.7K

Découvrez l'outil de recherche de marché alimenté par l'IA, conçu pour les utilisateurs avancés comme pour les débutants. Notre plateforme innovante allie technologie de pointe et fonctionnalités conviviales, facilitant la collecte d'informations et l'analyse des tendances du marché. Découvrez la puissance de la recherche guidée par l'IA et améliorez votre processus décisionnel dès aujourd'hui !

étude de marché AI Analytics Assistant

LinkDR

75K

Améliorez la visibilité de votre site web grâce à un logiciel automatisé conçu spécifiquement pour optimiser le SEO par des stratégies de création de liens efficaces.

SEO AI SEO Assistant

Machined.ai

42.2K

Découvrez notre plateforme alimentée par l'IA, conçue pour automatiser facilement des grappes de contenu. Augmentez votre trafic organique et améliorez vos classements de recherche grâce à une technologie de pointe adaptée au marketing digital moderne.

Génération de contenu alimentée par l'IA AI Content Generator

Find AI tools in YBX