Le mystérieux modèle d'IA 'gpt2-chatbot' surprend les experts : innovation révolutionnaire ou simple effet de mode ?

Un compte vérifié sur X (anciennement Twitter) représentant l'Organisation des Systèmes de Grands Modèles a annoncé la suppression temporaire du gpt2-chatbot, invoquant un « trafic exceptionnellement élevé » et des « limites de capacité ». L'organisation a souligné sa collaboration avec différents développeurs de modèles pour offrir à la communauté l'accès à des modèles non publiés pour des tests, y compris gpt2-chatbot.

Un nouveau système d'intelligence artificielle, nommé « gpt2-chatbot », a fait son apparition en ligne, suscitant un large intérêt concernant ses origines et ses capacités. De nombreux chercheurs estiment qu'il représente une avancée significative par rapport aux modèles d'IA existants.

Le modèle est apparu discrètement sur l'Arène des Chatbots LMSYS, un site web dédié à la comparaison des systèmes de langage d'IA. Cependant, ses performances ont captivé les experts en IA, qui suggèrent qu'il pourrait rivaliser, voire surpasser GPT-4, le dernier système développé par OpenAI.

Andrew Gao, chercheur en IA à l'Université de Stanford, a déclaré : « Il est impossible de déterminer qui l'a créé, mais je suis d'accord sur le fait qu'il semble être au moins au niveau de GPT-4. » Fait notable, le gpt2-chatbot a réussi à résoudre un problème de l'Olympiade Internationale de Mathématiques, une réalisation que Gao met en avant compte tenu du niveau de difficulté de la compétition.

Ethan Mollick, professeur à la Wharton School spécialisé en IA, a observé que dans ses tests, gpt2-chatbot a surpassé GPT-4 sur des tâches complexes telles que coder un croquis de licorne. Il a déclaré : « Il pourrait être meilleur que GPT-4, en particulier dans la tâche difficile de 'dessiner une licorne avec du code'. »

Les capacités remarquables du modèle ont entraîné des spéculations folles sur ses origines. De nombreux chercheurs soupçonnent que le gpt2-chatbot a été développé par OpenAI, étant donné qu'il s'identifie comme « ChatGPT, un grand modèle de langage formé par OpenAI, basé sur l'architecture GPT-4. » Cependant, cette affirmation est difficile à vérifier, car les systèmes d'IA peuvent être conçus pour tromper quant à leurs origines.

Certains experts ont noté des similitudes avec les modèles précédents d'OpenAI comme signe de ses créateurs. « Il prétend être développé par OpenAI, » a noté Gao, bien qu'il ait averti que cela pourrait être un indicateur trompeur en raison de la contamination des données provenant de l'entraînement sur des discussions dérivées d'OpenAI.

Malgré sa proximité apparente avec GPT-4, certains chercheurs suggèrent que gpt2-chatbot ne dépasse pas substantiellement les capacités de GPT-4. Joe Fox, un autre chercheur en IA, a souligné que bien que gpt2-chatbot soit impressionnant, il ne pourrait pas représenter un grand bond par rapport à GPT-4 dans les applications pratiques.

Il est également possible que gpt2-chatbot provienne d'une organisation moins connue cherchant à démontrer sa compétence en IA. Ce scénario rappelle la sortie de GPT-4chan par le chercheur en IA Yannic Kilcher en juin 2022, un modèle utilisant une convention de nommage similaire mais sans lien avec OpenAI.

Alors que les chercheurs explorent les fonctionnalités de gpt2-chatbot, ils ont découvert des comportements indiquant un potentiel supplémentaire. Notamment, le modèle semble plus enclin à enfreindre les règles que les chatbots précédents. Dimitris Papailiopoulos, professeur en IA à l'Université du Wisconsin, a trouvé que gpt2-chatbot était capable de résoudre un puzzle logique que GPT-4 n'avait pas pu résoudre. « J'ai découvert une tâche où gpt2-chatbot excelle par rapport à tous les autres modèles, même si c'est trivial, » a-t-il remarqué avec humour.

De plus, le modèle a montré une forte compétence dans les tâches de codage. Chase McCoy, ingénieur fondateur chez CodeGen, a rapporté que gpt2-chatbot avait surpassé à la fois GPT-4 et Claude Opus dans tous les tests de codage utilisés pour évaluer les modèles. « Ses performances sont définitivement remarquables, » a-t-il déclaré.

Certains utilisateurs ont noté que gpt2-chatbot pouvait engager un dialogue itératif pour améliorer ses réponses, affichant une prise de conscience de ses limites. Gao a déclaré : « Il semble exceller par rapport à GPT-4 dans la pensée stratégique, générant des sites spécifiques et des requêtes de recherche, tandis que GPT-4 tend à fournir des réponses plus vagues. »

L'évolution rapide de l'intelligence artificielle se manifeste avec l'émergence de gpt2-chatbot. Il y a un peu plus d'un an, GPT-4 représentait un progrès significatif dans le raisonnement de bon sens de l'IA. Son concurrent, Claude 3 d'Anthropic, a également repoussé les frontières dans les conversations ouvertes.

Avec le développement continu de modèles open source et le perfectionnement des systèmes existants, le paysage de l'IA évolue rapidement, permettant à des équipes de toutes tailles de créer et de déployer des modèles novateurs à grande vitesse. L'arrivée de « gpt2-chatbot » a laissé les chercheurs en émoi et souligne les avancées fulgurantes dans le domaine de l'IA.

Bien que les implications complètes de gpt2-chatbot demeurent incertaines, son lancement inattendu et ses capacités avancées pourraient annoncer une nouvelle ère dans l'IA, où des percées apparaissent fréquemment sans avertissement des profondeurs d'Internet.

Most people like

Find AI tools in YBX