Déverrouiller le Sonnet de Claude 3.5 d'Anthropic : Les passionnés d'IA s'exclament, « C'est incroyable ! »

Un nouveau modèle de langage de grande taille (LLM) a visiblement eclipsé le GPT-4 d'OpenAI, à peine un mois après sa sortie. Le chatbot Claude 3.5 Sonnet, développé par Anthropic, revendique la première place dans des tests de référence tiers tout en étant plus rapide et plus rentable que ses prédécesseurs Claude.

Cependant, lancer un nouveau modèle et revendiquer sa supériorité est différent de permettre aux utilisateurs de ressentir réellement ses gains de performance. (À toi, la famille Google Gemini : bien que tu sembles surpasser le précédent fleuron d'OpenAI, GPT-4, sur certains critères, l'utilisation réelle raconte une autre histoire.)

En revanche, Claude 3.5 Sonnet a attiré une attention considérable depuis son lancement, avec des influenceurs en IA et des utilisateurs avancés partageant leurs expériences positives en ligne. Ils mettent en avant les capacités impressionnantes de ce LLM prétendument "le plus intelligent" actuellement disponible.

Avancement des Compétences en Programmation et Création de Produits

L'influenceuse en IA Allie K. Miller a souligné sur X que Claude 3.5 Sonnet a créé un jeu entièrement jouable basé uniquement sur une capture d'écran, et ce, en moins de trente secondes.

De plus, le compte X @TestingCatalog News a présenté le tout nouveau terrain de jeu "Artifacts", lancé en même temps que Claude 3.5 Sonnet, démontrant sa capacité à exécuter du code réel pour un formulaire web entièrement fonctionnel conçu par le chatbot. Le modèle a même recréé des images inspirées du film Hackers de 1995.

Pietro Schirano, fondateur de la startup de génération d'images IA EverArt, a fait remarquer sur X que la combinaison de Claude 3.5 Sonnet avec l'outil Maestro affichait des "étincelles d'AGI".

Soutien du Personnel d'Anthropic

Bien que des partisans du modèle affirment que le leader des relations développeurs chez Anthropic, Alex Albert, a tweeté sur la compétence croissante de Claude 3.5 Sonnet en programmation, suggérant qu'un pourcentage important de code pourrait être généré par des LLM dans un an.

De même, la technicienne d'Anthropic, Maggie Vo, a partagé sur X que Claude 3.5 Sonnet gère désormais "la moitié de mon travail… et je ne pourrais pas être plus heureux".

Pression sur OpenAI

Avec Claude 3.5 Sonnet surpassant le GPT-4 à un prix compétitif, OpenAI est sous pression croissante pour justifier les offres de son modèle. Ethan Mollick, professeur à la Wharton School of Business, a comparé la fonctionnalité Artifacts à une version simplifiée de l'Interpréteur de Code GPT-4 d'OpenAI.

L'utilisateur @kimmonismus a affirmé que OpenAI risque de "dormir sur l'AGI", l'objectif de développer une IA supérieure aux humains dans les tâches économiquement précieuses. Il a critiqué l'entreprise pour avoir annoncé des fonctionnalités supplémentaires de GPT-4 qui n'ont pas encore vu le jour, comme de nouveaux modes de voix.

Des Limitations Persistantes

Malgré l'enthousiasme autour de Claude 3.5 Sonnet, les critiques notent qu'il a encore des difficultés avec des tâches cognitives de base, comme jouer au morpion. Le journaliste technologique Timothy B. Lee, connu sous @binarybits sur X, a souligné que le modèle fait parfois des erreurs humoristiques, partageant une capture d'écran où il prétend à tort que trois quarts valent plus de 100 cents.

Dans l'ensemble, Claude 3.5 Sonnet représente un avancement significatif pour Anthropic et le paysage des LLM. Bien que certains problèmes demeurent, le modèle prouve que les avancées en technologie IA continuent d'accélérer, propulsées par les ressources informatiques actuelles.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles