Lundi, Anthropic a annoncé le lancement de Claude 3, une nouvelle série composée de trois modèles de langage IA conçus pour faire progresser la technologie de l'intelligence artificielle. L'entreprise affirme que ces modèles établissent de nouvelles normes industrielles dans divers domaines cognitifs et affichent des compétences proches de celles des humains. Les utilisateurs peuvent accéder à ces modèles via le site officiel d'Anthropic, avec la version la plus avancée accessible uniquement par abonnement.
La série Claude 3 comprend trois modèles avec des niveaux de complexité et de paramètres variés : Claude 3 Haiku, Claude 3 Sonnet et Claude 3 Opus. Le modèle Sonnet est actuellement disponible gratuitement, tandis que l'accès à Opus nécessite un abonnement mensuel de 20 $ pour le plan "Claude Pro". Tous les trois disposent d'une fenêtre contextuelle de 200 000 jetons.
Comparé aux itérations précédentes, Claude 3 présente des améliorations notables dans des tâches telles que le raisonnement, l'expertise, les mathématiques et la fluidité linguistique. L'entreprise rapporte qu'Opus affiche une compréhension au niveau humain dans des tâches complexes. Les nouveaux modèles disposent également de capacités de traitement visuel améliorées, leur permettant de gérer divers formats, y compris des photos et des graphiques, semblable à GPT-4V et Gemini de Google.
En termes de performance et de rapport qualité-prix, la série Claude 3 a été optimisée. Opus prélève 15 $ par million de jetons d'entrée, tandis que Sonnet et Haiku sont nettement moins chers, à 3 $ et 0,25 $ respectivement, les rendant plus accessibles que GPT-4 Turbo et GPT-3.5 Turbo d'OpenAI.
Anthropic s'engage à mettre à jour fréquemment la série Claude 3 dans les mois à venir, avec des plans pour introduire de nouvelles fonctionnalités telles que des intégrations d'outils et de la programmation interactive. De plus, des améliorations des mesures de sécurité ont été mises en œuvre, réduisant considérablement les risques potentiels.
Les tests initiaux indiquent qu'Opus démontre des capacités similaires à ChatGPT-4, notamment dans la synthèse d'informations et l'analyse logique. Cependant, la création de contenus humoristiques originaux reste un défi. Les évaluations normalisées pourraient ne pas capturer pleinement la performance des modèles, car les besoins et contextes spécifiques des utilisateurs peuvent influencer efficacement les assistants IA.
En fin de compte, les utilisateurs devraient réaliser des tests personnels pour choisir le modèle qui correspond le mieux à leurs besoins, car différents environnements et tâches peuvent donner lieu à des résultats très variés. Globalement, bien que Claude 3 d'Anthropic montre un fort potentiel, une évaluation minutieuse reste indispensable.