OpenAI dévoile le modèle d'inférence o1 : dépassant GPT-4 avec des capacités comparables à celles d'un doctorat humain en physique et biologie.

Récemment, OpenAI a présenté son dernier modèle "Strawberry", connu sous le nom de "o1". Cette nouvelle série de modèles d'intelligence artificielle est conçue pour engager une réflexion plus profonde avant de répondre aux questions.

Comparé aux modèles précédents axés sur la science, la programmation et les mathématiques, le modèle o1 excelle dans les tâches de raisonnement complexe et le traitement de problèmes plus difficiles. Grâce à un entraînement amélioré, la série o1 affine ses processus de pensée, explore diverses stratégies et possède des capacités d'auto-correction.

Les évaluations d'OpenAI montrent que le modèle o1 atteint un niveau de doctorat lors des tests de performance en physique, chimie et biologie. En mathématiques et en programmation, o1 se distingue également : lors de l'épreuve de qualification de l'Olympiade Internationale de Mathématiques (IMO), le précédent modèle GPT-4o a obtenu seulement 13 % de réponses correctes, tandis que le modèle o1 a réalisé un taux de précision impressionnant de 83 %. De plus, o1 s'est classé dans le 89e percentile des compétitions Codeforces, mettant en avant son talent exceptionnel en programmation.

Bien que o1 ne dispose pas encore de certaines fonctionnalités pratiques de ChatGPT, comme la navigation sur le web et le téléchargement de fichiers, OpenAI souligne que o1 est particulièrement doué pour résoudre des problèmes scientifiques et mathématiques complexes. Les chercheurs médicaux peuvent utiliser o1 pour analyser des données de séquençage cellulaire, les physiciens peuvent générer des équations mathématiques complexes pour l'optique quantique, et les développeurs peuvent recourir à o1 pour créer des flux de travail en plusieurs étapes.

OpenAI a également lancé o1-mini, un modèle de raisonnement plus rapide et plus économique, idéal pour les applications de codage. O1-mini est proposé à un prix 80 % inférieur à celui de o1, ce qui en fait une option abordable pour les scénarios nécessitant un raisonnement sans connaissances approfondies du monde.

En matière de sécurité, OpenAI a introduit une nouvelle approche d'entraînement qui exploite les capacités de raisonnement du modèle o1 pour améliorer le respect des normes de sécurité et d'alignement. Lors des tests de jailbreak, o1-preview a obtenu un score de 84, contre 22 pour GPT-4o, démontrant des améliorations significatives en matière de sécurité.

Actuellement, les versions préliminaires de o1 et o1-mini sont disponibles dans ChatGPT (Plus et Team) et via l'API, avec des projets de rendre o1-mini accessible à tous les utilisateurs gratuits de ChatGPT à l'avenir.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles