Après des mois de spéculations et d'excitation, OpenAI a officiellement lancé la version de production de son modèle de raisonnement avancé, désormais appelé « o1 ». Une version « mini », similaire à GPT-4o, a également été introduite, promettant des interactions plus rapides et réactives tout en utilisant une base de connaissances plus réduite.
Le modèle o1 présente une gamme d'améliorations techniques. Il s'agit du premier modèle de raisonnement d'OpenAI conçu pour imiter le raisonnement humain, lui permettant de répondre plus rapidement que les humains à des questions complexes dans divers domaines, tels que les sciences, le codage et les mathématiques.
Lors de tests, o1 a été soumis à un examen de qualification pour les Olympiades Internationales de Mathématiques. Tandis que GPT-4o n'a obtenu qu'un taux de réussite de 13 %, o1 s'est distingué avec une impressionnante précision de 83 %. Dans une compétition en ligne Codeforces, o1 s'est classé au 89e percentile. Il est également capable de résoudre des questions qui avaient posé problème aux modèles précédents, comme déterminer quel nombre est le plus grand entre 9,11 et 9,9. Cependant, OpenAI précise que ce lancement n'est qu'un aperçu du potentiel complet du modèle.
Le nouveau o1 « a été développé à l'aide d'un algorithme d'optimisation unique et d'un ensemble de données d'entraînement innovant conçu spécialement pour ce modèle », a expliqué Jerry Tworek, responsable de la recherche chez OpenAI. En combinant l'apprentissage par renforcement et le raisonnement en « chaîne de pensée », o1 produit des inférences plus précises que son prédécesseur. « Nous avons observé que ce modèle présente moins d'hallucinations », a noté Tworek, tout en avertissant : « nous ne pouvons pas affirmer avoir complètement éliminé les hallucinations. »
À partir d'aujourd'hui, les abonnés de ChatGPT-Plus et Teams peuvent explorer o1 et o1-mini. Les abonnés Enterprise et Edu devraient avoir accès d'ici la semaine prochaine. OpenAI prévoit que o1-mini sera éventuellement accessible aux utilisateurs du niveau gratuit, mais aucun calendrier précis n’a été donné. Les développeurs doivent prendre en compte que les tarifs API pour o1 ont considérablement augmenté par rapport à GPT-4o. L'accès à o1 coûtera 15 $ par million de tokens d'entrée (contre 5 $ pour GPT-4o) et 60 $ par million de tokens de sortie, ce qui représente quatre fois le coût des 5 $ de 4o par million. Une question curieuse subsiste : combien de R le nouveau modèle pense-t-il qu'il y a dans le mot « fraise » ?