Malgré des mois de spéculations autour de son développement, le lancement du Projet Strawberry par OpenAI la semaine dernière a surpris de nombreux analystes, qui s'attendaient à ce que le modèle ne soit pas prêt avant plusieurs semaines, voire plus tard cet automne.
Le nouveau modèle o1-preview, ainsi que sa variante o1-mini, est désormais accessible pour utilisation et évaluation. Voici comment vous pouvez y accéder.
OpenAI a présenté un aperçu d’o1, une série révolutionnaire de modèles d'IA conçus pour améliorer leurs capacités de raisonnement avant de générer des réponses. Ces modèles excellent dans la gestion de tâches complexes et la résolution de défis avancés dans des domaines comme la science, le codage et les mathématiques.
Qu'est-ce que l'o1 ?
Les ambitions d'OpenAI pour l'intelligence générale artificielle (AGI) sont bien connues, et le Projet Strawberry (maintenant rebaptisé « o1 ») représente un pas significatif vers cette vision. En tant que premier modèle d'une nouvelle ligne axée sur le raisonnement, il est conçu pour « passer plus de temps à réfléchir avant de répondre », selon une annonce officielle. Cette méthodologie permet au modèle de raisonner efficacement sur des tâches complexes et de s'attaquer à des problèmes plus difficiles que les versions précédentes dans des domaines tels que la science, le codage et les mathématiques. Les modèles sont élaborés pour imiter le raisonnement humain, leur permettant de perfectionner leurs processus de pensée, d'expérimenter différentes stratégies et d'apprendre de leurs erreurs tout au long de l'entraînement. OpenAI affirme que l'o1-preview peut performer de manière comparable à des étudiants en doctorat dans des matières comme la physique, la chimie et la biologie, obtenant des résultats favorables dans des évaluations comparatives dans ces disciplines. En plus de ses compétences scientifiques, l'o1 excelle dans les défis de codage et mathématiques, atteignant 83 % lors d'un examen de qualification aux Olympiades Internationales de Mathématiques (IMO) — où GPT-4o n’a obtenu que 13 % — et se plaçant dans le 89e percentile lors d'une compétition Codeforces contre des participants humains.
Qu'en est-il de l'o1-mini ?
L'o1-mini est une version allégée du modèle standard o1-preview, fonctionnant à des coûts 80 % inférieurs à ceux de son homologue plus grand. Cela le rend particulièrement efficace pour l'analyse et la génération de code.
L'o1-preview est-il disponible pour des tests ?
Oui, les modèles o1-preview ont été lancés le 12 septembre, exclusivement pour les abonnés de ChatGPT Plus et Teams. Les utilisateurs d'Enterprise et d'Education accéderont à ce modèle à partir de la semaine suivante.
Quelle est la sécurité de l'o1 contre les abus ?
D'après les rapports, l'o1 a été développé avec des mesures de sécurité renforcées. OpenAI a établi un nouveau programme de formation à la sécurité qui utilise les compétences de raisonnement avancé du modèle pour garantir un respect accru des protocoles de sécurité et d'alignement. Notamment, lors des tests, alors que GPT-4o n’a obtenu que 22 points (sur 100) dans sa résistance aux tentatives de jailbreak, le nouveau modèle o1 a réalisé un impressionnant score de 84.
Comment puis-je accéder à l'o1-preview ?
Actuellement, l'o1-preview fraîchement lancé est disponible exclusivement pour les abonnés payants. Pour l'essayer, vous devrez souscrire à un abonnement Plus à 20 $/mois. Cliquez sur le bouton d'option « Upgrade Plan » dans le panneau de navigation de gauche et suivez les instructions à l'écran pour entrer vos informations de paiement. Une fois votre abonnement activé, vous pourrez sélectionner soit l'o1-preview, soit l'o1-mini dans le sélecteur de modèle à gauche de la page d'accueil de ChatGPT. À noter que l'accès est limité même pour les abonnés, avec un plafond hebdomadaire de 30 messages pour l'o1-preview et 50 messages pour l'o1-mini. OpenAI a indiqué que l'o1-mini sera éventuellement disponible pour les utilisateurs de la version gratuite, mais aucune date précise pour ce lancement n'a encore été établie.