数ヶ月の憶測と期待を経て、OpenAIはその先進的な推論モデルの製品版「o1」を正式にリリースしました。また、より迅速で応答性の高いインタラクションを提供する「o1-mini」も発表され、こちらは小規模な知識ベースを活用しています。
o1モデルには多くの技術的改善が施されています。これはOpenAIの推論モデルの中で初めて、人間のような推論を模倣するように設計されており、科学、コーディング、数学などの多様なテーマに関する複雑な質問に迅速に取り組むことが可能です。
例えば、テストではo1が国際数学オリンピック予選試験問題に挑戦しました。GPT-4oが正答率13%だったのに対し、o1は83%という素晴らしい精度を達成しました。さらに、オンラインのCodeforcesコンペティションでは、o1は89パーセンタイルにランクインしました。以前のモデルが解決できなかった問題、たとえば「9.11」と「9.9」のどちらが大きいかといった質問にも答えることができます。ただし、OpenAIはこのリリースがモデルの完全な可能性のほんの一端に過ぎないことを明らかにしています。
新しいo1は「特別に設計されたユニークな最適化アルゴリズムと革新的なトレーニングデータセットを使用して開発されました」とOpenAIの研究リードであるジェリー・トゥウォレクは説明しています。強化学習と「思考の連鎖」を組み合わせることで、o1は前モデルよりもより正確な推論を生成することができるとされています。トゥウォレクは「このモデルは幻覚が少ないことが分かりました」と述べましたが、「完全に幻覚を排除したとは言えません」と警告しました。
今日から、ChatGPT-PlusおよびTeamsのサブスクライバーはo1およびo1-miniにアクセスできます。EnterpriseおよびEduのサブスクライバーは来週中に利用できるようになる予定です。OpenAIは、o1-miniが最終的に無料プランのユーザーにも提供されることを期待していますが、具体的なタイムラインは決まっていません。開発者は、o1のAPI料金がGPT-4oに比べて大幅に増加していることに注意が必要です。o1の利用料金は、1百万入力トークンあたり15ドル(GPT-4oは5ドル)、出力トークンは1百万あたり60ドルで、これは4oの5ドルの4倍の料金です。興味深い質問として、新しいモデルは「ストロベリー」という単語にいくつの「R」が含まれていると考えているのでしょうか?