GPT-5を忘れろ!OpenAIが新しいAIモデル「o1」を発表、博士レベルの性能を誇る

2023年3月にOpenAIが強力なGPT-4大規模言語モデルを発表して以来、ユーザーや開発者はその後継モデルであるGPT-5のリリースを心待ちにしていました。しかし、OpenAIは新たなアプローチを採用し、「o1Siriーズ」という新しいモデル群を発表しました。

o1モデルファミリーの紹介

OpenAIは、複雑なタスクを解決するために特別に設計された最新のAIモデル、o1-previewとo1-miniを発表しました。これらのモデルは、従来のGPTSiriーズよりも高い効果を発揮します。

現在、ChatGPT Plusユーザー向けにo1-previewが利用可能で、週に30メッセージまで制限されています。一方、o1-miniは50メッセージまで可能です。これらは初期モデルであり、GPT-4が提供するウェブ閲覧やファイルアップロードといった機能はまだ開発中です。

o1モデルの優れた性能

OpenAIはo1Siriーズが科学、医療、技術などの分野において、複雑な問題を処理する能力に優れていると主張しています。これらのモデルは物理学者が複雑な方程式を構築するのを支援したり、医療研究者が細胞シーケンシングデータを効果的に注釈付けるために設計されています。

o1-miniモデルは特に開発者向けの強力な機能を提供し、複数のステップを要するワークフローの実行、コードのデバッグ、プログラミング課題の解決にも適しています。

o1-preview:博士課程レベルのパフォーマンス

o1-previewモデルは、思慮深い応答を促すために多くの時間を割いており、人間の問題解決アプローチを模倣しています。テスト結果では、このモデルは物理学、化学、生物学において博士課程の学生と同等のパフォーマンスを示しています。コーディングにおいては、Codeforces競技で89パーセンタイルにランクインし、デバッグおよびソリューション生成における高い熟練度を示しています。また、国際数学オリンピックの予選試験では83%の問題を解決し、GPT-4の13%の成功率を大きく上回りました。

このモデルは現時点でChatGPT PlusおよびTeamユーザーが利用可能で、来週にはEnterpriseおよびEduユーザーもアクセスできます。APIティア5に該当する開発者もo1モデルを活用できますが、初期の利用制限があります。

o1-mini:手頃で効率的

OpenAIはo1-previewと同時にo1-miniモデルも発表しました。これは、より迅速で経済的な推論能力を提供する簡素化されたバージョンです。コーディングとSTEM分野に特化している一方、o1-miniはIMO数学ベンチマークで70%という素晴らしいスコアを叩き出し、o1-previewの74%に僅差で迫りますが、コストは大幅に低く抑えられています。コーディング評価ではCodeforcesでEloスコア1650を達成し、プログラマーの上位86%に位置しています。

o1-miniの価格はo1-previewの80%削減されており、より高度なモデルの知識がなくても推論能力を求める開発者や研究者向けに最適です。今後、ChatGPT Plus、Team、Enterprise、Eduユーザーが利用できるようになり、将来的にはChatGPT Freeユーザーの追加も計画しています。

安全性とセキュリティの向上

OpenAIは両モデルにおいて、安全性に対する取り組みを明確に示しています。o1-previewモデルは、システムにおける脱獄テストで84点を記録し、GPT-4の22点から大きく改善されました。これらのモデルは安全性プロトコルに関する推論能力が向上しており、不適切なコンテンツ生成のリスクを軽減する能力を備えています。

OpenAIはまた、米国および英国のAI安全研究所との提携を結び、今後のAIシステムの評価とテストを進めています。

o1Siriーズの未来の展望

o1-previewとo1-miniは強力な問題解決ツールですが、OpenAIはこれを始まりにすぎないと捉えています。今後、ウェブ閲覧、ファイルアップロード、関数呼出しなどの機能を追加し、定期的にこれらのモデルを改善する計画です。

OpenAIはGPTおよびo1Siriーズの両方を引き続き開発し、ユーザーはさまざまなアプリケーションでAIの能力とアクセス性が向上する進展を期待できます。

Most people like

Find AI tools in YBX