OpenAIは、昨日、テクノロジー業界を驚かせる新しいファミリーの大規模言語モデル(LLM)「o1」を発表しました。これは、予想されていた「ストロベリー」やGPT-5とは異なるもので、科学、技術、工学、数学(STEM)のタスクに特化した高性能と正確性を兼ね備えています。
新たにリリースされたモデルは、o1-previewと低パラメータのo1-miniの2種類です。これらはChatGPT PlusのユーザーやOpenAIの有料APIを利用する開発者にアクセス可能で、既存のアプリケーションに統合することや新しいアプリケーションを作成することができます。
高度な推論能力
OpenAIのAPIテックリード、ミシェル・ポクラスによれば、o1モデルは高度な推論技術を採用しています。これにより、戦略を適応し、失敗から学び、徹底的な認知プロセスを経てパフォーマンスを向上させることが可能です。テストでは、これらのモデルが難解なベンチマークに対して博士課程の学生と同等のパフォーマンスを発揮しているとの報告があります。OpenAIのニクン・ハンダ氏も、o1モデルがGPTSiriーズに比べて推論能力で顕著に優れていると強調しています。
開発者向け重要情報
- テキストのみの出力: 現在、両モデルはテキスト入力と出力に限定されているため、画像やファイルの分析などのマルチモーダルタスクには向いていません。これらのタスクにはGPT-4oが推奨されています。
- 知識のカットオフ: o1モデルはウェブを閲覧できないため、2023年10月までのトレーニングデータに依存していますが、ユーザーは追加の文脈をテキストで提供することができます。
- 応答速度: 出力生成は遅く、時には応答に1分以上かかることもありますが、初期のテスターからはコーディングや法的文書の作成などにおいてパフォーマンスが向上したとの報告があります。
OpenAIは、GPT-4oが迅速な応答が求められるタスクに最適である一方、o1モデルは深い推論が求められるアプリケーションでの利用が推奨されることを述べています。
価格体系
o1モデルを利用するには、OpenAIのAPIへの大規模な投資が必要です。「Tier 5」に分類されるユーザーは、少なくとも$1,000を費やし、30日前に支払いを行っている必要があります。o1-previewモデルは特に高価で、入力トークン1百万あたり$15、出力トークン1百万あたり$60がかかり、o1-miniは比較的手頃な価格で、入力トークン1百万あたり$3、出力トークン1百万あたり$12です。
現在、o1モデルは1分間に20リクエストに制限されており、リクエストのバッチ処理はサポートされていません。
o1モデルの応用
o1-previewおよびo1-miniのリリース以降、開発者はその用途を探求し始めています。初期の成果には以下のようなものがあります:
- ドキュメント生成: モデルは単純なプロンプトから、充実したアクションプランやホワイトペーパーを生成できます。
- 業務最適化: o1-previewはスタッフのスケジュール自動化、合併リスクの評価、効率的な倉庫設計、電力網のバランス調整を実現しています。
- アプリおよびゲーム開発: o1-previewモデルはインタラクティブなアプリやゲームの迅速な作成をサポートします。
- RFP自動化: o1モデルは、契約者が提案依頼書のテキスト入力を処理する際に役立てることができます。
- 戦略的計画: 開発者は、o1-previewがRedditなどのプラットフォームを活用した詳細な成長戦略の生成に効果的であることを指摘しています。
OpenAIのo1モデルへのアクセス
開発者はOpenAIの公開API、Microsoft Azure OpenAI Service、Azure AI Studio、GitHub Modelsを通じてo1モデルにアクセスできます。すべての開発者に適しているわけではありませんが、o1ファミリーの導入はAIアプリケーションにおける革新を目指す人々に独自の機会を提供します。OpenAIはo1ファミリーと既存のGPTSiriーズの両方を強化することに注力しており、開発者に多様な選択肢を提供しています。