OpenAIは最近、新しいAI大規模言語モデル(LLM)、GPT-4o(オムニ)を発表しました。初期の反応は賛否が分かれています。
短い26分間のデモを見た視聴者の一部は、さらなる情報を期待していますが、OpenAIはその後、複数のビデオデモと追加情報を公開しました。GPT-4oは、開発者にとってより迅速で手頃な価格で、特に音声機能を通じて人間の感情を検出し模倣する能力が大幅に向上しているとされています。
このモデルは、ChatGPTのユーザー全員が利用可能で、非サブスクライバーにも無料です。ただし、支払いを行っているサブスクライバーが最初にアクセスできるようになっており、今後数週間での展開が予定されています。現時点では、テキストと画像機能がサポートされていますが、音声および動画機能も近日中に追加される予定です。
GPT-4oは、テキスト、音声、視覚データを同等に扱うよう設計されており、すべての形式をトークンに変換します。この革新により、速度が向上し、コストが削減されることが期待されています。
専門家やインフルエンサーの反応は次の通りです。
- Nvidiaの上級研究マネージャーJim Fanは、「OpenAIはCharacter AIに対して優位に立ちつつある... これは感情に強いAIへのシフトであり、OpenAIは以前はこの点を抑えていたようだ」と述べました。
- ウォートンビジネススクールの教授Ethan Mollickは、「GPT-4oは大きな飛躍ではない。こちらがその飛躍だ」と指摘しました。
- AIインフルエンサーのAllie K. Millerは、GPT-4oを搭載した新しいmacOS ChatGPTアプリに対する熱意を示し、「これはまるで休まずに24/7画面共有をしている同僚のようだ。誰もがこれを使って何時間も働く場面を想像できます」と語りました。
- AI開発者Benjamin De Krakerは、GPT-4oが人工一般知能(AGI)への重要な進歩を示していると述べ、「バーチャルな『人間』がほぼ平均的な人間と同じように聞き、話し、見て、推論できるとは他に何と呼べるだろうか」と言いました。
- さらに、開発者Siqi Chenは、GPT-4oがテキストから3Dオブジェクトを生成する能力を強調し、「これは振り返るとオープンAIの歴史の中で最も過小評価されるイベントとなるだろう」と主張しました。
一方、ジャーナリストJames Vincentは市場戦略を批判し、「巧妙だが、音声インタラクションが能力の飛躍を意味するわけではない」と警鐘を鳴らしました。
Gartnerの副社長Chirag Dekateは、この発表を「やや期待外れ」とし、数ヶ月前のGoogleのGeminiデモと比較しました。彼は、OpenAIとGoogleやMicrosoftといった既存のテクノロジー大手の間に「能力ギャップ」が広がっていると指摘しました。
また、技術批判者の「Artisanal Holdout」は、GPT-5に対する期待に比べてGPT-4oの発売時期は物足りないと述べました。
それとは対照的に、Late CheckoutのCEO Greg Isenbergは「変化のペースは信じがたい」とし、AI教育者のMin Choiは「このリリースはAIアシスタントのゲームを完全に変えるだろう」と賞賛しました。
GPT-4oはまだ初期段階にあり、多くの機能が未導入ですが、すでに熱心な反応を引き起こしており、OpenAIは大きな関心を引き出しました。
今後数日中に新しいモデルをテストし、私たちの評価をお届けしますので、ぜひご期待ください。