2024年5月に開催されたOpenAIの春のアップデートイベントでは、GPT-4oの紹介とChatGPTの期待される新機能「ボイスモード」が発表されました。この新機能は、AIとの自然な会話を実現し、感情のニュアンスや中断への対応を可能にすることを目的としています。しかし、ボイスモードの導入は少なくとも1ヶ月遅れ、最も早くても7月下旬か8月初旬になる見込みです。また、初めは限られたユーザーのみが利用できます。
OpenAIはXアカウントを通じてこの遅延を発表し、ボイスモードの改良にさらに時間が必要であることを示しました。同社は、モデルの不適切なコンテンツを検出し拒否する能力の向上についても強調しています。声明では次のように述べられました。「当初、ボイスモードを6月下旬にChatGPT Plusの選ばれたユーザーに向けてアルファ版で導入する予定でしたが、品質基準を満たすためにもう1ヶ月必要です。コンテンツ検出機能の強化、ユーザー体験の向上、リアルタイムでの応答を効果的に提供できるインフラの整備を進めています。また、初期ユーザーグループからフィードバックを集め、その後秋には全プラスユーザーへのアクセスを拡大する予定ですが、安全性と信頼性の基準を満たすことが前提です。」
ボイスモードは、AIが感情や非言語的な合図を理解し応答する能力を持つことで、会話体験を向上させることを約束しています。OpenAIは、これらの進展を慎重に導入していくことに尽力しています。
この遅延は、OpenAIが競争相手のAnthropicと競り合う中での課題となっています。Anthropicは最近、Claude 3.5 Sonnetの基盤モデルを発表し、いくつかのサードパーティの評価ではGPT-4oを上回る結果を出しています。また、OpenAIは、人工汎用知能(AGI)の実現を目指す中で、セーフティ策に対する厳しい目が向けられており、内内部からは制限的な秘密保持契約やエクイティ制限に関する批判が寄せられていますが、これらの多くは改訂されています。
外部からの批判も続いており、特に女優スカーレット・ヨハンソンが、自身の同意なしに自分に似たAI音声「スカイ」に抗議しました。OpenAIは、スカイの声優がヨハンソンとは別にアプローチされたことを明らかにしましたが、その後、このAI音声は無効化されています。
これらの課題にもかかわらず、OpenAIは新たなユーザーやパートナーシップを引き続き魅了しており、クリエイティブ分野での未発表のビデオAIモデル「ソラ」とのコラボレーションや、Colorのがんスクリーニングツールといった医療アプリケーションにGPT-4oを統合させるなど、多くの企業クライアントを確保しています。