OpenAIは、今週中にプラスおよびチームプランの加入者に向けて、会話型AIの「Advanced Voice」機能と新しい五つの音声の提供を開始するとTwitterで発表しました。エンタープライズおよび教育プランの加入者は、来週からアクセスできるようになります。
Advanced Voiceは、今後数日以内にChatGPTアプリの全プラスおよびチームプランユーザーに利用可能となります。この機能の登場を待つ間に、カスタム指示やメモリー機能、五つの新しい音声、そして改善されたアクセントが加わり、体験が向上しました。AIは今や、50以上の言語で「遅れてすみません」と言えるようになりました。
Advanced Voiceは、GPT-4oモデルの強力な機能に基づいており、ユーザーがチャットボットと自然な会話をするかのように口頭でやり取りできるようになります。この機能はOpenAIの春のアップデートイベントで初めてお披露目され、今年7月には特定のChatGPT Plus加入者向けにベータテストとしてリリースされました。今では、全ての有料加入者がこの機能を体験できます。
新たに追加される音声は、Arbor、Maple、Sol、Spruce、Valeの五つです。これらの音声は、既存のBreeze、Juniper、Cove、Emberと共に、スタンダードおよびアドバンスドボイスモードで利用可能です。なお、現在Advanced Voiceではビデオや画面共有機能はサポートされていませんが、今後提供される予定です。
さらに、OpenAIはAdvanced Voiceの機能を全体のチャットボット体験に合わせるために、メモリー機能とカスタム指示の2つの新しいツールを統合しています。以前は、Advanced Voiceは進行中のチャットのみを参照できましたが、新しいメモリー機能により、AIは過去の会話の詳細を記憶し、必要に応じて情報を再度説明する手間を減らします。カスタム指示を使うことで、ユーザーはAIの応答に関するパラメーターを設定できます。たとえば、コード関連の応答をPythonで受け取りたいと指定することができます。
プラスおよびチームプランの加入者は、機能がアカウントにアクティブ化されると、アプリ内通知を受け取ります。ただし、Advanced Voiceは現在EU、英国、スイス、アイスランド、ノルウェー、リヒテンシュタインでは利用できません。ChatGPTは、ユーザーと直接会話を行う機能を持つ唯一の存在ではありません。この発表は、Googleがすべてのユーザー、無料プラン加入者を含む、Gemini Live機能を発表してから約2週間後に行われました。