今日は待ちに待った日です!
OpenAIの共同創設者でCEOのSam Altmanは、著名なChatGPTとその基盤となるGPT-4大規模言語モデル(LLM)の重要なアップデートを発表しました。
日時と場所
春のアップデートイベントは、2024年5月13日月曜日の午前10時(太平洋時間)/午後1時(東部時間)に開始され、OpenAIのYouTubeチャンネルでライブ配信されます。すでに5,000人以上の視聴者がこのイベントを楽しみにしています。YouTubeストリームは午前9時PT/午後12時ETから始まりますので、お見逃しなく。
OpenAIの春のアップデートで期待されること
最近の憶測では、Googleに匹敵する検索エンジンの可能性が浮上していますが、アルトマン氏はX(旧Twitter)で、GPT-5や検索エンジンに関する発表はないと明言しました。その代わりに、彼は「私たちは人々が大好きになる新しいプロジェクトに取り組んでおり、本当に魔法のような感じです」と新たな開発についてほのめかしました。OpenAIの社長、グレッグ・ブロックマンも同様の見解を示し、「新しい作品のライブデモ」を約束しています。
新機能に関する憶測
OpenAIの従業員がXでの活動を活発に行っていることから、2006年のSF映画『Her』のキャラクター、サマンサのような音声アシスタントが導入される可能性があります。アルトマン氏は、スパンサー・シフの彼が『Her』を再鑑賞しているという投稿に「いいね」を押しました。
さらに、複数のOpenAI研究者が自らのプレゼンテーションに対する期待を表明しており、特別な何かが発表されるかもしれません。その中にはアイダン・クラーク、モ・ババリアン、スティーブン・ハイデルなどがいます。
アルトマン氏はRedditでも公衆と対話し、OpenAIの「モデルスペック」について議論しました。このスペックはAI製品に求められる行動を明示しています。あるユーザーがChatGPT-4やDALL-Eへの無料アクセスの可能性を尋ねた際、アルトマン氏は可能性を示唆しました。
さらに、ユーザー@ananayaroraはOpenAIのソースコードにwebRTCサーバーがあることに気づき、ChatGPTに電話機能が追加される可能性を示唆しました。また、Xユーザー@testingcatalogは、ChatGPTのiOSアプリの最新更新が会話インターフェースの強化を示していると報告しました。
既存の音声機能
2023年12月以降、OpenAIのChatGPTはiOSとAndroidで音声インターフェースを提供しており、ユーザーと音声で対話できるようになっています。2024年3月に導入された「音声読み上げ」機能では、AI生成の声を使用してChatGPTが応答を音声で読み上げます。
OpenAIは、15秒の録音を使って話者の声を複製する音声クローン技術も披露していますが、この技術はまだ一般には公開されておらず、責任ある利用に対するOpenAIのコミットメントを示しています。
新しい音声会話アシスタントの導入が期待されており、より自然な対話が可能になるでしょう。
今後の展開
さらに、ユーザー@alwaysaq00は、GPT-4 Omni(またはGPT-4o)という新しいモデルへの言及を発見し、その意味に関心が高まっています。
OpenAIが今日発表する内容は、AIとテクノロジーのコミュニティでの興奮と議論を巻き起こすことが期待されます。GPT-5がなくても、高い期待に応えることができるのでしょうか?