OpenAI、ChatGPT Plusユーザー向けにGPT-4oボイスモードを導入し、自然なリアルタイム会話を向上

Home AIニュース OpenAI、ChatGPT Plusユーザー向けにGPT-4oボイスモードを導入し、自然なリアルタイム会話を向上

最近、OpenAIは重要なアップデートを発表しました。GPT-4oの音声モードの早期アクセス（アルファ）バージョンが選ばれたChatGPT Plusのサブスクライバー向けに利用可能となり、今秋にはさらに広く展開される予定です。この開発は、自然言語処理と音声インタラクション技術の統合において大きな前進を示しています。

GPT-4oは、OpenAIの最新の統合モデルであり、同じニューラルネットワークを通じてテキスト、画像、音声の入力を処理できます。この機能により、モデルの処理性能が向上するとともに、ユーザーにより自然で瞬時の会話体験を提供します。

OpenAIの最高技術責任者ミラ・ムラティは、GPT-4oはテキスト、視覚、音声のモダリティを統合する初の試みであると説明しています。モデルはまだ機能探索と制限評価の初期段階にありますが、チームはその可能性に楽観的であり、最適化に取り組んでいます。

当初6月末にテストが予定されていたGPT-4oの音声モードの試用は、モデルを精緻化するために延期されました。OpenAIは、不適切なコンテンツの検出と拒否の能力を強化して、安全でポジティブなユーザー体験を確保することを示しています。その結果、GPT-4oの音声モードは予定よりも早く登場し、より多くのユーザーに提供されることになりました。

GPT-3.5およびGPT-4と比較すると、GPT-4oは音声コミュニケーションで優れています。データによると、GPT-3.5の音声応答の平均遅延は2.8秒でしたが、GPT-4では5.4秒に延び、会話の流暢さに影響しました。しかし、技術的な最適化により、GPT-4oはこの遅延を大幅に短縮し、ほぼシームレスな会話体験を実現しました。さらに、迅速な応答と非常にリアルなトーンを持ち、悲しみや興奮などの感情を理解し模倣する能力を備えており、対話の生き生きとした表現を豊かにしています。

OpenAIは、GPT-4oの音声モードを宣伝する際、ユーザーのプライバシーとセキュリティへのコミットメントを強調しています。会社のスポークスマンであるリンゼイ・マッカラムは、ChatGPTがいかなる個人や公的な人物の声を模倣することは決してないと述べ、事前に設定された声と一致しないアウトプットは厳格に制限されることを保証しています。

GPT-4oの音声モードの導入により、OpenAIは人工知能技術の革新をリードし続け、よりスマートで便利、かつ安全な音声インタラクション体験を提供することを目指しています。

UAE、米国の中国とのAIパートナーシップへの干渉に強く反対

OpenAI、AI検索ツール「SearchGPT」を発表：失敗したデモが懸念と関心を呼ぶ

Most people like

TubeOnAI

25.5K

AI駆動の要約で動画視聴を効率化しよう。これらの革新的なツールが視聴体験を向上させ、重要な情報を素早く把握し、時間を節約できる方法を見つけてください。今すぐAI駆動の動画要約で効率を取り入れましょう！

動画消費 AI YouTube Assistant

MagickPen

35.4K

シームレスなテキスト生成のために設計された究極のAI駆動ライティングツールを発見してください。革新的なこのツールを使って、簡単かつ効率的にライティングプロセスを変革し、高品質なコンテンツを手軽に作成しましょう。先進のAI技術があなたの創造性と生産性を高め、ライティング作業をより迅速で楽しいものにします。

AI AI Content Generator

Illusion Diffusion AI Online

12.9K

テキストプロンプトを魅力的な視覚のイリュージョンに変えて、魅了し、インスパイアしましょう。言葉を美しいイメージに変換する技術を発見し、想像力を捉えましょう。

AI駆動のアート AI Art Generator

ChatBotKit

37.4K

ChatBotKitは、ユーザーエンゲージメントを向上させるために設計された直感的なチャットボットを作成・展開するための革新的なプラットフォームです。

チャット AI Chatbot

Find AI tools in YBX