OpenAI推出ChatGPT Plus用户的GPT-4o语音模式，提升自然实时对话体验

Home AI News CN OpenAI推出ChatGPT Plus用户的GPT-4o语音模式，提升自然实时对话体验

最近，OpenAI 宣布了一项重要更新：GPT-4o 语音模式的早期访问（Alpha）版现已向部分 ChatGPT Plus 订阅用户开放，计划在今年秋季进行更广泛的推广。这标志着自然语言处理与语音交互技术集成的重要进展。

GPT-4o 是 OpenAI 最新的统一模型，能够通过同一神经网络处理文本、视觉和音频输入，从而实现无缝连接。这一能力不仅提升了模型的整体处理性能，还为用户提供了更自然、即时的对话体验。

OpenAI 首席技术官 Mira Murati 表示，GPT-4o 是公司首次全面尝试融合文本、视觉和音频模式。尽管该模型仍在功能探索和限制评估的早期阶段，但团队对其潜力充满信心，并积极进行优化。

原定于六月底进行测试的 GPT-4o 语音模式试用经过延迟，以进一步完善模型。OpenAI 表示，他们正在增强模型识别和拒绝不适当内容的能力，以确保用户体验的安全和积极。得益于这些努力，GPT-4o 语音模式提前推出，标志着其将向更广泛的用户开放。

与 GPT-3.5 和 GPT-4 相比，GPT-4o 在语音交流方面表现更加出色。数据显示，GPT-3.5 的平均语音响应延迟为 2.8 秒，而 GPT-4 增加到了 5.4 秒，影响了对话的流畅性。然而，通过技术优化，GPT-4o 显著减少了这一延迟，达成了几乎无缝的对话体验。它还具备快速响应和高度真实的语调，能够识别并模拟情感，如悲伤和兴奋，丰富了对话的生动性。

在推广 GPT-4o 语音模式的同时，OpenAI 强调其对用户隐私和安全的承诺。公司发言人 Lindsay McCallum 表示，ChatGPT 永远不会模仿任何个人或公众人物的声音，并且严格限制与预设声音不符的输出，以保护用户的权利和隐私。

通过推出 GPT-4o 语音模式，OpenAI 旨在继续引领人工智能技术创新，提供更智能、更便捷和更安全的语音交互体验。

阿联酋坚定反对美国干涉与中国的人工智能合作关系

OpenAI推出AI搜索工具SearchGPT：演示失败引发关注与讨论

Most people like

ModernMT

28.6K

像人类一样学习和适应的机器翻译技术正在迅速发展。通过深度学习和人工智能，这些系统能够理解和生成自然语言，从而实现更流畅、准确的翻译。随着技术的进步，机器翻译不仅能满足基本沟通需求，还能处理复杂的语境和文化差异，为全球交流铺平道路。

机器翻译翻译

Neurons

71.1K

通过利用神经科学技术，我们可以更精准地预测消费者的反应。结合脑科学与市场研究，这些解决方案能够深入分析顾客的情感和决策过程，从而帮助企业优化产品与营销策略，提高市场竞争力。

消费者神经科学 AI广告助手

ColorifyAI

5.7K

AI彩色页面生成器：提升创意设计的全新工具在当今设计领域，AI彩色页面生成器正迅速崛起，成为创作和视觉呈现的重要帮手。无论是插图、海报还是网页设计，这一创新工具能够自动生成丰富多彩的设计页面，极大地节省了时间并提升了效果。让我们一起探索这个强大的工具，如何帮助设计师提高工作效率，激发无限创意，为您的项目增添活力。

色彩化AI AI 相片和图像生成器

Findr

19K

您公司的专属ChatGPT，基于您的业务数据为您量身定制。

人工智能生产力研究工具

Find AI tools in YBX