OpenAI 推迟新 ChatGPT 语音模式发布超过一个月

Home AI News CN OpenAI 推迟新 ChatGPT 语音模式发布超过一个月

OpenAI于2024年5月举行的春季更新活动上，亮相了GPT-4o以及备受期待的ChatGPT语音模式。该新功能旨在提供更自然、对话式的人工智能互动，包括情感语调和处理打断的能力。然而，语音模式的发布延迟了至少一个月，预计最早将在七月底或八月初上线。最初，它将仅向一小部分用户开放。

OpenAI通过其X账号宣布了这一延迟，说明需要更多时间来完善语音模式，以增强其检测和拒绝不当内容的能力。公司在声明中提到：“我们原计划在六月底为部分ChatGPT Plus用户推出语音模式的初始版本，但为了满足质量标准，我们需要再花一个月时间。我们正在提升内容检测能力，改善用户体验，并确保基础设施能够有效扩展，以便实时响应。我们的逐步部署策略包含从初始用户群体收集反馈，再在秋季向所有Plus用户扩大开放，前提是满足安全性和可靠性基准。”

语音模式承诺让AI更好地理解和回应情感及非语言暗示，从而提升对话体验。OpenAI致力于谨慎引入这些创新。

这一延迟给OpenAI带来挑战，因为它在与竞争对手如Anthropic竞争。后者最近推出的Claude 3.5基础模型在多个第三方评估中被认为超越了GPT-4o。同时，OpenAI也面临着对其安全措施的审查，特别是在追求人工通用智能（AGI）过程中，内部对此类限制协议和股权限制的批评不断增多——其中许多协议已被修订。

外界的批评依然存在，著名演员斯嘉丽·约翰逊对此表达了不满，指责人工智能声音“Sky”未经她同意而模仿她的声音。OpenAI回应称，提供Sky声音的配音演员并非与约翰逊同一人，但公司已禁用该人工智能声音。

尽管面临这些挑战，OpenAI依然吸引着新用户和合作伙伴，包括在创意行业与尚未发布的视频人工智能模型Sora的合作，及将GPT-4o整合到医疗应用中，例如Color的癌症筛查工具，同时也获得了众多企业客户的支持。

Udio：AI音乐初创公司回应大型唱片公司诉讼，坚称“我们的模型不复制受版权保护的音乐”

玩具反斗城首个采用OpenAI Sora技术制作的广告发布