OpenAI 推迟新 ChatGPT 语音模式发布超过一个月

OpenAI于2024年5月举行的春季更新活动上,亮相了GPT-4o以及备受期待的ChatGPT语音模式。该新功能旨在提供更自然、对话式的人工智能互动,包括情感语调和处理打断的能力。然而,语音模式的发布延迟了至少一个月,预计最早将在七月底或八月初上线。最初,它将仅向一小部分用户开放。

OpenAI通过其X账号宣布了这一延迟,说明需要更多时间来完善语音模式,以增强其检测和拒绝不当内容的能力。公司在声明中提到:“我们原计划在六月底为部分ChatGPT Plus用户推出语音模式的初始版本,但为了满足质量标准,我们需要再花一个月时间。我们正在提升内容检测能力,改善用户体验,并确保基础设施能够有效扩展,以便实时响应。我们的逐步部署策略包含从初始用户群体收集反馈,再在秋季向所有Plus用户扩大开放,前提是满足安全性和可靠性基准。”

语音模式承诺让AI更好地理解和回应情感及非语言暗示,从而提升对话体验。OpenAI致力于谨慎引入这些创新。

这一延迟给OpenAI带来挑战,因为它在与竞争对手如Anthropic竞争。后者最近推出的Claude 3.5基础模型在多个第三方评估中被认为超越了GPT-4o。同时,OpenAI也面临着对其安全措施的审查,特别是在追求人工通用智能(AGI)过程中,内部对此类限制协议和股权限制的批评不断增多——其中许多协议已被修订。

外界的批评依然存在,著名演员斯嘉丽·约翰逊对此表达了不满,指责人工智能声音“Sky”未经她同意而模仿她的声音。OpenAI回应称,提供Sky声音的配音演员并非与约翰逊同一人,但公司已禁用该人工智能声音。

尽管面临这些挑战,OpenAI依然吸引着新用户和合作伙伴,包括在创意行业与尚未发布的视频人工智能模型Sora的合作,及将GPT-4o整合到医疗应用中,例如Color的癌症筛查工具,同时也获得了众多企业客户的支持。

Most people like

Find AI tools in YBX