先进语音模式是ChatGPT的一项创新功能,允许用户与AI聊天机器人进行实时对话,无需文本提示或冗长的音频交流。该功能于7月下旬首次面向部分Plus订阅用户推出,并在OpenAI春季更新活动中首次展示。
OpenAI将先进语音模式描述为实现“更自然、实时的对话”,并支持用户进行无缝的打断。此外,它还可以感知用户的情感,甚至在聊天过程中模拟人类的呼吸和笑声。如果您尚未获得访问权限,请不要担心——该功能将很快向更多用户开放。
近期,OpenAI正式向部分ChatGPT Plus订阅用户推出这一备受期待的先进语音功能。目前的首批用户规模尚不明确,但公司承诺在未来几周内扩大访问范围,预计到今年秋季将全面开放给所有Plus订阅用户。尽管许多用户渴望尝试,您可以预计在冬季之前会获得访问权限,除非出现进一步延迟。您将通过电子邮件邀请或ChatGPT应用中的通知得知自己已获得访问权限。
要使用先进语音模式,用户需要拥有Plus订阅,并使用运行版本为1.2024.206或更高版本的Android设备,或运行iOS 16.4或更高版本的iPhone及相应的应用版本。需要注意的是,拥有正确设备并不保证能参与测试阶段。OpenAI尚未公布选择用户的标准,但被选中的用户将收到电子邮件通知和ChatGPT移动应用中的提示,以访问这一新模式。
在alpha测试阶段,OpenAI将收集使用先进语音模式的对话音频,以改进其模型,前提是用户未选择退出数据共享。要禁用此选项,请前往应用设置中的数据控制选项卡,并取消选中“改善所有人的语音”。
OpenAI表示,先进语音的输入和输出都有每日使用限制,尽管具体时长尚未披露,这些限制可能会随时间变化。然而,用户如Himels Tech已展示出近10分钟的对话。当用户剩余三分钟时,AI会通知用户,并结束聊天,恢复到标准语音界面。
总的来说,先进语音模式为与现有的GPT-4o大语言模型交互提供了一种新方式,让用户能够用于各种任务。简单来说,使用文本版ChatGPT所能完成的任何任务,在先进语音模式下都可以实现,并且增加了有趣的声音效果。早期用户正在探索其各种功能,包括打击乐、讲故事和快速计数。
然而,先进语音模式也设有安全措施和限制。用户不能在该模式下创建记忆、使用自定义指令或访问GPT。此外,它能记住之前的先进语音对话的细节,但无法参考通过文本提示或标准语音界面进行的早期聊天记录。
另外,无论请求如何,先进语音模式将不会进行唱歌。OpenAI表示,“为尊重创作者的权益,我们实施了多项措施,包括新的过滤器,以防止先进语音模式生成唱歌等音乐内容。”