探索人们如何创意使用ChatGPT的新语音模式

ChatGPT的高级语音模式于周二向部分OpenAI订阅用户推出,这是备受期待的初步版本。该功能首次在5月份宣告,标志着从传统文字对话到以自然、逼真语言互动的重大转变。它支持多种区域口音和语言。OpenAI表示,高级语音的目标是提供“更自然、实时的对话,允许随时插话,并感知和响应用户的情感。”

然而,语音模式也存在一些限制。系统配备了四种预设声音,无法模仿个别用户或公众人物的声音,偏离这些预设的输出将被自动屏蔽。此外,高级语音并不支持生成版权音频或创作音乐。有趣的是,用户们已开始尝试让AI进行节拍打击。

测试者Ethan Sutin在X(前Twitter)上分享了一系列高级语音的反应,包括简短的“生日说唱”和节拍打击演示。用户能听到AI在节拍间的数字呼吸声。尽管AI无法创作完整歌曲,但它能够为睡前故事增添音效,从而提升讲故事的体验。例如,在讲述关于叛逆机械人的故事时,AI会在适当时生成合适的撞击声,营造身临其境的氛围。

高级语音还可以自发生成逼真的角色,增强其生动性。用户可以要求AI使用不同的语调和语言进行交流,为互动增添层次感。

此外,AI的语音能力不仅限于人类语言。当用户指示时,高级语音可以准确模仿猫的叫声。用户可以就自己的宠物提问,AI会实时提供量身定制的建议和技巧。

高级语音还可以利用设备的摄像头来支持翻译过程。其中一位用户对着一款日文GameBoy Advance的宝可梦游戏的屏幕,AI能够在他们玩游戏时读取屏幕对话。虽然视频和屏幕共享功能尚未包含在初步版本中,但OpenAI计划很快推出这些功能。公司计划在接下来的几周内向更多Plus订阅用户扩展初步版本,并预计在今秋全面推出。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles