ElevenLabs, 作为人工智能语音技术的先锋,以其语音克隆、文本转语音和语音转语音模型而闻名,最近推出了一款新工具:AI音频隔离器。
该工具现已在ElevenLabs平台上线,旨在帮助创作者轻松去除各类内容中的杂音,包括电影、播客和YouTube视频。
AI音频隔离器的工作原理
背景噪音常常会严重影响录音质量。创作者们常常面临如谈话声、风声或交通噪音等干扰,难以让观众听清讲话者的声音。虽然一些创作者使用配备噪音消除功能的麦克风,但对早期创作者而言,这种设备并不总是可得。
ElevenLabs的AI音频隔离器则在后期制作阶段发挥作用,用户可以上传他们的内容。该工具运用先进的模型分析音频,检测并去除背景噪音,最终提取干净的对话。ElevenLabs声称,AI音频隔离器的音频质量达到了类似于录音室制作的水准。该公司设计主管Ammaar Reshi的演示展示了其去除叶片吹风机噪音的有效性,最终实现了清晰的语言表达。
实际测试
为了评估AI音频隔离器的能力,我们进行了三项测试。我们录制了三句话,每句话都被不同的背景噪音打断。该工具在几秒钟内成功处理了音频,消除了开门声、桌子敲击声、掌声和家庭活动的干扰。它唯一未能有效过滤的声音是墙壁敲击声和指尖 snapping 声。
ElevenLabs增长负责人Sam Sklar表示,当前版本的工具不支持音乐人声,但用户可能在某些曲目上取得成功。
未来改进
尽管音频隔离器对不规则背景噪声的处理能力使其区别于关注平面噪声的其他工具,但仍有改进的空间。ElevenLabs致力于不断提升其性能。
目前,公司并未透露关于该工具背后模型的更多信息,也没有说明上传的录音是否会用于模型训练。不过,用户可以通过隐私政策中的链接选择退出个人数据的使用。
目前,音频隔离器仅可在ElevenLabs平台使用,计划在未来几周内开放API访问,但具体时间尚未确定。用户可以免费访问该工具,但有一定限制。
Sklar解释道:“音频隔离器每分钟音频的费用为1000个字符。我们提供的免费计划每月包括10,000个字符,允许用户免费处理10分钟的音频。”对于需要处理更大量音频文件的用户,付费计划从每月5美元起。