Pindrop 努力实现 99% 准确率,精准识别 AI 音频深度伪造技术

今天,Pindrop,一家在语音安全、身份验证和欺诈检测领域的领军企业,推出了Pulse Inspect——一款网络工具,能够以99%的准确率检测数字音频和视频文件中的 AI 生成语音。目前,Pulse Inspect 作为 Pindrop Pulse 套件的一部分已进入预览阶段,支持无视创建其内容的工具或模型,检测 AI 生成的内容。

这一创新工具与主流行业实践有所不同,许多 AI 供应商通常发布的分类器仅限于检测由其平台生成的内容。Pindrop 为需要大规模应对音频深伪风险的机构提供 Pulse Inspect,采用年度订阅方式。Pindrop CEO Vijay Balasubramaniyan 透露,未来可能根据市场需求推出更实惠的价格层次,供个人消费者使用。

应对音频深伪的挑战

尽管深伪技术存在多年,但基于文本的生成式 AI 的兴起使其在网上的曝光度大幅提升。像微软和 ElevenLabs 等公司的工具被用于制作模仿名人、商界人士和政客的虚假音频和视频内容,导致虚假信息传播和声誉损失。

Pindrop 的内部报告显示,超过1200万美国成年人知晓某人曾成为非自愿深伪创作的受害者。这些复制品覆盖图片、视频和音频,利用社交媒体的传播迅速扩散。

为了解决这一紧迫问题,Pindrop 今年早些时候推出了 Pulse 套件,首个解决方案专注于检测拨打呼叫中心的深伪电话。通过 Pulse Inspect,Pindrop 扩展了其功能,使组织能够分析任何音频或视频文件中的合成伪造信息。

高效音频分析

Pulse Inspect 是一款简单易用的 web 应用,企业用户可以上传可疑文件,进行即时分析。以往,识别合成伪造信息需要耗时的法医检测工作,而现在,该工具能够在几秒钟内处理文件,生成“深伪评分”,并标出包含 AI 生成语音的部分。这种快速分析使组织能够主动应对虚假信息,维护品牌形象。

高级检测训练

Pindrop 的专有检测模型经过 350 多种深伪生成工具和 2000 万个独特发声的训练,涵盖 40 多种语言,内部评估显示其在检测深伪音频方面的准确率达到 99%。该模型每四秒对媒体文件进行检测,对合成伪造信息进行精准分类,即便是在混合媒体环境中也能保持高效。

Balasubramaniyan 解释道:“Pindrop 的技术利用深度神经网络(DNN)和复杂的时频分析,采用多种方法检测合成伪造信息。”

全面检测能力

Pulse Inspect 的优势在于无供应商特定限制地识别深伪。Balasubramaniyan 指出,许多流行的音频深伪源于开源工具而非商业工具。Pindrop 的广泛检测工具对于识别多个生成系统的合成音频至关重要。

但需注意的是,该工具在处理少于两秒的语音文件或背景噪音过多的情况下,可能会存在检测困难。团队正在积极提升检测准确性,解决这些局限。

目前,Pindrop 针对媒体公司、非营利组织、政府机构、明星管理公司、法律事务所和社交媒体平台等多类组织开发 Pulse Inspect。尽管 Balasubramaniyan 并未披露具体客户数量,但他确认已有多个合作伙伴通过基于使用量的年度订阅使用该产品,包括 TrueMedia.org,该组织帮助用户在重要选举中识别深伪内容。

除了手动上传外,Pulse Inspect 还能够通过 API 集成到定制法医工作流程中,便于批量应用,例如标记和删除社交媒体上的有害 AI 生成内容。

展望未来,Pindrop 计划通过提升工具的可解释性来增强 Pulse 套件,旨在推出能够追踪深伪生成源头的功能,同时扩展对额外模式的支持。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles