今天,Pindrop作為語音安全、身份驗證和詐騙檢測的領導者,推出了Pulse Inspect——一種基於網頁的工具,能以高達99%的準確率檢測數位音訊和影片檔案中的AI生成語音。Pulse Inspect目前作為Pindrop Pulse套件的一部分提供預覽,能夠檢測無論使用哪種工具或模型創建的AI生成內容。
這項創新產品與主流行業實踐截然不同,傳統的AI供應商通常僅針對自家平台生成的內容推出分類器。Pindrop通過年度訂閱提供Pulse Inspect,旨在幫助需大規模應對音訊深偽風險的組織。CEO Vijay Balasubramaniyan表示,根據市場需求,他們可能會推出針對個人消費者的更具價格競爭力的計劃,以提供有限次數的檢查。
針對音訊深偽的興起
儘管深偽技術存在多年,但基於文本的生成AI的普及使其在網上更加顯眼。來自Microsoft和ElevenLabs等公司的工具被用來創建模仿名人、商業人士和政治家的欺詐性音訊和視頻內容,導致錯誤信息和聲譽損害。Pindrop的內部報告顯示,超過一千兩百萬美國成年人認識受到非自願性深偽創作影響的人士,這些包含圖像、視頻和音訊的複製品迅速在社交媒體上傳播。
為了應對這一緊迫問題,Pindrop今年早些時候推出了Pulse套件,首個解決方案專注於檢測致電呼叫中心的深偽通話。透過Pulse Inspect,Pindrop擴展其能力,使組織能夠分析任何音訊或視頻檔案以檢測合成痕跡。
高效的音訊分析
Pulse Inspect作為一個簡單的網頁應用程式運作,允許企業用戶上傳可疑檔案進行即時分析。以往識別合成痕跡需要耗時的取證工作,現在該工具能在幾秒鐘內處理檔案,生成“深偽分數”並指出含有AI生成語音的部分。這種快速分析幫助組織主動應對錯誤信息,保護品牌形象。
先進的檢測訓練
Pindrop的專有檢測模型在超過350種深偽生成工具及2000萬個獨特語句上進行訓練,根據內部評估,在約200,000個樣本的數據集中實現了99%的深偽音訊檢測準確率。該模型每四秒評估一次媒體檔案的合成痕跡,確保即使在混合媒體環境中也能精確分類。Balasubramaniyan解釋道:“Pindrop的技術利用深度神經網絡(DNN)和複雜的頻譜時間分析來通過多種方法檢測合成痕跡。”
全面的檢測能力
Pulse Inspect的優勢在於能無限制地識別深偽內容。Balasubramaniyan指出,許多流行的音訊深偽來源於開源工具,而非商業工具。Pindrop的廣泛檢測工具對於辨識多種生成系統中的合成音訊至關重要。不過,值得注意的是,該工具可能在含有少於兩秒語音或過多背景噪音的檔案上面臨挑戰,團隊正在積極努力提升檢測準確率,克服這些限制。
目前,Pindrop將Pulse Inspect的目標對準不同類型的組織,包括媒體公司、非營利機構、政府機構、名人經紀公司、法律事務所和社交媒體平台。雖然Balasubramaniyan未透露具體客戶數量,但他確認多家合作夥伴正在利用該產品,並通過年訂閱計劃進行批量使用,包括TrueMedia.org,該平台幫助用戶在關鍵選舉背景下識別深偽內容。
除了手動上傳,Pulse Inspect還可通過API集成到定制的取證工作流程中,便於批量用例,例如標記和移除社交媒體上的有害AI生成內容。展望未來,Pindrop計劃通過增強工具的可解釋性來提升Pulse套件,並打算推出可以追溯深偽生成來源的功能,同時擴展對其他類型的支持。