Assembly AI 推出 Universal-1 模型，與 Whisper 相比，幻覺現象減少了 30%

Home AI新聞 Assembly AI 推出 Universal-1 模型，與 Whisper 相比，幻覺現象減少了 30%

AI即服務提供商Assembly AI推出了最新的語音識別模型——Universal-1。該模型以超過1250萬小時的多語言音頻數據進行訓練，實現了英語、法語、德語和西班牙語的卓越語音轉文本準確率。公司聲稱，Universal-1在語音數據中的幻覺率降低了30%，在環境噪音中降低了90%，與OpenAI的Whisper Large-v3模型相比，更加出色。

在最近的一篇部落格文章中，Assembly AI形容Universal-1是實現準確、可靠和穩健的多語言語音轉文本能力的重要一步。該模型能夠有效地進行語言切換，在單一音頻文件中同時轉錄多種語言。

Universal-1在時間戳估算方面表現優異，這對音頻和視頻編輯及對話分析至關重要。與其前身Conformer-2相比，提升了13%的準確性，並且其串聯最小置換字錯誤率(cpWER)達到了14%的改善。此外，講者數量的估算準確率亦上升至71%。

該模型還具備優化的平行推理功能，顯著縮短了長音頻文件的處理時間。在Nvidia Tesla T4機器上，Universal-1僅需21秒便可轉錄一小時音頻，速度比Whisper Large-v3快五倍，後者需耗時107秒完成相同任務，且使用的批量較小。

增強版的語音轉文本AI模型提供了多項優勢，包括更準確且可靠的筆記生成、行動項目的識別，以及對元數據如專有名詞、講者識別和時間戳的排序能力。這一改進將促進多種應用的發展，從AI驅動的視頻編輯到需要精確臨床筆記錄入和索賠提交的遠程醫療平台。

Universal-1模型目前已通過Assembly AI的API提供訪問。

Perplexity的增長挑戰了SEO的關注，揭示了Google主導地位的弱點。

Meta的圖像生成器在呈現混血情侶和友誼方面面臨挑戰

Most people like

ChatDaddy

154.5K

利用強大的 WhatsApp 自動化工具轉變您的業務：節省時間，提升效率。

WhatsApp 自動化工具 AI Advertising Assistant

D-ID

1.4M

D-ID是一個創新的AI平台，旨在將照片和文字轉換為引人入勝的視頻。憑藉先進的技術，D-ID使用戶能輕鬆生成動態視覺內容，吸引觀眾並有效傳達信息。

AI 生成的影片 AI Video Generator

Proto AICX

22.4K

探索包容性客戶體驗（CX）自動化的力量，以及多語言聯絡中心自動化的好處。利用創新方案來提升互動、簡化溝通，並滿足多元化受眾的需求。通過擁抱優先考慮包容性和語言多樣性的技術，轉變您的客戶互動方式。

CX 自動化 AI Chatbot

SalesMind Ai

30K

摘要：SalesMind AI 是一款創新的工具，旨在優化 LinkedIn 潛在客戶開發，提升銷售績效與結果。憑藉其先進的人工智慧功能，SalesMind AI 簡化了尋找與接觸潛在客戶的過程，最終促進更佳的銷售成果。

挖掘潛在客戶 AI Lead Generation

Find AI tools in YBX