AI語音創業公司ElevenLabs獲得8,000萬美元資金,並推出全新克隆聲音市場

在成立僅兩年內,來自 Google 和 Palantir 的前員工創辦的 AI 語音初創公司 ElevenLabs 已經達到獨角獸地位。該公司最近宣布完成 8000 萬美元的 B 輪融資,估值十倍增至 11 億美元。

這輪融資由現有投資者 Andreessen Horowitz(a16z)、前 GitHub CEO Nat Friedman 和前 Apple AI 負責人 Daniel Gross 共同主導,並得到了 Sequoia Capital 和 SV Angel 的支持。這一輪融資跟隨著六個月前約 1900 萬美元的 A 輪融資,當時 ElevenLabs 的估值約為 1 億美元。

開創 AI 語音技術

ElevenLabs 專注於利用機器學習進行語音克隆和合成,並支持多種語言。新獲得的資金將增強其研究和產品供應。該公司還推出了幾個新功能,包括電影的配音工具和用戶可以出售自己克隆聲音的市場。

使內容普及可及

隨著方言和語言的差異,本地化內容的製作通常集中於主流語言,經常依賴於缺乏原內容真實性的手動配音。來自波蘭的創始人 Piotr Dabkowski 和 Mati Staniszewski 親歷了劣質配音的挑戰,激勵他們創立 ElevenLabs。他們的使命是利用 AI 讓內容的獲取更加民主化。

自 2022 年推出以來,ElevenLabs 已經達到多項重要里程碑。該公司最初以其自然語音的 AI 文本轉語音模型而聞名,之後推出了支持多種語言的 Eleven Multilingual 版本 1 和 2,現在涵蓋波蘭語、德語、西班牙語、法語、意大利語、葡萄牙語和印地語等多種語言。Voice Lab 功能允許用戶克隆自己的聲音或生成合成聲音,將文本轉化為音頻內容。

“ElevenLabs 的技術利用上下文感知和高壓縮來實現超真實的語音。我們的專有模型理解單詞之間的關係,並根據上下文調整語音,動態預測數千種聲音特徵,”Staniszewski 解釋說。

不斷增長的用戶群

在短短幾個月內,ElevenLabs 吸引了超過一百萬的用戶。AI 配音工具的推出使內容創作者能夠將音頻和視頻翻譯成 29 種語言,同時保持原講者的聲音和情感。值得注意的是,41% 的 Fortune 500 客戶包含知名出版商如 Storytel、The Washington Post 和 TheSoul Publishing。

“目前,我們已經建立了超過 100 個 B2B 合作夥伴。AI 語音的應用範圍廣泛,從提升觀眾體驗到擴大教育獲取”,Staniszewski 指出。

推出配音工作室

為了進一步創新其產品系列,ElevenLabs 將推出配音工作室工作流程,增強 AI 配音工具。這一新工作流程為專業人士提供強大的工具,讓他們可以用多種語言為全長電影配音,同時生成和編輯紀錄、翻譯和時間碼。然而,目前不包括口型同步,這意味著原視頻中的口型動作保持不變。

新市場和可及性功能

此外,ElevenLabs 正在推出一款可及性應用,將文本或網址轉換為音頻,並推出一個聲音庫,允許用戶將其 AI 克隆的聲音進行貨幣化。用戶可以設置可用性和報酬的條件,但分享需要經過多步驗證過程以確保真實性。

“聲音驗證需經過 captcha 流程,以確認聲音與訓練樣本一致,並由我們的監管團隊提供支持,”CEO 表示。

隨著這些功能在即將到來的幾周內推出,ElevenLabs 旨在吸引來自各個領域的用戶。此次融資使其總融資額達到 1.01 億美元,公司計劃加強 AI 語音技術的研究、增強基礎設施,並開發針對性的產品,同時實施強有力的安全控制,包括 AI 音頻分類器。

“未來幾年,我們的目標是成為全球語音 AI 研究和產品部署的領導者,”Staniszewski 表示。

AI 語音生成領域的競爭對手包括 MURF.AI、Play.ht 和 WellSaid Labs。根據 Market US 的數據,這些工具的全球市場在 2022 年的估值為 12 億美元,預計到 2032 年接近 50 億美元,顯示出約 15.4% 的年均增長率(CAGR)。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles