OpenAI持續展示其先進的逼真生成AI視頻模型Sora的片段,目前仍屬內部專用。在快速發展的視頻AI領域,競爭對手Pika正利用這一時刻迅速崛起。
近期,Pika在其平台pika.art上推出了一項新功能,使用戶能自動為其AI生成的視頻生成音效。這項增強功能為AI視頻增添了一個關鍵維度,以前這類視頻通常缺乏音頻,使用者必須通過不同的編輯軟件尋找音效文件。現在,Pika用戶可以直接在應用內生成音效文件,簡化了創作過程。
此更新緊接Pika推出的口型同步功能,進一步提升了個人創作者和企業的AI生成內容。Pika的全能生成AI視頻創作平台整合了口型同步、音效、旁白和視覺元素,使得用戶無需額外聘請攝影師或音效設計師即可完成整個項目。
Pika所提供的強大功能對於電影製作人來說尤具吸引力,使他們能夠省去尋找各種資源的麻煩。用戶只需描述他們的構思,便能迅速從想像中生成所需的所有元素,而無需翻找庫存資料庫。
目前,Pika的新音效功能僅對其超協作計劃的成員或擁有每月58美元專業訂閱的用戶開放,但計劃將在測試後擴展可用性。
Pika的AI視頻將如何融入音效?
Pika確認用戶可以通過兩種主要方式獲取音效:
1. 上下文生成:AI模型將根據文本提示,自動選擇最適合生成視頻的音頻。用戶只需在輸入提示時啟動“音效”開關,Pika的模型將在幾秒鐘內提供完整的視聽輸出。
2. 後續處理:用戶在創建或上傳無音頻片段後可以添加AI生成的聲音。他們可以點擊‘編輯’,選擇‘音效’來描述所需的聲音,模型隨後會生成多個選項供用戶選擇。
生成的音頻將顯著增強創作過程,解決以往從外部音頻來源中尋求音效的不便。Pika聲稱是首個將生成音頻嵌入視頻輸出的AI視頻平台。
其他公司也在探索音頻生成技術,ElevenLabs最近宣布將啟動文本轉聲音的AI功能,而Meta也提供名為AudioGen的類似技術,但均未提供像Pika這樣整合的視頻生成AI模型。
預期逐步推出
新音效功能將逐步推出,首批用戶為超協作計劃成員或Pika的專業訂閱者。來自這些早期用戶的反饋將有助於改進該功能,未來也將向所有平台用戶開放。
自2023年12月推出以來,Pika積極強化其產品,以與OpenAI的Sora等競爭者抗衡。近期的合作,例如與ElevenLabs共同開發的口型同步功能,使得用戶能為他們的視頻添加AI聲音和同步動畫。新增的音效將進一步豐富這些身臨其境的體驗。
隨著Pika的發展,該公司計劃推出更多功能,並在近2億美元的估值下籌集了5500萬美元的資金。Pika希望挑戰不僅僅是OpenAI,還有其他創意AI領域的重要參與者,如Adobe、Runway、Stability AI及新近推出的Haiper。