OpenAI 發布令人驚豔的 AI 生成影片,吸引觀眾目光

OpenAI開創性的AI項目“Sora”代表了技術的一次重大進步。這個創新的文本轉視頻AI模型剛剛啟動了有限的用戶測試階段,展示了通過幾部驚人真實的AI生成視頻而展現的卓越能力。

Sora旨在將文字提示轉換為生動的視頻場景。OpenAI在其網站上展示的視頻顯示了令人印象深刻的結果。提供給Sora的提示簡潔而富有描述性;曾使用ChatGPT的用戶可能會發現,Sora能從更短的提示中產生結果。例如,為了創建包含毛象的視頻,Sora僅需67字的提示,詳細說明了這些動物的特徵、環境和攝影角度。

根據OpenAI的說法,“Sora可生成長達一分鐘的視頻,同時保持高視覺質量並符合用戶提示。”該AI能夠製作復雜的場景,包含多個角色、多樣的設置和逼真的動作。OpenAI指出,Sora能夠解讀並推斷其接收的提示所需的額外上下文。

公司強調,“該模型不僅理解用戶的請求,還明白這些元素在現實世界中的存在方式。”Sora在渲染角色和背景方面表現出色,也在創造“引人入勝、富有情感的角色”方面展現了卓越的能力。

此外,Sora具備擴展現有視頻或填補空白的功能,還能從圖片生成視頻,展現了超越文本提示的靈活性。雖然靜態圖像令人驚艷,但這些視頻在動態中更是引人入勝。OpenAI展示了各種生成的視頻,從受Cyberpunk啟發的東京街道到加利福尼亞淘金熱時期的“歷史畫面”,以及人眼的特寫鏡頭。提供的提示包含多樣的主題,從動畫場景到野生動物攝影。

儘管Sora的能力令人印象深刻,但也有其局限性。一些視頻呈現出不完美之處,例如人群中的人物缺頭或表現出不自然的動作。這些尷尬的動作可能不會立即引人注意,但在仔細檢查後便會顯露出來。

Sora何時向公眾開放仍需時日。目前,該模型正在由一小組測試者進行評估,以評価潛在風險,而若干內容創作者也在早期開發階段開始探索其功能。

隨著AI技術的不斷演進,對性能的期望往往較低。然而,無論是因為期望不高還是Sora的先進能力,初步印象無疑既令人印象深刻又有所擔憂。在一個越來越難以區分現實與幻影的世界中,這項技術的影響不僅限於圖像——現在視頻也面臨風險。Sora並不是文本轉視頻領域的首個舉措;像Pika這樣的模型也相繼出現。

知名科技YouTuber Marques Brownlee在Twitter上對這項技術表達了擔憂,認為“Sora的演示如果不讓你感到擔憂,其他的恐怕也不會。”

如果OpenAI的Sora已經達到如此程度,想想在未來幾年進一步開發和測試後的潛力,著實令人興奮。儘管這項技術可能會干擾各種就業市場,但希望和ChatGPT一樣,它能夠與人類專業知識進行整合。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles