OpenAI 發布令人驚豔的 AI 生成影片，吸引觀眾目光

Home AI新聞 OpenAI 發布令人驚豔的 AI 生成影片，吸引觀眾目光

OpenAI開創性的AI項目“Sora”代表了技術的一次重大進步。這個創新的文本轉視頻AI模型剛剛啟動了有限的用戶測試階段，展示了通過幾部驚人真實的AI生成視頻而展現的卓越能力。

Sora旨在將文字提示轉換為生動的視頻場景。OpenAI在其網站上展示的視頻顯示了令人印象深刻的結果。提供給Sora的提示簡潔而富有描述性；曾使用ChatGPT的用戶可能會發現，Sora能從更短的提示中產生結果。例如，為了創建包含毛象的視頻，Sora僅需67字的提示，詳細說明了這些動物的特徵、環境和攝影角度。

根據OpenAI的說法，“Sora可生成長達一分鐘的視頻，同時保持高視覺質量並符合用戶提示。”該AI能夠製作復雜的場景，包含多個角色、多樣的設置和逼真的動作。OpenAI指出，Sora能夠解讀並推斷其接收的提示所需的額外上下文。

公司強調，“該模型不僅理解用戶的請求，還明白這些元素在現實世界中的存在方式。”Sora在渲染角色和背景方面表現出色，也在創造“引人入勝、富有情感的角色”方面展現了卓越的能力。

此外，Sora具備擴展現有視頻或填補空白的功能，還能從圖片生成視頻，展現了超越文本提示的靈活性。雖然靜態圖像令人驚艷，但這些視頻在動態中更是引人入勝。OpenAI展示了各種生成的視頻，從受Cyberpunk啟發的東京街道到加利福尼亞淘金熱時期的“歷史畫面”，以及人眼的特寫鏡頭。提供的提示包含多樣的主題，從動畫場景到野生動物攝影。

儘管Sora的能力令人印象深刻，但也有其局限性。一些視頻呈現出不完美之處，例如人群中的人物缺頭或表現出不自然的動作。這些尷尬的動作可能不會立即引人注意，但在仔細檢查後便會顯露出來。

Sora何時向公眾開放仍需時日。目前，該模型正在由一小組測試者進行評估，以評価潛在風險，而若干內容創作者也在早期開發階段開始探索其功能。

隨著AI技術的不斷演進，對性能的期望往往較低。然而，無論是因為期望不高還是Sora的先進能力，初步印象無疑既令人印象深刻又有所擔憂。在一個越來越難以區分現實與幻影的世界中，這項技術的影響不僅限於圖像——現在視頻也面臨風險。Sora並不是文本轉視頻領域的首個舉措；像Pika這樣的模型也相繼出現。

知名科技YouTuber Marques Brownlee在Twitter上對這項技術表達了擔憂，認為“Sora的演示如果不讓你感到擔憂，其他的恐怕也不會。”

如果OpenAI的Sora已經達到如此程度，想想在未來幾年進一步開發和測試後的潛力，著實令人興奮。儘管這項技術可能會干擾各種就業市場，但希望和ChatGPT一樣，它能夠與人類專業知識進行整合。

如何有效利用Nvidia最新的RTX AI聊天機器人

Google 發布全新尖端 AI 應用程式，助您提升 Android 手機體驗