最近,Google 的高階 AI 模型 Gemini 1.5 對 OpenAI 新推出的視頻生成工具 Sora 進行了深入評估。儘管 Sora 生成的視頻視覺效果驚人,但 Gemini 1.5 指出了幾個不合邏輯的細節。
例如,一段由 Sora 創作的日本街道場景視頻,呈現了不尋常的重雪與盛開櫻花的奇特組合。在現實中,櫻花是在溫暖的春季盛開,這樣的場景顯然不可能出現。此外,降雪的均勻度也過於人造,明顯偏離了真實的降雪模式。更引人注意的是,視頻中的角色卻身穿夏季服裝,這在寒冷的冬季環境中顯得格外不真實。
Gemini 1.5 的分析師指出:“雖然 Sora 的視頻視覺上令人愉悅,但明顯的矛盾顯示這些場景並非基於現實。”這一評估揭示了目前 AI 生成技術在真實性和邏輯一致性方面所面臨的挑戰。
此外,Gemini 1.5 模型具備卓越的處理能力,擁有高達一百萬標記的上下文窗口,遠超其競爭對手。這項能力使其能同時處理大量資訊,包括長達一小時的視頻和超過三萬行代碼。
隨著 AI 技術的不斷演進,我們期待未來能目睹更真實、更生動的視頻生成。