谷歌Gemini 1.5与OpenAI Sora的分析:视频生成技术的视觉吸引力与重大限制

最近,谷歌的先进人工智能模型 Gemini 1.5 对 OpenAI 新推出的视频生成工具 Sora 进行了深入评估。虽然 Sora 生成的视频在视觉上令人惊叹,但 Gemini 1.5 指出了一些不合逻辑的细节。

以 Sora 创作的一段日本街景视频为例,该视频呈现出重雪与盛开的樱花之间的超现实结合。实际上,樱花在温暖的春季绽放,这种场景是完全不可能的。此外,视频中的降雪显得异常均匀,与真实降雪模式有显著差异。更引人注目的是,视频中的人物尽管身处冬季环境,却穿着夏季衣物,进一步凸显了视频的缺乏现实感。

Gemini 1.5 的分析师评论道:“虽然 Sora 的视频在视觉上很吸引人,但明显的不一致性表明这些场景并不源于现实。”这一评估突显了目前 AI 生成技术在真实性和逻辑一致性方面面临的挑战。

此外,Gemini 1.5 模型展现出卓越的处理能力,具备一百万个标记的上下文窗口,远超竞争对手。这一能力使其能够同时处理大量信息,包括长达一个小时的视频和超过 30,000 行代码。

随着人工智能技术的不断演进,我们期待未来能见证更加真实、生动的视频生成。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles