OpenAI发布令人震惊的AI生成视频,吸引观众眼球

OpenAI的创新AI项目“Sora”标志着技术的一次重大进步。该文本转视频的AI模型刚刚进入有限用户测试阶段,展示了其惊人的能力,通过几段令人咋舌的AI生成视频,展现了真实的视觉效果。

Sora旨在将文本提示转化为生动的视频场景。OpenAI在其网站上展示了这一点,通过多个视频展示了令人印象深刻的成果。Sora接收的提示简洁而富有描述性;使用过ChatGPT的用户可能会发现,Sora能够从更短的提示中生成结果。例如,为了创建一段关于猛犸象的视频,Sora只需67个字的提示,详细描述了动物、环境和镜头角度。

OpenAI表示,“Sora可以生成最长达一分钟的视频,同时保持高视觉质量并符合用户提示。”该AI能够构建复杂的场景,涵盖众多角色、各种背景和逼真的动作。OpenAI指出,Sora能够理解和推断提示中的额外上下文。

该公司强调,“模型不仅理解用户的请求,还能把这些元素联系到现实世界中。”Sora在生动呈现角色和背景方面表现出色,还能创造出“能够传达丰富情感的迷人角色”。

此外,Sora还具有延伸现有视频或填补空白的功能,甚至能够根据图像生成视频,展现了超越文本提示的灵活性。虽然静态图像令人惊叹,但动态视频的效果更为迷人。OpenAI展示了多样化的生成视频,从受赛博朋克启发的东京街头到加州金矿时代的“历史镜头”,甚至还有人眼的特写。这些提示涵盖了从动画场景到野生动物摄影的多种主题。

尽管Sora的能力令人印象深刻,但也存在一些局限性。一些视频中出现了瑕疵,例如人群中的人物缺少头部或表现出不自然的运动。这些尴尬的动作可能不易察觉,但在仔细观察时便会显露无遗。

Sora何时能够向公众开放尚不明确。目前,该模型正在由特定的测试团队进行风险评估,同时一些内容创作者也开始在早期开发阶段探索其功能。

随着AI技术的不断发展,公众对性能的预期往往较低。然而,无论是因为预期谦逊,还是Sora的先进能力,初步印象令人印象深刻却又令人担忧。在一个真实与虚幻愈发难以区分的世界中,这项技术的影响不仅限于图像——现在视频同样面临风险。Sora并不是文本转视频领域的首个项目,类似Pika的模型也已问世。

著名科技YouTuber Marques Brownlee在Twitter上针对Sora的演示表示,“如果这一点不让你感到担忧,那就没有什么会让你担忧。”如果OpenAI的Sora已经达到如此高的复杂度,想象它在未来几年进一步开发和测试后的潜力令人兴奋。尽管这样的技术可能会冲击多个就业市场,但人们希望,像ChatGPT一样,它能与人类专业知识并存。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles