Runway推出Gen-3 Alpha:一款革命性的超现实AI视频模型,打造惊艳的10秒短视频

位于纽约市的Runway ML(通常称为Runway)是高质量生成式AI视频创作的先锋。自2023年2月发布Gen-1模型和6月推出Gen-2以来,该公司面临来自其他高度逼真的AI视频生成器的激烈竞争,包括OpenAI即将发布的Sora模型和Luma AI最近推出的Dream Machine。

为应对竞争,Runway在生成式AI视频领域重磅推出Gen-3 Alpha。该模型在一篇博客中被描述为“在新基础设施上进行大规模多模态训练的系列之首”,旨在开发能够模拟多种现实场景和互动的通用世界模型。文章中展示了Gen-3 Alpha功能的视频示例。

Gen-3 Alpha使用户能够生成10秒高质量、逼真的视频片段,具备精确的情感表达和摄像机移动。Runway的一位发言人表示,这一初步推出将提供5秒和10秒片段生成,显著缩短制作时间——5秒视频仅需45秒,10秒视频需90秒。

虽然尚未公布具体的发布日期,但演示视频已在Runway的网站和X社交账号上展示。关于用户的可用性仍不明确,有消息称,可能会通过免费使用层或需支付每月15美元或每年144美元的订阅费用获得。

在一次近期采访中,Runway的联合创始人兼首席技术官Anastasis Germanidis确认,Gen-3 Alpha将在未来几天内向付费订阅用户开放,并计划未来向免费用户推广。Runway的一位代表补充说,该模型将向企业用户和创意合作伙伴计划的成员开放。

Germanidis在X上表示,Gen-3 Alpha将增强文本到视频和图像到视频的现有功能,同时引入新的能力。自Gen-2发布以来,Runway发现视频扩散模型的规模尚未达到最佳性能,这使他们能够开发强大的视觉内容表现。

扩散指的是AI模型如何从像素化的“噪声”中学习重建视觉概念,使用标注的图像/视频和文本对。Runway声称,Gen-3 Alpha是在视频和图像上共同训练的,由一支研究科学家、工程师和艺术家团队指导。然而,他们并未透露使用的具体数据集,这在AI媒体生成器中是一种常见做法。

批评者呼吁AI模型创作者通过许可来补偿原始数据作者,并有些人已经提起版权侵权诉讼。尽管如此,AI公司坚持认为他们可以合法利用任何公开数据。

当被问及Gen-3 Alpha的训练数据时,Runway的发言人提到,他们依赖于其内部研究团队管理的精心策划的数据集。

值得注意的是,Runway正在与领先的媒体和娱乐组织合作,开发定制版本的Gen-3,旨在实现风格一致性并满足特定的艺术和叙事目标。虽然关于这些合作的细节尚未披露,但来自诸如《瞬息全宇宙》和《人民小丑》等获奖项目的电影制片人以往已利用过Runway的技术。

Runway还提供了一个表单,供希望获取Gen-3定制版本的组织填报,尽管尚未发布定制模型训练的定价细节。显然,Runway在快速发展的生成式AI视频创作领域对保持领导地位充满决心。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles