OpenAI正在扩展其业务范围,不再仅被视为ChatGPT或大型语言模型(LLM)公司。今天,该组织推出了Sora,这一创新的AI文本转视频生成模型。联合创始人兼首席执行官山姆·奧特曼(Sam Altman)在X(前Twitter)上表示,此次发布是一个“非凡的时刻”。
目前,Sora尚未向公众开放。奥特曼解释说,Sora正在进行“初始红队测试”,这是一个安全测试阶段,旨在发现潜在的缺陷和滥用问题。不过,一些“有限的创作者”已经获得了模型的使用权限,未来预计会有更广泛的公众开放。
进入竞争激烈的市场
Sora进入了一个竞争激烈的领域,加入了已有的AI视频生成解决方案的初创公司,如Runway、Pika和Stability AI,以及已建立的玩家,如谷歌的Lumiere模型。Sora的独特之处在于其卓越的质量。OpenAI发布的示例视频展示了惊人的清晰度、流畅的动作,以及对人体解剖和物理环境的准确表达。值得注意的是,Sora可以一次生成60秒的视频,而Runway和Pika等竞争对手一次只能生成4秒钟的视频。
奥特曼和Sora团队,包括研究人员威尔·德皮尤(Will Depue),发起了一项互动倡议,他们在Twitter/X上征集用户的创意提示,实时展示Sora的能力,创造出众包的示范,展现模型的潜力。
日常场景的真实表现
除了令人惊叹的视觉效果,Sora在渲染日常场景方面表现出了惊人的真实感。展现城市风光的高架列车视角或人与猫亲密互动的瞬间,突显了Sora捕捉人类情感体验的能力。
此外,OpenAI的研究员比尔·皮布尔斯(Bill Peebles)专注于实现“人工通用智能”(AGI)——这种AI在经济价值任务上超过人类的表现——他指出,Sora将在这一追求中发挥重要作用,帮助实现全面的模拟。
AI的关键时刻
随着美国联邦机构因欺诈和深度伪造的担忧而加强对AI的监管,Sora的发布标志着不仅是OpenAI的一个重要里程碑,也对整个科技和媒体行业具有重要意义。Sora对社会的影响,无论是积极还是消极,还有待进一步观察。