最近,WVFRM播客在YouTube上采访了OpenAI开创性的视频生成模型Sora的核心团队。项目负责人比尔·皮布尔斯、蒂姆·布鲁克斯和阿迪提亚·拉梅什分享了Sora的当前进展和未来计划,强调该项目仍处于用户反馈收集阶段,短期内不会向公众开放。
Sora是OpenAI开发的一款创新性AI视频生成模型,自发布以来引起了广泛关注。该模型能够根据文本提示生成最长60秒的逼真视频,展现出在模拟现实世界方面的卓越能力。它通过分析大量视频数据,结合GPT等大型语言模型和DALL-E等扩散模型的前沿技术,来生成高质量的视频内容。
尽管技术不断进步,团队强调Sora仍在不断完善中,尚未成为一个完全成熟的产品。他们正在积极收集用户反馈以改进模型,但目前尚未设定市场发布时间表。
关于Sora的训练数据,团队澄清模型是基于公开数据和OpenAI授权数据的组合,确保在创新与数据使用合规性之间取得平衡。
行业专家对Sora的潜力表示高度关注,虽然也意识到其局限性。电影插画师瑞德·索森指出,尽管AI工具在视频制作上取得了进展,但目前的工具依然无法完全取代人类创作者,特别是在复杂的电影制作过程中,AI在时间一致性和身体动作等方面仍面临挑战。
尽管如此,Sora标志着OpenAI在文本到视频技术领域的重要进展,未来的发展备受期待。随着技术的不断演进,团队将继续提升模型,Sora有望带来更令人振奋的成果。我们期待行业专家和爱好者在反馈与改进过程中积极参与,共同推动这一创新领域的发展。