年初,OpenAI发布的Sora视频生成器引起了全球的关注,因其突破性地能够根据文本提示生成视频,激起了有关其对好莱坞未来影响的广泛讨论。然而,Shy Kids艺术团队在深入研究Sora的制作过程后,发现了其实际应用中的复杂性和挑战。
Sora是一种先进的扩散模型,可以根据文本提示生成最长达一分钟的逼真视频,并实现无缝场景切换和构图调整。然而,在实际的电影制作中,Sora未能如最初所承诺的那样提供惊艳的效果,反而暴露出更多复杂的问题。
在与fxguide的采访中,Shy Kids团队指出,虽然Sora在图像生成上取得了显著进展,但对于复杂项目,它仍然需要人工指导和大量编辑,以满足导演的特定要求。将Sora融入创作过程确实具有创新性,但并非必不可少。
Sora的用户界面相对简单,仅允许文本输入,这在一定程度上限制了艺术家的创造力。尽管该工具在保持镜头内部对象一致性方面表现出色,但在不同场景之间的内容匹配上却显得乏力,影响了整体连贯性。因此,艺术家需要在文本提示中仔细描述场景,包括角色的服装和道具等方面。尽管进行了这些努力,Sora在控制镜头一致性方面仍存在局限性。
此外,Sora隐含的镜头生成方法也挑战了艺术家的理解和创造力。艺术家必须掌握Sora对特定概念的隐含解释,以准确撰写文本提示。例如,请求生成包含香蕉的场景时,艺术家必须考虑香蕉的颜色和形状等隐含特征,以确保生成的视频符合预期。
总之,尽管Sora在视频生成领域展现了巨大潜力,但在现实应用中面临诸多挑战。随着技术的不断发展和进步,Sora在未来的电影制作中有望引领更多创新与变革。