苹果推出“关键帧”:一款利用大语言模型将静态图片转化为动态动画的AI工具

苹果研究者推出了一款名为“Keyframer”的创新AI工具,该工具利用大型语言模型(LLMs)根据自然语言提示为静态图像动画化。这项开创性的应用在arxiv.org上发布的研究论文《Keyframer: Empowering Animation Design using Large Language Models》中进行了详尽介绍,标志着人工智能在创意工作流程中的重大进步,可能会影响未来的苹果产品,如iPad Pro和Vision Pro。

Keyframer以大型语言模型GPT-4为基础,从静态SVG图像和文本提示中生成CSS动画代码。研究指出,将LLMs应用于动画设计所面临的挑战,尤其是在用户如何有效描述运动方面。

想象一下,作为一名动画师,你有一个概念。你手上有静态图像和叙事,但在iPad上花费数小时进行动画制作的想法可能令人畏惧。这时,Keyframer登场了:只需几句简洁的描述,你的图像便如同在屏幕上栩栩如生,仿佛你的想法被苹果的LLMs无缝转化。

用户可以上传SVG图像,输入诸如“让云慢慢向左飘”的提示,然后获取生成的动画代码。用户还可以通过编辑CSS代码或添加新提示来进一步完善动画。论文中提到:“Keyframer通过提示与直接编辑生成的输出相结合,支持动画的探索和细化。”这种以用户为中心的方法是通过与专业动画师和工程师的访谈形成的,强调了迭代设计和创意的重要性。

“我觉得这比我用过的许多方法要快得多……我之前在类似任务上可能会花费数小时,”一位参与者如是说。

Keyframer鼓励用户采用迭代的“分解”提示设计方法,使他们能够根据AI的反馈调整目标。研究人员指出:“Keyframer使用户能够通过逐步提示反复完善其设计,而不是一次性考虑整个设计。”直接代码编辑的功能提供了详细的创意控制。

虽然AI动画工具有可能使设计变得更加普及,但对失去创意控制的担忧依然存在。Keyframer试图在便捷原型设计和用户自主性之间取得平衡,通过将提示与编辑相结合的方式实现。

“通过这项工作,我们希望激励未来的动画设计工具,将LLMs的生成能力与动态编辑器结合,使创作者能够保持对其设计的控制,”研究人员总结道。

Keyframer有望彻底改变动画领域,使其对各种创作者更加可及,赋予非专业人员讲述以往需要丰富技术技能的故事的能力。这标志着创意过程的转变,AI作为一种协作伙伴正在崭露头角。

Keyframer的更广泛影响可能会引发文化变革,使人工智能成为创作体验中更加直观的一部分。这一进步不仅是技术的前进,也是重新定义我们与数字世界互动方式的催化剂。苹果推出Keyframer可能预示着一个新时代的到来,创作者与创作之间的界限将被人工智能的能力模糊化。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles