蘋果推出「Keyframer」:一款利用大語言模型(LLMs)將靜態圖像轉化為動態動畫的人工智慧工具

蘋果的研究人員推出了一款名為「Keyframer」的創新人工智慧工具,利用大型語言模型(LLMs)根據自然語言提示為靜態圖像進行動畫處理。這項於 arxiv.org 上發表的研究論文《Keyframer: Empowering Animation Design using Large Language Models》標誌著將人工智慧融入創意工作流程的重要進展,可能會影響未來蘋果的產品,如 iPad Pro 和 Vision Pro。

Keyframer 由大型語言模型 GPT-4 提供支持,能根據靜態 SVG 圖像和文本提示生成 CSS 動畫代碼。研究指出,應用 LLMs 於動畫設計的挑戰在於如何讓用戶有效地用自然語言描述動作。

想像一下,您是一位動畫師,手中有靜態圖像和敘事,但在 iPad 上花幾小時進行動畫製作的前景令人退卻。這時,Keyframer 便可以派上用場:只需幾句簡潔的描述,您的圖像便會在螢幕上栩栩如生,彷彿您的想法被蘋果的 LLMs 無縫詮釋。

這款工具允許用戶上傳 SVG 圖像,輸入類似「讓雲朵慢慢向左漂移」的提示,並獲得生成的動畫代碼。用戶可以進一步通過編輯 CSS 代碼或添加新提示來完善動畫。論文指出,「Keyframer 通過提示和直接編輯生成輸出相結合,支持動畫的探索與完善。」這種以用戶為中心的方法經過與專業動畫師和工程師的訪談塑造,突顯了迭代設計和創造力的重要性。

一位參與者表示:「我覺得這比我之前使用的許多方法快得多……我以前在類似的任務上會花上幾個小時。」

Keyframer 鼓勵用戶採用迭代的“分解”提示設計方法,根據 AI 的反應調整目標。研究人員指出:「Keyframer 使得用戶能夠通過序列性提示迭代完善設計,而不是必須一次考量整體設計。」直接代碼編輯的功能則提供了詳細的創意控制。

儘管 AI 動畫工具能夠使設計民主化,但對於失去創意控制的擔憂仍然存在。Keyframer 通過將提示與編輯相結合,努力平衡可及原型設計與用戶自主性。

「通過這項工作,我們希望激發未來融合 LLMs 生成能力與動態編輯器的動畫設計工具,讓創作者保留對設計的控制權。」研究人員總結道。

Keyframer 有望徹底改變動畫領域,使其對各類創作者更加可及,賦予非專業人士讓原本需要豐富技術技能的故事動起來的能力。這標誌著創意過程的轉變,AI 正逐漸成為合作夥伴。

Keyframer 的廣泛影響可能引發文化變革,讓 AI 成為創意體驗中更直觀的一部分。這項進展不僅是技術的前進,更是重塑我們與數位領域互動方式的催化劑。蘋果推出的 Keyframer 可能預示著一個新時代的來臨,創造者與創作之間的界限愈發模糊,並受到人工智慧能力的引導。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles