애플 연구진이 "Keyframer"라는 혁신적인 AI 도구를 발표했습니다. 이 도구는 대규모 언어 모델(LLM)을 활용하여 자연어 프롬프트에 따라 정적 이미지를 애니메이션으로 변환합니다. arxiv.org에 발표된 연구 논문 "Keyframer: Empowering Animation Design using Large Language Models"는 인공지능이 창작 워크플로우에 통합되는 중대한 발전을 의미하며, 향후 아이패드 프로와 비전 프로 같은 애플 제품에 영향을 미칠 수 있습니다.
Keyframer는 정적 SVG 이미지와 텍스트 프롬프트에서 CSS 애니메이션 코드를 생성하는 GPT-4 모델에 기반하고 있습니다. 연구에서는 LLM을 애니메이션에 적용할 때의 도전 과제를 강조하며, 사용자들이 자연어로 움직임을 효과적으로 설명할 수 있는 방법을 논의합니다. 애니메이터로서 아이디어가 떠오른다고 가정해 보세요. 정적 이미지와 이야기에서 애니메이션을 만드는 데 오랜 시간을 할애해야 할 것 같으면 두려움이 클 수 있습니다. 그러나 Keyframer를 사용하면 간결한 문장 몇 개로 이미지가 화면에서 생생하게 살아나면서 애플의 LLM이 아이디어를 매끄럽게 해석하는 듯한 경험을 할 수 있습니다.
사용자는 SVG 이미지를 업로드하고 "구름이 천천히 왼쪽으로 떠다니게 해줘"와 같은 프롬프트를 입력하면 생성된 애니메이션 코드를 받을 수 있습니다. 사용자는 CSS 코드를 수정하거나 추가 프롬프트를 통해 애니메이션을 더욱 발전시킬 수 있습니다. 논문에서는 “Keyframer가 프롬프트와 생성된 출력을 직접 편집하는 조합을 통해 애니메이션 탐색과 개선을 지원한다”고 설명합니다. 이러한 사용자 중심 접근 방식은 전문 애니메이터 및 엔지니어와의 인터뷰를 통해 형성되어 디자인과 창의성의 반복적 과정의 중요성을 강조합니다.
한 참가자는 “이 방법이 내가 사용한 많은 방법보다 훨씬 빨랐습니다... 비슷한 작업을 하는 데 몇 시간을 소비했을 것입니다”라고 말했습니다. Keyframer는 사용자가 AI의 반응에 따라 목표를 조정할 수 있도록 프롬프트 디자인에서 반복적이고 “분해된” 접근 방식을 채택하도록 장려합니다. 연구원들은 “Keyframer는 사용자가 전체 디자인을 한 번에 고려할 필요 없이 순차적 프롬팅을 통해 디자인을 반복적으로 개선할 수 있도록 했다”고 말합니다. 직접적인 코드 편집 기능은 세밀한 창의적 제어를 제공합니다.
AI 애니메이션 도구가 디자인의 민주화를 촉진할 수 있지만, 창의적 통제의 상실에 대한 우려도 여전히 존재합니다. Keyframer는 프롬프트와 편집을 결합하여 사용자 에이전시와 접근 가능한 프로토타이핑 간의 균형을 추구합니다. “이 작업을 통해 우리는 LLM의 생성 능력을 동적 편집기와 결합한 향후 애니메이션 디자인 도구에 영감을 주기를 희망합니다. 이는 창작자가 자신의 디자인을 제어할 수 있게 합니다.”라고 연구원들은 결론지었습니다.
Keyframer는 애니메이션 환경을 혁신할 수 있는 잠재력을 지니고 있으며, 폭넓은 창작자들이 기술적 전문성이 크게 요구되지 않는 이야기를 애니메이션으로 풀어낼 수 있도록 돕습니다. 이는 AI가 협력적인 파트너로 떠오르며 창의적 과정의 변화를 나타냅니다. Keyframer의 더 넓은 의미는 AI가 창의적 경험의 보다 직관적인 일부가 되는 문화적 변화를 가져올 수 있습니다. 이 발전은 단순한 기술적 진전을 넘어 디지털 세계와의 상호작용 방식을 재정의하는 촉매제가 될 수 있습니다. 애플의 Keyframer 도입은 창작자와 창작물 간의 경계가 모호해지는 새로운 시대의 도래를 알리는 신호일 수 있습니다.