Los investigadores de Apple han presentado "Keyframer", una innovadora herramienta de IA que utiliza modelos de lenguaje grandes (LLMs) para animar imágenes estáticas basadas en indicaciones en lenguaje natural. Esta aplicación revolucionaria, presentada en un artículo de investigación en arxiv.org titulado “Keyframer: Empowering Animation Design using Large Language Models”, representa un importante avance en la integración de la inteligencia artificial en flujos de trabajo creativos, influyendo potencialmente en futuros productos de Apple como el iPad Pro y Vision Pro.
Keyframer está potenciado por un modelo de lenguaje grande, específicamente GPT-4, que genera código de animación CSS a partir de imágenes SVG estáticas y textos descriptivos. La investigación destaca los desafíos de aplicar LLMs en la animación, especialmente en cómo los usuarios pueden describir el movimiento de manera efectiva en lenguaje natural.
Imagina ser un animador con una idea en mente. Tienes imágenes estáticas y una narrativa, pero la perspectiva de pasar horas animando en un iPad puede ser abrumadora. Con Keyframer, con solo unas pocas frases concisas, tus imágenes cobran vida en la pantalla, como si tus ideas fueran interpretadas sin esfuerzo por los LLMs de Apple.
La herramienta permite a los usuarios subir una imagen SVG, ingresar un comando como “Haz que las nubes se desplacen lentamente hacia la izquierda” y recibir el código de animación generado. Los usuarios pueden refinar aún más las animaciones editando el código CSS o añadiendo nuevas indicaciones. El artículo señala que “Keyframer apoya la exploración y refinamiento de animaciones mediante una combinación de indicaciones y edición directa del resultado generado.” Este enfoque centrado en el usuario fue influenciado por entrevistas con animadores profesionales e ingenieros, destacando la importancia del diseño iterativo y la creatividad.
“Creo que esto fue mucho más rápido que muchos métodos que he utilizado… Antes hubiera pasado horas en tareas similares,” comentó un participante.
Keyframer anima a los usuarios a adoptar un enfoque iterativo y “descompuesto” en el diseño de indicaciones, lo que les permite ajustar sus objetivos en función de las respuestas de la IA. “Keyframer permitió a los usuarios refinar iterativamente sus diseños a través de indicaciones secuenciales, en lugar de tener que considerar todo el diseño de una vez,” recalcan los investigadores. Las funciones de edición de código directo proporcionan un control creativo detallado.
Si bien las herramientas de animación con IA pueden democratizar el diseño, persisten preocupaciones sobre la pérdida del control creativo. Keyframer busca equilibrar la creación accesible de prototipos con la autonomía del usuario mediante la combinación de indicaciones y edición.
“A través de este trabajo, esperamos inspirar futuras herramientas de diseño de animación que combinen las capacidades generativas de los LLMs con editores dinámicos, permitiendo a los creadores mantener el control sobre sus diseños,” concluyen los investigadores.
Keyframer tiene el potencial de revolucionar el panorama de la animación, haciéndolo más accesible para una amplia gama de creadores y empoderando a no expertos para animar historias que anteriormente requerían habilidades técnicas extensas. Esto marca un cambio en el proceso creativo, donde la IA emerge como un socio colaborativo.
Las implicaciones más amplias de Keyframer podrían inaugurar un cambio cultural, convirtiendo la IA en una parte más intuitiva de la experiencia creativa. Este avance no solo representa un paso tecnológico hacia adelante, sino que actúa como un catalizador para redefinir nuestra interacción con el ámbito digital. La introducción de Keyframer por parte de Apple podría señalar el inicio de una nueva era donde la distinción entre creador y creación se desdibuja, guiada por las capacidades de la inteligencia artificial.