El arte generado por IA ha emergido rápidamente como una de las aplicaciones más fascinantes y populares de la nueva tecnología, atrayendo a millones de usuarios a plataformas como Stable Diffusion y Midjourney. Recientemente, OpenAI ha integrado su modelo de generación de imágenes DALL-E 3 en el popular servicio de ChatGPT, facilitando más que nunca la generación de imágenes. Al ingresar simplemente una descripción, los usuarios pueden observar cómo los algoritmos de IA transforman sus ideas en arte visual en cuestión de momentos. Sin embargo, en nuestro mundo acelerado, esperar siquiera unos segundos para la generación de imágenes puede sentirse tedioso.
Esta semana, la comunidad de arte digital impulsada por IA está alborotada por una técnica de aprendizaje automático revolucionaria, conocida como LCM-LoRA, o Modelo de Consistencia Latente y Adaptación de Bajo Rango. Desarrollada por investigadores de la Universidad de Tsinghua y la plataforma de intercambio de código HuggingFace, esta técnica permite la creación de arte generado por IA en tiempo real.
¿En términos prácticos, qué significa esto? Echa un vistazo a los videos compartidos por artistas de IA en X y LinkedIn para verlo en acción. Con LCM-LoRA, los usuarios pueden esbozar formas simples o dibujos de figuras de palo junto a un texto descriptivo, y aplicaciones de creación de arte como Krea.AI y Fal.AI generarán instantáneamente nuevas obras. La imaginería puede ser alterada casi de inmediato mientras los usuarios manipulan sus formas y dibujos en el lienzo digital. Puedes probarlo tú mismo en Fal.AI (si el sitio se mantiene estable durante el aumento del tráfico).
La técnica LCM-LoRA funciona tanto para imágenes 2D como para activos 3D, permitiendo a los artistas crear entornos inmersivos rápidamente para aplicaciones de realidad aumentada (AR), realidad virtual (VR), videojuegos y, potencialmente, producción cinematográfica, acelerando significativamente el proceso creativo y reduciendo costos. “Todo va a cambiar”, afirmó un fundador de startup y exingeniero de IA en Google en LinkedIn, un sentimiento compartido por muchos en la comunidad de artes de IA. Otro usuario en X comentó: “Una nueva era del arte generativo está a punto de desatarse”. El profesor Ethan Mollick de la Wharton School of Business expresó que “pronto veremos muchas nuevas experiencias de usuario” gracias a esta técnica.
¿Qué es LCM-LoRA y cómo funciona? Las primeras demostraciones de la integración de LCM-LoRA en aplicaciones son realmente atractivas, indicando un posible punto de inflexión para la IA generativa en las artes visuales. Entonces, ¿cuál es la innovación tecnológica detrás de LCM-LoRA? Según los investigadores, LCM-LoRA es un “módulo de aceleración universal sin entrenamiento”, que puede integrarse en varios modelos ajustados de Stable Diffusion.
En términos más simples, se trata de un algoritmo que acelera el proceso de convertir texto o imágenes en nuevas obras de arte generadas por IA utilizando el popular modelo de código abierto Stable Diffusion y sus versiones modificadas. LCM-LoRA logra esto reduciendo los "pasos de muestreo" necesarios que el modelo de IA debe seguir para transformar texto o imágenes de origen en una imagen de mayor calidad. Esto significa que permite a los modelos de Stable Diffusion operar más rápidamente con menos recursos computacionales, lo que resulta en salidas impactantes en tiempo real.
La naturaleza "universal" de LCM-LoRA implica que es compatible con diferentes aplicaciones que dependen de Stable Diffusion. Aún está por verse si podrá adaptarse a modelos propietarios como DALL-E 3 de OpenAI o Midjourney. Hemos contactado a uno de los autores del trabajo sobre LCM-LoRA para obtener más información y actualizaremos este artículo a medida que dispongamos de más detalles.