Si has estado siguiendo a influencers o creadores de IA en redes sociales, habrás notado un aumento de emoción en torno a un nuevo modelo de generación de videos de IA llamado “Kling”.
Kling produce videos altamente realistas a partir de indicaciones de texto y configuraciones en la aplicación, comparable al modelo AI de OpenAI, Sora, que actualmente está en beta cerrada y ha sido compartido de forma selectiva con algunos artistas y cineastas para pruebas, especialmente en el examen de su uso potencial controvertido. Recientemente, Kling demostró sus capacidades en YouTube al replicar “air head”, uno de los primeros videos creados con Sora por la agencia creativa Shy Kids.
¿Qué es Kling y cuáles son sus orígenes?
Según el South China Morning Post (SCMP), Kling fue desarrollado por Kuaishou Technology, la compañía detrás de Kuaishou, la segunda aplicación de videos cortos más popular de China (conocida como Kwai fuera de China), que cuenta con 400 millones de usuarios activos diarios (DAUs). Solo es superada por Douyin, la versión china de TikTok, que posee 600 millones de DAUs. Este alto nivel de interactividad hace que Kling sea especialmente atractivo, potencialmente mejorando la posición de Kuaishou frente a Douyin.
El SCMP señala que el modelo de IA de Kling, actualmente en fase de prueba, puede transformar texto en clips de video de hasta 2 minutos a resolución 1080p, soportando varios formatos de aspecto. Puede interpretar indicaciones para crear videos que reflejan escenarios del mundo real o escenas imaginativas. Según fuentes citadas por Perplexity, Kling utiliza un VAE (Autoencoder Variacional 3D) único para la reconstrucción facial y corporal, capturando expresiones y movimientos detallados a partir de una sola imagen de cuerpo completo. Esto se complementa con un mecanismo de atención conjunta espaciotemporal 3D, permitiendo que el modelo maneje escenas complejas mientras se adhiere a las leyes de la física.
¿Cómo acceder a Kling y cuál es su costo?
Kling es gratuito a través de las aplicaciones Kuaishou, Kwai y KwaiCut (esta última es un competidor de la edición de video de CapCut de TikTok). Sin embargo, los usuarios potenciales fuera de China pueden enfrentar problemas de accesibilidad; los informes sugieren que se requiere un número de teléfono chino para descargar y utilizar la aplicación. Justine Moore, socia de capital de riesgo en a16z, sugirió un truco utilizando un número de teléfono desechable a través de la aplicación KwaiCut. El cineasta estadounidense Dustin Hollywood también recomendó usar ChatGPT para traducir menús e interfaces de la aplicación para quienes no hablan chino.
Capacidades de Kling
Los primeros usuarios han reportado que Kling se destaca en la creación de videos inmersivos y realistas en alta resolución en varios géneros, desde secuencias de acción hasta recreaciones de videojuegos de disparos en primera persona y escenarios de alta fantasía similares a House of the Dragon o Game of Thrones. Dustin Hollywood menciona que generar un video basado en una indicación de “complejidad intermedia” toma alrededor de dos minutos. Sin embargo, señala algunas limitaciones, particularmente en la representación precisa de razas y tonos de piel, desafíos similares a los que enfrenta la generación de imágenes de IA de Google, Gemini.
A pesar de estos inconvenientes, Kling está causando un gran impacto en la comunidad cinematográfica, llevando a muchos, incluido Hollywood, a reconsiderar sus puntos de vista sobre Sora y la estrategia de distribución cautelosa de OpenAI.
El impacto de Kling en el panorama de videos IA
El surgimiento de Kling plantea interrogantes sobre su potencial para presionar a proveedores de modelos de video IA basados en EE.UU., como OpenAI, Runway y Pika, a mejorar sus productos en términos de calidad y resolución. Queda por ver si podrán adaptarse rápidamente para igualar o superar lo que ofrece Kling.
Para cualquier persona interesada en la producción cinematográfica de IA o la industria del cine en general, la introducción de Kling es sin duda un desarrollo emocionante. Esperamos un lanzamiento completo en EE.UU. sin las restricciones actuales relacionadas con la verificación del número de teléfono.