En la conferencia Google I/O de este año, Google presentó sus más recientes motores de creación de medios con inteligencia artificial: Veo e Imagen 3. Veo es capaz de producir videos de alta calidad en 1080p, mientras que Imagen 3 representa el nuevo marco para generar imágenes a partir de texto. Aunque estos productos pueden no revolucionar la industria, ayudan a Google a mantener una ventaja competitiva frente al modelo de video Sora de OpenAI y DALL-E 3.
Google afirma que Veo tiene una "profunda comprensión del lenguaje natural y la semántica visual", lo que le permite generar videos de más de un minuto basados en descripciones de los usuarios. También entiende conceptos relacionados con la cinematografía y la tecnología visual, como la fotografía en timelapse, que se han convertido en características esenciales para los modelos de generación de videos con IA.
Para mostrar las capacidades de Veo, Google se asoció con Donald Glover y su estudio creativo, Gilga, para producir un video promocional que presenta escenas de un viaje en coche descapotable y navegación, ambas generadas a partir de descripciones textuales. Según Google, Veo supera a modelos anteriores en la simulación de fenómenos físicos del mundo real y en la representación de visuales en alta definición. Glover comentó en el video: “Todos deberían ser directores; contar las historias de los demás mejorará nuestra comprensión”.
Aunque aún no está claro si el público aceptará los videos generados por IA, impulsados principalmente por la curiosidad de ver a las máquinas recrear el arte humano, esto no ha disuadido a Google y OpenAI de promover sus herramientas. Veo ya está disponible en la herramienta VideoFX de Google para creadores seleccionados y se planea su lanzamiento en plataformas como YouTube Shorts. Una vez integrado en YouTube Shorts, podría fortalecer significativamente la posición competitiva de Google frente a TikTok.
En cuanto a Imagen 3, Google asegura que es el modelo de "más alta calidad" de la compañía para generar imágenes a partir de texto, creando imágenes "realistas y vívidas" mientras minimiza los artefactos. Su verdadero desafío radica en la comparación con DALL-E 3, con Google afirmando que Imagen 3 es más inteligente al manejar textos y pedidos más largos.
Además, Google ha colaborado con los artistas musicales Wyclef Jean y Bjorn para probar su herramienta de IA musical, diseñada para ayudar en la creación de canciones y ritmos. Aunque los contenidos presentados hasta ahora han sido breves, han mostrado ejemplos intrigantes.
Desde amaneceres hasta el envejecimiento humano, la inteligencia artificial se vuelve cada vez más inteligente. Las últimas herramientas de creación de medios de Google avanzan en esta dirección. Con miles de millones invertidos en IA, Google aspira a liderar el próximo gran avance en tecnología informática. El potencial futuro de estas tecnologías para mejorar vidas o crear arte significativo sigue siendo un tema importante a seguir.