Google ha presentado importantes actualizaciones en su familia de modelos de generación de imágenes, incluyendo Imagen 2, que ahora cuenta con capacidades de texto a animación, permitiendo a los usuarios convertir textos en imágenes animadas. El modelo también introduce nuevas funciones de edición de imágenes—como inpainting, outpainting y marcas de agua digitales—ya disponibles para uso general.
Anunciada en la conferencia Google Cloud Next, la funcionalidad de texto a animación de Imagen 2 genera GIFs animados inicialmente a 24 fotogramas por segundo, con una resolución de 360x640 píxeles y una duración de cuatro segundos. Google ha indicado que tiene planes para mejoras continuas en esta característica.
Durante una rueda de prensa, el CEO de Google Cloud, Thomas Kurian, explicó: “En lugar de tener una imagen estática de un objeto, como un automóvil, los usuarios pueden ahora ver una breve animación de un vehículo en movimiento. Las organizaciones, especialmente en los medios y la publicidad, están adoptando esta tecnología para aumentar el compromiso del usuario”.
Imagen 2 está diseñada para crear imágenes desde varios ángulos de cámara y movimientos, asegurando la consistencia en toda la secuencia de animación. También incorpora filtros de seguridad y marcas de agua digitales, abordando preocupaciones clave relacionadas con la IA generativa.
Las nuevas funciones de edición de imágenes permiten a los usuarios añadir o eliminar elementos de las fotos, similar a las herramientas de relleno generativo o de corrección de contenido de Adobe Photoshop. Los usuarios también pueden ampliar los bordes de la imagen para obtener una vista más amplia.
Estas actualizaciones forman parte de los anuncios de Google sobre Vertex AI, su plataforma de IA en la nube totalmente gestionada. Lanzado en 2023, Imagen 2 es un producto de Google DeepMind, creado para generar imágenes fotorealistas y de alta resolución a partir de indicaciones en lenguaje natural. Compite con otros modelos líderes como DALL-E de OpenAI, Midjourney y Adobe Firefly, específicamente dirigidos a ayudar a las empresas a producir imágenes que cumplan con las directrices de marca y los estándares de gobernanza.