Imagen 3 de Google: Modelo de Fundación Mejorado de Texto a Imagen Ahora Disponible en Vertex AI

El avanzado modelo de generación de imagen a partir de texto de Google, Imagen 3, está a punto de ser lanzado en la plataforma Vertex AI. Esta herramienta de inteligencia artificial de próxima generación estará disponible en vista previa para selectos clientes, ofreciendo a los desarrolladores una generación de imágenes más rápida, una mejor comprensión de solicitudes y representaciones más fotorrealistas de personas, además de capacidades de renderizado de texto mejoradas en comparación con versiones anteriores.

Inicialmente presentado en Google I/O en mayo, Imagen 3 comenzó su trayectoria con una vista previa privada en ImageFX para creadores selectos. El anuncio de Google confirmó que este potente modelo de IA estará pronto accesible a través de Vertex AI.

Douglas Eck, director de investigación senior en Google DeepMind, destacó sus capacidades al afirmar: “Es nuestro modelo de generación de imágenes más potente hasta la fecha. Imagen 3 es más fotorrealista, rica en detalles y minimiza los artefactos visuales. Comprende solicitudes elaboradas de manera natural y creativa; las instrucciones detalladas generan los mejores resultados. Además, sobresale al incorporar sutilezas de solicitudes más largas y mejora el renderizado de texto, un desafío persistente en modelos anteriores de generación de imágenes.”

Con la transición a Vertex AI, Imagen 3 introduce soporte multilingüe, robustas características de seguridad como la marca de agua digital SynthID de Google DeepMind y soporte para varias relaciones de aspecto.

Shutterstock, líder en fotografía de stock, ya ha integrado este modelo. Justin Hiza, vicepresidente de servicios de datos en Shutterstock, comentó: “Desde que incorporamos Imagen a nuestro generador de imágenes de IA, nuestros usuarios han creado millones de imágenes. Estamos entusiasmados con las mejoras que ofrece Imagen 3, permitiendo a los usuarios materializar sus ideas más rápidamente sin comprometer la calidad. Esta mejora refuerza aún más el compromiso de Shutterstock con un generador de imágenes de IA éticamente obtenido, asegurando seguridad y protección a través de la indemnización de Google Cloud para la IA generativa.”

Mientras Google continúa evolucionando Imagen, no ha revelado cuándo reiniciará la generación de imágenes de Gemini tras críticas sobre imprecisiones. Durante una reciente rueda de prensa, el CEO de Google Cloud, Thomas Kurian, aclaró la diferencia entre los dos modelos: “Gemini es un modelo multimodal diseñado para procesar diversos tipos de entrada, incluidas imágenes, video y audio, permitiendo razonamientos a través de estas modalidades. En contraste, Imagen es un modelo de difusión enfocado únicamente en generar salidas de texto a imagen de alta fidelidad. Cumplen propósitos distintos.”

Las preguntas sobre la fecha para reactivar la funcionalidad de imágenes de Gemini siguen sin respuesta.

Most people like

Find AI tools in YBX