Google presenta Imagen 3: El modelo definitivo de texto a imagen, ahora en vista previa privada.

Google está a punto de lanzar una impresionante actualización de su modelo de texto a imagen, Imagen 3, que promete un mayor nivel de detalle, una mejor comprensión del lenguaje natural y una superior representación del texto. Actualmente, está disponible para creadores selectos en una vista previa privada en ImageFX, y los desarrolladores pueden unirse a una lista de espera para acceder a él. Además, se espera que Imagen 3 se integre en Vertex AI.

“Este es nuestro modelo de generación de imágenes más avanzado hasta la fecha,” afirmó Douglas Eck, Director de Investigación de Google DeepMind, durante la conferencia de desarrolladores I/O. “Imagen 3 ofrece un mayor fotorealismo, detalles más ricos y significativamente menos artefactos visuales o distorsiones. Comprende las indicaciones de manera conversacional: cuanto más creatividad y detalle aportes, mejor será el resultado. Imagen 3 destaca en la incorporación de elementos sutiles en indicaciones más largas y representa nuestro mejor esfuerzo hasta ahora en la representación del texto, un desafío común para los modelos de generación de imágenes.”

El anuncio llega solo seis meses después de que Google hiciera disponible Imagen 2 en Vertex AI, tras el lanzamiento anterior de capacidades de texto a vivo en abril. Mantenerse a la vanguardia en el competitivo panorama de herramientas de generación de imágenes AI, como DALL-E de OpenAI, Midjourney, Firefly de Adobe, AI de Meta y Designer de Microsoft, es crucial para Google.

Sin embargo, el camino de Google en este ámbito no ha estado exento de desafíos. A principios de este año, la empresa enfrentó críticas por sus imágenes generadas por IA, que algunos críticos calificaron de “demasiado woke.” Esto incluyó representaciones de los Padres Fundadores de EE.UU. con un hombre negro y soldados alemanes de la Segunda Guerra Mundial junto a un hombre negro y una mujer asiática. Google reconoció el error, y el CEO Sundar Pichai reafirmó la disculpa durante una entrevista con Bloomberg.

La presentación de Imagen 3 es una de varias actualizaciones emocionantes de Google I/O, que también incluye el lanzamiento de un nuevo modelo de generación de video, Veo.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles