Google präsentiert Imagen 3: Das ultimative Text-zu-Bild-Modell jetzt in der privaten Vorschau

Google wird ein beeindruckendes Update seines Text-zu-Bild-Modells, Imagen 3, vorstellen, das verbesserte Details, ein besseres Verständnis natürlicher Sprache und eine überlegene Textdarstellung verspricht. Aktuell steht es ausgewählten Creators in einer privaten Vorschau auf ImageFX zur Verfügung, und Entwickler können sich für den Zugang auf eine Warteliste setzen lassen. Zudem wird erwartet, dass Imagen 3 in Vertex AI integriert wird.

„Dies ist unser bislang fortschrittlichstes Modell zur Bildgenerierung“, sagte Douglas Eck, Senior Research Director von Google DeepMind, während der I/O-Entwicklerkonferenz des Unternehmens. „Imagen 3 bietet mehr Fotorealismus, reichhaltigere Details und deutlich weniger visuelle Artefakte oder Verzerrungen. Es versteht Eingaben in konversationaler Weise – je mehr Kreativität und Details Sie liefern, desto besser ist das Ergebnis. Imagen 3 glänzt darin, subtile Elemente in längeren Eingaben zu integrieren, und repräsentiert unser bestes Ergebnis beim Rendern von Text, was für Bildgenerationsmodelle eine häufige Herausforderung darstellt.“

Die Ankündigung erfolgt nur sechs Monate, nachdem Google Imagen 2 umfassend auf Vertex AI verfügbar gemacht hat, nachdem im April erste Text-zu-Live-Funktionen eingeführt wurden. Im wettbewerbsintensiven Bereich der KI-Bildgenerierungstools – wie OpenAIs DALL-E, Midjourney, Adobes Firefly, Metas KI und Microsofts Designer – ist es für Google entscheidend, an der Spitze zu bleiben.

Allerdings war Googles Weg in diesem Bereich nicht ohne Herausforderungen. Anfang des Jahres musste das Unternehmen Gegenwind wegen seiner KI-generierten Bilder einstecken, die von einigen Kritikern als „zu woke“ bezeichnet wurden. Dazu gehörten Darstellungen der amerikanischen Gründerväter mit einem Schwarzen Mann sowie von deutschen Soldaten aus dem Zweiten Weltkrieg neben einem Schwarzen Mann und einer asiatischen Frau. Google erkannte den Fehler an, und CEO Sundar Pichai bekräftigte die Entschuldigung in einem Interview mit Bloomberg.

Die Enthüllung von Imagen 3 ist eine von mehreren aufregenden Neuerungen von Google I/O, zu denen auch die Einführung eines neuen Video-Generierungsmodells namens Veo gehört.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles