Ideogram verbessert den KI-Bildgenerator mit beschreibungsbasiertem Referenzieren für optimierte Ergebnisse.

Etwas mehr als einen Monat nach der Einführung seines fortschrittlichen Text-zu-Bild-Modells hat Ideogram ein Update veröffentlicht, das mehrere neue Funktionen einführt, darunter beschreibungsbasiertes Referenzieren und negatives Prompting. Diese Verbesserungen auf der Webplattform von Ideogram zielen darauf ab, den Nutzern mehr Kontrolle über die Bildgestaltung zu geben und gleichzeitig die Qualität und Kohärenz der Ergebnisse zu verbessern. Dieses Update stellt einen bedeutenden Schritt dar, um mit etablierten Wettbewerbern im Bereich der Bildgenerierung, wie Midjourney und DALL-E, zu konkurrieren.

Was gibt es Neues bei Ideogram?

Mit dem ursprünglich im Februar veröffentlichten Update 1.0 erhielten die Nutzer Zugriff auf eine "Magic Prompt"-Funktion, die ihre Eingaben bereicherte. Darauf aufbauend hat Ideogram nun eine neue Funktion namens "Describe" eingeführt, die Bildbeschreibungen aus Referenzbildern generiert. Nutzer können entweder ein öffentliches Bild von Ideogram oder ihr eigenes hochladen, woraufhin die KI eine textbasierte Beschreibung erstellt, die angepasst werden kann, um ein ähnliches Bild nach spezifischen Bedürfnissen zu erzeugen.

Darüber hinaus führt Ideogram negatives Prompting ein, das es den Nutzern ermöglicht, anzugeben, was sie in ihren Ergebnissen nicht wünschen. Diese Funktion hilft, bestimmte Objekte oder Stile aus der finalen Generation zu eliminieren. Zudem können die Nutzer zwischen den Ausgabe-Modi "Schnell", "Standard" oder "Qualität" wählen. Der Schnell-Modus erzeugt einfache Bilder in etwa fünf Sekunden, während der Qualitäts-Modus auf Photorealismus in rund zwanzig Sekunden fokussiert. Der Standard-Modus bietet einen Kompromiss und generiert Bilder in etwa zwölf Sekunden.

Obwohl die Nutzerakzeptanz dieser Modi noch abzuwarten bleibt, ermutigt Ideogram, diese Optionen zu nutzen, um schnell ein Basisbild zu erstellen und es dann für qualitativ hochwertigere Ergebnisse zu verfeinern.

Verbesserter Photorealismus und Textdarstellung

Ideogram optimiert auch die Textdarstellungsfähigkeiten und verzeichnet eine Reduzierung der Fehlerrate um 15 %. Obwohl diese Veränderung geringfügig erscheinen mag, behauptet das Unternehmen, dass es DALL-3 Vivid in der Generierung von Zeichen und Wörtern übertrifft. Obwohl keine Statistiken zum Vergleich des aktualisierten Modells mit Midjourney veröffentlicht wurden, versichert Ideogram, dass die neueste Version eine verbesserte Bildkohärenz und Photorealismus bietet, mit menschlichen Bewertern, die sie 30-50 % häufiger als den Vorgänger in Bezug auf Prompt-Ausrichtung, Bildkohärenz und Textdarstellungsqualität bevorzugen. Seit dem Start der öffentlichen Beta im letzten Jahr hat Ideogram über sieben Millionen Creator angezogen.

Derzeit sind negatives Prompting und Geschwindigkeitsmodi exklusiv für Nutzer der Basic- und Plus-Pläne von Ideogram verfügbar. Die Verfügbarkeit der Bildbeschreibung durch Referenzbilder bleibt unklar, könnte jedoch kostenlos sein, ähnlich wie die Remix-Funktion. Die Verbesserungen in der Text- und Bildkohärenz sind für alle Nutzer zugänglich.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles