Gemini startet Relaunch von KI-generierten Bildern von Personen mit dem verbesserten Imagen 3 Update.

Google führt verbesserte Generative AI-Tools ein: Imagen 3 und Gems

Google erweitert seine generativen KI-Tools und startet in dieser Woche mit der Einführung von Imagen 3, der nächsten Generation seines Bildgenerators. Dieses Update bringt die zuvor entfernte Möglichkeit zurück, KI-generierte Bilder von Personen zu erstellen, und überwindet damit frühere Kontroversen zu diesem Thema. Zusätzlich beinhaltet Googles neuer Gemini-Chatbot jetzt die Funktion „Gems“, mit der Benutzer maßgeschneiderte Bots mit individuellen Anweisungen erstellen können, ähnlich den benutzerdefinierten GPTs von ChatGPT.

Imagen 3: Verbesserte Bildgenerierung

Imagen 3 setzt neue Maßstäbe in der Bildqualität und verfügt über integrierte Schutzmechanismen, um Probleme mit Diversität zu vermeiden, die frühere Versionen beeinträchtigt hatten. Laut Gemini-Produktmanager Dave Citron „schneidet Imagen 3 in einer Vielzahl von Benchmarks im Vergleich zu anderen Bildgenerierungsmodellen vorteilhaft ab.“ Das aktualisierte Tool ermöglicht es den Benutzern, die Bilderstellung mit zusätzlichen Eingaben zu steuern, falls das erste Ergebnis nicht den Erwartungen entspricht.

Das neue Modell integriert auch Googles SynthID-Technologie, um Bilder zu kennzeichnen und deutlich als KI-generiert zu kennzeichnen, um Verwechslungen mit echten Fotografien zu vermeiden. Citron bestätigte, dass die Möglichkeit, Bilder von Personen zu erstellen, bald für zahlende Nutzer verfügbar sein wird, wobei Sicherheitsmaßnahmen verhindern, dass „fotorealistische, identifizierbare Personen“ oder Bilder mit Kindern sowie grafische, gewalttätige oder sexuelle Inhalte generiert werden. Auch wenn die Bilder von Gemini nicht perfekt sein mögen, versicherte er den Nutzern, dass das Unternehmen das Modell weiterhin auf Basis von Feedback verfeinern wird.

Einführung von Gems: Maßgeschneiderte Chatbots für verbesserte Funktionalität

Gems, die erstmals auf der Google I/O 2024 vorgestellt wurden, ermöglichen es Nutzern, benutzerdefinierte Chatbots für spezifische Aufgaben zu erstellen. Diese Funktion bietet eine Lösung für Benutzer, die Unterstützung bei Projekten, Brainstorming-Sitzungen oder beim Erstellen von Social-Media-Untertiteln benötigen. Citron betonte: „Ihr Gem kann einen detaillierten Satz von Anweisungen speichern, um Ihnen Zeit bei mühsamen, repetitiven oder anspruchsvollen Aufgaben zu sparen.“

Um die Benutzerinteraktion zu fördern, wird Gemini auch vorgefertigte Gems anbieten, die Kreativität anregen und Arbeitsabläufe optimieren. Einige der verfügbaren vorgefertigten Gems umfassen:

- Learning Coach: Hilft beim Verständnis komplexer Themen.

- Brainstormer: Regt zu neuen Ideen für Projekte an.

- Career Guide: Unterstützt bei Skill-Upgrades und Karriereentscheidungen.

- Writing Editor: Bietet konstruktives Feedback zur Grammatik und Struktur.

- Coding Partner: Hilft Entwicklern, ihre Programmierkenntnisse zu verbessern und neue Projekte zu inspirieren.

Gems werden ab heute für Desktop und Mobile ausgerollt, sind jedoch aktuell nur für Gemini Advanced-, Business- und Enterprise-Abonnenten zugänglich. Um diese innovativen Funktionen nutzen zu können, müssen Benutzer einen kostenpflichtigen Plan wählen.

Durch die Verbesserung seiner KI-Fähigkeiten zielt Google darauf ab, intuitivere und effektivere Werkzeuge bereitzustellen, um dem wachsenden Bedarf an anspruchsvoller generativer Technologie gerecht zu werden.

Most people like

Find AI tools in YBX