Google stellt neue KI-Modelle zur Erstellung von Inhalten vor: Einblicke in Veo und Imagen 3

Auf der diesjährigen Google I/O-Konferenz stellte Google seine neuesten KI-Medienproduktionswerkzeuge vor – Veo und Imagen 3. Veo ist in der Lage, hochwertige 1080p-Videos zu erstellen, während Imagen 3 das neueste Framework zur Generierung von Bildern aus Text repräsentiert. Obgleich diese Produkte die Branche nicht revolutionieren werden, helfen sie Google, sich im Wettbewerb gegenüber OpenAIs Sora-Video-Modell und DALL-E 3 einen Vorteil zu verschaffen.

Google behauptet, dass Veo über ein "tiefes Verständnis natürlicher Sprache und visueller Semantik" verfügt, was es ihm ermöglicht, Videos von über einer Minute basierend auf Benutzerbeschreibungen zu erzeugen. Außerdem versteht es Konzepte im Zusammenhang mit Filmemachen und visueller Technologie, wie Zeitrafferfotografie, die wesentliche Merkmale für KI-Video-Generierungsmodelle geworden sind.

Um die Fähigkeiten von Veo zu demonstrieren, arbeitete Google mit Donald Glover und seinem Kreativstudio Gilga zusammen, um ein Werbevideo zu produzieren, das Szenen einer Cabrio-Fahrt und des Segelns zeigt, die beide aus Textbeschreibungen generiert wurden. Laut Google übertrifft Veo frühere Modelle in der Simulation realer physikalischer Phänomene und der Erstellung hochauflösender Bilder. Glover bemerkte im Video: „Jeder sollte Regisseur sein; das Erzählen von Geschichten füreinander wird unser Verständnis erweitern.“

Ob das Publikum KI-generierte Videos annehmen wird – hauptsächlich getrieben von Neugier über Maschinen, die menschliche Kunst neu erschaffen – bleibt ungewiss. Das hält Google und OpenAI jedoch nicht davon ab, ihre Werkzeuge zu bewerben. Veo ist nun über Googles VideoFX-Tool für ausgewählte Kreatoren zugänglich und soll auf Plattformen wie YouTube Shorts eingeführt werden. Einmal in YouTube Shorts integriert, könnte es Googles Wettbewerbsposition gegenüber TikTok erheblich stärken.

Bezüglich Imagen 3 betont Google, dass es sich um das "hochwertigstens" Modell zur Generierung von Bildern aus Text handelt, das "realistische und lebensechte" Bilder bei gleichzeitiger Minimierung von Artefakten erzeugt. Die wahre Herausforderung besteht im Vergleich zu DALL-E 3, wobei Google angibt, dass Imagen 3 bei der Verarbeitung von Text und längeren Eingaben intelligenter ist.

Zusätzlich hat Google mit den Musikern Wyclef Jean und Bjorn zusammengearbeitet, um sein Musik-KI-Sandbox-Tool zu testen, das bei der Erstellung von Songs und Beats helfen soll. Obwohl die bisher gezeigten Inhalte kurz waren, zeigen sie einige interessante Beispiele.

Von Sonnenaufgängen bis hin zu menschlichem Altern wird die KI zunehmend intelligenter. Die neuesten Medienproduktionswerkzeuge von Google entwickeln sich in diese Richtung. Mit Milliardeninvestitionen in Künstliche Intelligenz will Google den nächsten Durchbruch in der Computertechnologie anführen. Das zukünftige Potenzial dieser Technologien, das Leben zu bereichern oder seelenvolle Kunst zu schaffen, bleibt ein wichtiges Thema, das es zu beobachten gilt.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles