Meta, das Mutterunternehmen von Facebook und Instagram, hat bedeutende Fortschritte im Bereich der Künstlichen Intelligenz (KI) bei der Erstellung und Bearbeitung von Inhalten mit der Einführung von zwei neuen Funktionen erzielt: Emu Edit für die Bildbearbeitung und Emu Video für die Videogenerierung.
Beide Tools sind Teil von Metas Expressive Media Universe (Emu) Projekt, das im September angekündigt wurde, und markieren einen Wandel hin zu intuitiveren und kreativeren Funktionen für die sozialen Apps von Meta.
Emu Edit: Revolutionierung der Bildbearbeitung
Emu Edit bietet Nutzern fortschrittliche Steuerungsmöglichkeiten beim Bearbeiten von Bildern durch texteingabebasierte Anweisungen, ähnlich der „generativen Füllfunktion“ in Adobe Photoshop. Dieses innovative Tool überzeugt durch lokale und globale Bearbeitung, Hintergrundänderungen, Farb- und Geometrietransformationen sowie Objekterkennung und Segmentierung. Dabei sorgt Emu Edit dafür, dass Anpassungen auf relevante Bereiche beschränkt bleiben, während unrelated Pixels unberührt bleiben. „Der Schwerpunkt sollte darauf liegen, nur die für die Bearbeitung relevanten Pixel zu verändern“, betonen Metas Forscher.
Das Tool wurde auf einem umfangreichen Datensatz von 10 Millionen synthetischen Beispielen trainiert, sodass hochwertige Ergebnisse erzielt werden können. Ein Beispiel: Ein Nutzer könnte „Aloha!“ eingeben, um es zu einem Bild einer Baseballmütze hinzuzufügen, wobei Emu Edit die Ergänzung vornimmt, ohne die Mütze selbst zu verändern.
Emu Video: Vereinfachte Text-zu-Video Generierung
Das Emu Video Tool ergänzt die Bildbearbeitung, indem es die Videogenerierung mit Hilfe von Diffusionsmodellen vereinfacht. Es kann Videos basierend auf verschiedenen Eingabetypen erzeugen, darunter nur Text, nur Bilder oder beides.
Der Prozess beginnt mit der Erstellung eines Bildes anhand eines Textprompts, gefolgt von der Videoproduktion aus diesem Bild und einem zusätzlichen Textprompt. Für eine praktische Erfahrung können Sie die Live-Demo von Emu Video ausprobieren.
Transformation der Inhaltserstellung
Diese Fortschritte werden die Nutzerinteraktion mit Bildern und Videos in sozialen Medien revolutionieren und die Erstellung von animierten Stickern, GIFs oder Fotobearbeitungen ohne komplexe Software wie Photoshop ermöglichen. Beide Tools befinden sich jedoch noch in der Entwicklung, und es gibt keinen bestätigten Veröffentlichungstermin für Facebook oder Instagram.
Die Emu-gesteuerten Tools ergänzen Metas umfassendere Strategie im Bereich generative KI und bauen auf bestehenden Bemühungen wie Make-A-Video und dem KI-Bilderzeuger DALL-E auf. Meta strebt danach, die Kreativität der Nutzer zu fördern, indem intuitive Funktionen bereitgestellt werden, die künstlerische Möglichkeiten erweitern.
Stärkung des Meta-Ökosystems
Die Einführung von Emu Video und Emu Edit spiegelt Metas fortlaufende Strategie wider, das Engagement in seinen Apps zu steigern und eine tiefere Nutzerintegration innerhalb seines sozialen Ökosystems zu fördern.
Während diese Tools mehr Kreativität versprechen, werfen sie auch wichtige Fragen zu KI-Ethischen und der Inhaltsaufsicht auf. Wie bei anderen generativen Modellen wird Emu Schutzmaßnahmen benötigen, um potenziellen Missbrauch zu verhindern – eine Priorität, der sich Meta angesichts der rasanten Fortschritte in der KI bewusst ist.
Derzeit befinden sich Emu Video und Emu Edit in der Entwicklung, ohne öffentliches Veröffentlichungsdatum. Dennoch deutet Metas aktive Forschung im Bereich der generativen KI darauf hin, dass transformative Erlebnisse in sozialen Medien bevorstehen, die es Nutzern ermöglichen könnten, professionelle Inhalte mit der Einfachheit einer Textnachricht zu erstellen.