Eine neue KI-Bilderzeugungstechnik namens InstantID ermöglicht die schnelle Identifizierung und Erstellung von Bildern basierend auf einem einzigen Referenzbild, wie ein aktuelles Papier des InstantX-Teams aus Peking berichtet. Reuven Cohen, ein KI-Berater für Fortune-500-Unternehmen, bezeichnet InstantID als den „neuesten Stand der Technik“ in der KI-Bilderzeugung. Er warnt jedoch, dass diese Technologie zu einem Anstieg von Deepfake-Inhalten – Audio, Bilder und Videos – führen könnte, insbesondere mit den bevorstehenden Wahlen 2024.
Cohen erklärte: „Die Verwendung von Tools wie InstantID für Deepfakes wirft erhebliche Bedenken auf, da die Erstellung einfach und die Konsistenz der Ergebnisse hoch ist, ohne dass Training oder Feineinstellungen erforderlich sind.“ Er hob hervor, dass InstantID hochrealistische Deepfakes mit minimalen Rechenressourcen erzeugen kann: „Es kann identitätsbewahrende Inhalte effizient erzeugen, ohne große CPU- oder GPU-Ressourcen.“
InstantID vs. LoRA: Ein Wesentlicher Fortschritt
Cohen erläutert, dass InstantID LoRA übertrifft, bei der kleine, feinjustierte Modelle auf begrenzten Parametern trainiert werden, wie spezifischen Charakteren oder künstlerischen Stilen. Während LoRA eine Vielzahl von Kreationen ermöglicht hat, von KI-generierten Fanfiction bis hin zu Fotorealismus, ist es umstritten am bekanntesten für die Produktion von Pornografie und Deepfakes. In einem LinkedIn-Beitrag erklärte Cohen: „Leb wohl, LoRA,“ und stellte fest, dass InstantID „Deepfakes auf Steroiden“ darstellt.
Das Papier des InstantX-Teams mit dem Titel „InstantID: Zero-shot Identity-Preserving Generation in Seconds“ besagt, dass bestehende Methoden wie LoRA aufgrund hoher Speicherkapazitätsanforderungen, umfangreicher Feinabstimmung und der Notwendigkeit mehrerer Referenzbilder an Grenzen stoßen. Im Gegensatz dazu bietet InstantID ein „Plug-and-Play-Modul“, das effizient Bilder in verschiedenen Stilen mit nur einem Gesichtsbild personalisiert und dabei hohe Treue gewährleistet.
Cohen erklärt, dass InstantID für die identitätsbewahrende Generierung ohne Vortraining konzipiert ist, was grundlegend anders ist als bestehende Techniken wie QLoRA, die Modellausgaben vereinfachen, um die Ressourcenanforderungen für die Feinabstimmung zu reduzieren. Während QLoRA zuvor die modernste Methode war, betont er, dass InstantIDs Fokus darauf liegt, Ausgaben schnell zu erzeugen, die die Identitätsmerkmale der Eingabedaten beibehalten.
Vereinfachung der Deepfake-Erstellung
Die Hauptfunktion von InstantID besteht darin, die Identität von Personen in generierten Inhalten zu bewahren. „Denken Sie an Konsistenz – wie Donald Trump immer wie Donald Trump aussieht,“ bemerkte er. Er warnte, dass die Erstellung von Deepfakes nie einfacher war: „Mit nur einem Klick können Sie dies auf Hugging Face einsetzen oder reproduzieren.“
Mit dem Fortschritt der Technologie sind die Auswirkungen von leicht zugänglichen Deepfake-Tools wie InstantID enorm und werfen wichtige Fragen zur Authentizität und zur Zukunft digitaler Inhalte auf.