Das Google DeepMind-Team hat kürzlich Genie vorgestellt, ein grundlegendes Weltmodell mit 11 Milliarden Parametern, das in der Lage ist, aus einem einzelnen Bild eine interaktive virtuelle Welt zu erschaffen. Diese bahnbrechende Technologie hat erhebliche Aufmerksamkeit erregt und markiert einen entscheidenden Moment, da künstliche Intelligenz in die Welt der Videospiele eintritt.
Im Gegensatz zu früheren Modellen lernt Google Genie aus 200.000 Stunden unlabelled Internetvideos, ohne dass eine überwachte Ausbildung erforderlich ist. Dadurch kann es reichhaltig variierte Szenen generieren und Hauptcharaktere in einer Szene ohne Aktionslabels identifizieren. Dies ermöglicht die Interaktion der Benutzer und zeigt das immense Potenzial für die Schaffung virtueller Umgebungen.
Im Zentrum von Genies Fähigkeiten stehen drei Hauptkomponenten: das latente Aktionsmodell, der Video-Tokenizer und das autoregressive dynamische Modell. Diese Elemente arbeiten zusammen, um einen latenten Aktionsraum zu entwickeln, der die Benutzerinteraktion bereichert und es Agenten ermöglicht, bisher ungesehene Verhaltensweisen aus den Videos zu imitieren.
Darüber hinaus unterstützt Genie innovativ die Integration von menschlich gestalteten Skizzen oder realen Bildern. Durch den Einsatz fortschrittlicher Text-zu-Bild-Generierungsmodelle kann Genie einen Ausgangsrahmen in ein interaktives virtuelles Universum umwandeln, was seine Einsatzmöglichkeiten erheblich erweitert.
Tim Rocktäschel, der Leiter des Genie-Teams, betont, dass Genie einen entscheidenden Schritt in der Entwicklung der künstlichen allgemeinen Intelligenz (AGI) darstellt, die das Landschaftsbild interaktiver generativer Umgebungen verändern und den Grundstein für zukünftige KI-Fortschritte legen könnte.
Zusammenfassend hat Google DeepMind das Genie-Modell eingeführt, das einen revolutionären Wandel in der Videospielindustrie einläutet. Die Fähigkeit, spielbare virtuelle Welten aus einem einzigen Bild zu erzeugen, deutet auf eine bevorstehende umfassende Integration von KI im Gaming hin.