Nvidias KI-Gaming-Technologie-Pionier möchte Kontroversen rund um seine Erfindungen klären.

Anfang dieses Monats erlebte ich einen bemerkenswerten technologischen Durchbruch. Während eines Pressebriefings vor der CES präsentierte Nvidia eine Demonstration seines Ace-Microservice, einer KI-Suite, die in der Lage ist, vollständig vertonte KI-Charaktere zu erstellen. Zu meiner Überraschung interagierte ein Präsentator über ein Mikrofon mit einem NPC im Spiel und erhielt Echtzeit-Antworten von dem digitalen Charakter, die so lebensecht waren, dass es fast wie Science-Fiction wirkte. Doch eine Frage blieb: Wie war das möglich?

Nvidia blieb vage und erklärte, es gebe "keine einfache Antwort". Diese Unklarheit führte zu intensiven Spekulationen in sozialen Medien, in denen viele Nutzer befürchteten, Ace könnte mit Inhalten trainiert worden sein, deren Rechte Nvidia nicht besitzt. Obwohl Nvidia später klarstellte, nur rechtmäßig erworbene Daten zu verwenden, blieb die Unsicherheit bestehen. Gamer waren weiterhin skeptisch und beschäftigten sich mit ethischen und künstlerischen Fragen rund um diese Technologie.

Purnendu Mukherjee, ein Software-Ingenieur und der kreative Kopf hinter der KI-Technologie, die im Mittelpunkt dieser Kontroversen steht, beobachtete diese Dynamik. Als Gründer von Convai, dem Unternehmen für generative KI, das die Kairos-Demo von Nvidia auf der CES 2024 ermöglichte, ergriff Mukherjee die Initiative, um Missverständnisse direkt auszuräumen.

In einem ausführlichen Interview sprach Mukherjee über verschiedene ethische Bedenken zu KI-Werkzeugen wie seinem eigenen. Er thematisierte Ängste vor Arbeitsplatzverlust bis hin zu der Sorge, dass KI die menschliche Note in der Kunst untergraben könnte. Im Gegensatz zu diesen Ängsten sieht Mukherjee eine Zukunft, in der Künstler die KI gemeinsam nutzen, um ihre kreativen Ausdrucksformen zu bereichern. Doch seine Einblicke zum Thema Datennutzung werfen zusätzliche Fragen auf.

Mukherjees Faszination für den menschlichen Geist begann in der Kindheit, und im Laufe seiner Schulzeit entdeckte er die KI für sich. Nachdem er zunächst von starren, regelnbasierten Systemen abgeschreckt wurde, entdeckte er 2015 durch tiefes Lernen in einem indischen Labor eine neue Begeisterung. Nach seinem Abschluss und wertvoller Erfahrung bei Nvidia gründete er im April 2022 Convai und finanzierte das Startup zunächst unabhängig.

Als leidenschaftlicher Gamer wuchs Mukherjee mit kompetitiven Spielen wie Counter-Strike auf und erkannte, wie KI das Gameplay verbessern könnte. Was als humorvolle Kritik an einfachen Spiel-Bots begann, entwickelte sich zu einer bahnbrechenden Innovation. Die Technologie von Convai nutzt mehrere KI-Prozesse, um vollständig vertonte NPCs zu erzeugen, die dynamisch auf Spieleranfragen reagieren können – mit dem Ziel, fesselndere Spielerlebnisse zu schaffen.

„Denken Sie an Titel wie Baldur's Gate 3 oder The Witcher“, erklärt Mukherjee. „Diese Spiele haben reiche Erzählungen und tiefe Charakterentwicklungen. Spieler verpassen oft die volle Erkundung dieser Geschichten aufgrund begrenzter Dialogoptionen mit NPCs. Mit der heutigen Technologie können wir NPCs Leben einhauchen – sie können mit Spielern in ihrer Rolle interagieren und tiefergehende Einblicke in die Geschichte bieten.“

Diese Einsicht eröffnet eine breitere Diskussion über die miteinander verbundenen Anliegen im Bereich KI. Mukherjee geht auf den Zweifel ein und betont, dass KI keine Ersatzlösung für Künstler darstellt, sondern ein Werkzeug ist, das deren Mitwirkung erfordert.

„Ich glaube, dass narrative Designer stärker nachgefragt werden, nicht weniger“, stellt er fest und beschreibt, wie KI zusätzliche Rollen für Autoren schaffen könnte. „Autoren müssen Hintergrundgeschichten und Erzählungen entwickeln und gleichzeitig solide Testsets erstellen. Damit ein generative KI-basiertes NPC sicher in ein Millionen-Dollar-Spiel integriert werden kann, sind Hunderte oder Tausende von Interaktionen notwendig – idealerweise verfasst vom ursprünglichen Drehbuchautor. Unsere Plattform verlangt von den Nutzern, umfangreiche Hintergrundgeschichten und Dokumente bereitzustellen, was letztendlich zu deutlich mehr Schreibarbeit führt als normalerweise.“

Dieser Gesichtspunkt wird zu einem wiederkehrenden Thema im Gespräch. Mukherjee betont immer wieder, dass generative KI-Tools einen noch größeren Pool von Künstlern benötigen, um effektiv trainiert zu werden. Er ist überzeugt, dass verbesserte KI die Qualität von Spielen steigern wird, was zu höheren Verkaufszahlen und besseren Bezahlungen für Sprecher führen könnte, die eine wichtige Rolle bei der Entwicklung dieser fortschrittlichen Tools spielen. Sein Ausblick ist optimistisch, insbesondere vor dem Hintergrund der aktuellen Welle von Entlassungen in der Videospielindustrie.

Mukherjee erkennt die Realität dieser Entlassungen an, sieht aber den Aufstieg generativer KI als Teil einer natürlichen technologischen Evolution. Er glaubt, dass Kreative sich anpassen und synergetische Zusammenarbeit mit KI annehmen müssen, anstatt sie als Bedrohung zu sehen.

„Sie bleiben der Schöpfer, Meister und Kontrolleur dessen“, betont er.

Im Verlauf des Gesprächs frage ich nach Künstlern, die leidenschaftlich Spiele als Ausdruck ihres Handwerks schaffen. Ist es wirklich so einfach, wie zu sagen, sie sollten kurzerhand zu KI-Ingenieuren werden? Mukherjee entgegnet, dass es mehr darum geht, die Schnittstelle zwischen Kunst und Technologie zu erkennen.

„KI ist vergleichbar mit Werkzeugen wie Adobe Photoshop oder Unreal Engine“, erklärt er. „Ja, Spiele existierten bereits vor diesen Technologien, und die Schöpfer haben sie immer von Hand gefertigt. Aber können Sie mit Unreal Engine außergewöhnliche Kunst produzieren? Absolut. Die akribischen Details in der 3D-Videobearbeitung bleiben bestehen, auch wenn Inhalte mit KI erstellt werden. Der Geist des Handwerks bleibt vorhanden; es wird nur durch leistungsstärkere Werkzeuge verstärkt. Sie sind nach wie vor der Schöpfer, der Ihre Vision formt.“

Mukherjee sieht KI offensichtlich als Asset für Künstler, nicht als Ersatz. Wiederholt betont er die Abhängigkeit der KI von menschlicher Kreativität und adressiert zugleich verbreitete Bedenken. Dennoch bleibt das Thema Datennutzung umstritten. Während Kritiker argumentieren, dass KI-Modelle, die auf ihren Arbeiten trainiert wurden, geistiges Eigentum stehlen, bestehen einige Entwickler darauf, dass umfangreiche Daten – einschließlich urheberrechtlich geschütztem Material – notwendig sind, um effektive Modelle zu trainieren. Mukherjee schlägt vor, dass Schöpfer entschädigt werden sollten, wenn ihre Beiträge die Trainingsdatensätze der KI beeinflussen.

„Es muss ein System vorhanden sein, um sicherzustellen, dass Personen, die signifikante Daten beisteuern, fair entschädigt werden“, erklärt er. „Ob es sich um die New York Times oder Reddit handelt, eine ordnungsgemäße Lizenzierung ist unerlässlich. Es ist ein komplexes Thema, aber ich glaube, das ist die Richtung, in die wir, besonders für kommerzielle Anwendungen, gehen müssen.“

Auf die Frage nach den Datenpraktiken von Convai betont Mukherjee, dass das Unternehmen nur Daten verwendet, für die es die Nutzungsrechte hat. Er erklärt, dass es unmöglich wäre, die spezifischen erforderlichen Daten zufällig zu sammeln, da die Technologie ein neuartiges Feld erschließt. Doch er spricht schnell einen Widerspruch in diesem Argument an.

„Wir nutzen Basismodelle von Quellen wie OpenAI oder lizenzierten Open-Source-Modellen“, präzisiert er. „Diese müssen ethisch sowie kommerziell lizenziert sein. Wir sind in diesen Prozessen sehr sorgfältig. Tatsächlich erfordert unser System oft mehr Sprecher, nicht weniger!“

Die Erwähnung von OpenAI wirft einige Bedenken auf, insbesondere angesichts der aktuellen rechtlichen Herausforderungen durch die Klage der New York Times wegen angeblicher „rechtswidriger Nutzung“ ihrer Texte zum Training von Bots wie ChatGPT. OpenAI erkennt die Schwierigkeit an, hochentwickelte KI-Modelle zu trainieren, ohne urheberrechtlich geschütztes Material zu verwenden. Da Mukherjees Modell auf OpenAI basiert, dränge ich ihn, wie er garantieren kann, dass dabei keine urheberrechtlich geschützten Inhalte verwendet wurden.

Mukherjee macht eine subtile Unterscheidung: Convai verwendet nicht direkt die Daten von OpenAI, sondern lediglich die darauf basierenden Modelle. Diese Nuance könnte auf eine rechtliche Lücke hindeuten. Mukherjee glaubt, dass Convai compliance-mäßig nicht gegen Urheberrechte verstößt, weil es sich nicht direkt auf die Daten stützt. Als ich ihn jedoch nach der Unterscheidung zwischen der Nutzung von Modellen und dem Einsatz potenziell urheberrechtlich geschützter Datensätze innerhalb dieser Modelle frage, wird seine Erklärung unklarer.

„Es ist unklar, welches Modell welche Daten enthält“, gibt er zu. „Wir haben diese Klarheit nicht. Beispielsweise, wenn OpenAI fünf Modelle bereitstellt, Nvidia vier und Meta drei, verwenden wir einfach die Modelle, die am besten unseren Anforderungen entsprechen, ohne die genauen Datenursprünge zu kennen.“

Mukherjees Argumentation legt nahe, dass Convai nicht für die Datenverwaltung anderer Modelle verantwortlich ist. Sein Fokus liegt ausschließlich darauf, dass die Datenpraktiken von Convai ethisch bleiben, während er hofft, dass die grundlegenden Modelle ebenfalls compliant sind. Doch seine frühere Behauptung, Convai würde mit den ethischsten Modellen arbeiten, scheint inkohärent zu sein, insbesondere angesichts der rechtlichen Probleme der derzeit verwendeten Modelle.

Diese komplexen Diskussionen könnten Nvidia's anfängliches Zögern erklären, klare Antworten zur Datennutzung zu geben. Die Realität ist, dass all diese Technologien aufeinander aufbauen. Ace ist auf Convai angewiesen, das auf der Arbeit von OpenAI basiert – eine geschichtete Struktur, die es schwierig macht, die Datenursprünge in den unteren Schichten zu identifizieren. Nvidias Aussage, dass es "keine einfache Antwort" zur Datennutzung gibt, ist korrekt, aber eine ehrlicher Erklärung könnte sein, dass sie kein umfassendes Wissen über das gesamte System haben. Während Nvidia wahrscheinlich keiner gerichtlichen Prüfung ausgesetzt ist, könnte eine bedeutende rechtliche Niederlage für OpenAI weitreichende Folgen haben.

Als wir diese komplexen Details entwirren, bringe ich die Frage nach Regulierungen auf. Sollte die Regierung eingreifen, um Richtlinien für KI-Technologie festzulegen? Mukherjee erkennt die Notwendigkeit einiger Regulierungen an, betont jedoch die Wichtigkeit eines ausgewogenen Ansatzes. Er befürchtet, dass übermäßige Einschränkungen Innovationen ersticken könnten und bleibt überzeugt, dass die Vorteile von KI die möglichen Nachteile überwiegen.

„Was ist KI heute? Denken Sie an ein Auto“, vergleicht er. „Autos können gefährlich sein; Unfälle können passieren. Dennoch fahren wir jeden Tag damit, weil der Gesamtnutzen erheblich ist. Ich sehe KI in diesem Licht. Wir werden Regelungen für deren Nutzung benötigen, ähnlich wie wir regeln, wie man ein Fahrzeug fährt. Auf diejenigen, die es missbrauchen, werden rechtliche Konsequenzen zutreffen.“

Veränderungen sind unvermeidlich, und Veränderungen bringen oft Unbehagen mit sich.

Trotz einiger düsterer Vergleiche behält Mukherjee eine hoffnungsvolle Sicht auf KI. Er glaubt fest daran, dass sie erhebliche Vorteile für die Gesellschaft bringen wird, solange Unternehmen das Wohl der Menschen in den Vordergrund stellen. Er stellt sich eine Zukunft vor, in der Werkzeuge wie Nvidia Ace die Talente von Künstlern stärken, anstatt sie zu ersetzen. Anstatt eine von Maschinen dominierte Zukunft zu fürchten, erkennt er die Notwendigkeit zur Anpassung an.

„Veränderungen werden eintreten, und sie werden Menschen betreffen“, erkennt Mukherjee an. „Das erinnert an frühere technologische Revolutionen. Mit jeder bedeutenden Veränderung entstehen neue Berufschancen, während alte Rollen möglicherweise abnehmen. Denken Sie an den Übergang von Pferdewägen zu Automobilen. Die in der Pferdebranche Tätigen mussten sich umstellen. Generative KI wird neue Wege für Kreativität und Innovation eröffnen – sie wird der Menschheit insgesamt nützen, aber auch Veränderungen in traditionellen Beschäftigungen erfordern.“

Am Ende unseres Interviews äußerte Mukherjee Dankbarkeit für die Möglichkeit, Missverständnisse bezüglich Convai zu klären. Er stellte fest, dass viele Medienberichte über Nvidia Ace die Beiträge seines Unternehmens weitgehend ignorierten. Ein Hauch von Frustration schwingt in seinem Ton mit, während er um die ihm zustehende Anerkennung ringt. Ich reflektiere über die Ironie dieser Situation und vergleiche seine Erfahrung mit der von Künstlern, die sehen müssen, wie ihre Werke von KI-Tools ausgebeutet werden.

„Das ist eine überzeugende Beobachtung!“, antwortet er lachend und gewinnt möglicherweise eine neue Perspektive auf die Angelegenheit.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles