NVIDIAs KI-Team soll angeblich Videos von YouTube und Netflix ohne Zustimmung extrahiert haben.

In einem besorgniserregenden Trend in der Branche wird NVIDIA beschuldigt, große Mengen urheberrechtlich geschützter Inhalte für seine KI-Trainingsinitiativen genutzt zu haben. Am Montag berichtete Samantha Cole von 404 Media, dass der Tech-Riese im Wert von 2,4 Billionen Dollar seine Mitarbeiter angewiesen hat, Videos von Plattformen wie YouTube und Netflix herunterzuladen, um seine kommerziellen KI-Projekte voranzutreiben. Diese Vorgehensweise spiegelt eine breitere „schnell handeln und Dinge brechen“ Mentalität wider, die unter Technologieunternehmen verbreitet ist, die um Dominanz im volatilen KI-Sektor konkurrieren.

Die Trainingsbemühungen konzentrierten sich angeblich auf die Erstellung von Modellen für Nvidias Omniverse 3D-Weltgenerator, autonome Fahrzeugtechnologien und „digitale Menschen“. Ein Sprecher behauptete, die Forschung des Unternehmens halte sich an das Urheberrecht und argumentierte, dass das geistige Eigentum (IP) nur spezifische Ausdrucksformen schütze, nicht jedoch Fakten, Ideen oder Daten. Diese Praxis wurde mit dem Recht eines Einzelnen verglichen, aus verschiedenen Quellen zu lernen, um neue Ausdrucksformen zu schaffen.

YouTube hingegen weist diese Sichtweise zurück. Der Sprecher Jack Malon verwies auf einen Artikel von Bloomberg aus dem April, in dem CEO Neal Mohan erklärte, dass die Nutzung von YouTube-Videos für das KI-Training eindeutig gegen die Nutzungsbedingungen der Plattform verstoßen würde. Diese Aussage folgt auf frühere Kontroversen, in denen OpenAI seinen Sora Text-zu-Video-Generator ohne Genehmigung mit YouTube-Inhalten trainierte. In ähnlicher Weise gab es kürzlich Berichte, dass Runway AI vergleichbare Praktiken anwandte.

Mitarbeiter bei NVIDIA, die ethische und rechtliche Bedenken äußerten, wurden von der Unternehmensführung informiert, dass die Initiative auf höchster Ebene genehmigt worden sei. Ming-Yu Liu, Vizepräsident der Forschung, betonte, dass „dies eine Entscheidung der Geschäftsleitung“ sei und bestätigte, dass sie „übergreifende Genehmigungen für alle Daten“ hätten. Andere innerhalb des Unternehmens beschrieben die Vorgehensweise als ein „offenes rechtliches Problem“, das später angegangen werden solle.

Diese Situation erinnert an das alte Mantra von Facebook (Meta), das ebenfalls davon lebte, Grenzen zu überschreiten, insbesondere im Bereich des Datenschutzes. Neben Inhalten von YouTube und Netflix soll NVIDIA seine Mitarbeiter auch angewiesen haben, mit Datensätzen wie MovieNet, internen Videospielbibliotheken und GitHub-Repositories wie WebVid (jetzt nach einer Unterlassungsverfügung entfernt) und InternVid-10M zu arbeiten, wobei letzterer 10 Millionen YouTube-Video-IDs enthält.

Einige der von NVIDIA angeblich verwendeten Inhalte waren nur für akademische oder nicht-kommerzielle Nutzung vorgesehen. Beispielsweise umfasst die HD-VG-130M-Bibliothek von 130 Millionen YouTube-Videos eine Nutzungslizenz, die sie auf akademische Forschung beschränkt. Trotz dieser Einschränkungen soll NVIDIA Bedenken hinsichtlich dieser akademischen Bedingungen ignoriert haben und behauptet haben, dass die Daten für ihre kommerziellen KI-Ambitionen fair game seien.

Um eine Erkennung durch YouTube zu vermeiden, soll NVIDIA angeblich virtuelle Maschinen (VMs) mit rotierenden IP-Adressen für die Downloads eingesetzt haben. Als ein Mitarbeiter vorschlug, ein Drittanbieter-Tool zur IP-Adressen-Rotation zu verwenden, erklärte ein anderer, dass „das Neustarten einer virtuellen Maschineninstanz eine neue öffentliche IP-Adresse gäbe“, was darauf hindeutet, dass die Erkennung kein Problem sei.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles