NVIDIA sieht sich rechtlichen Herausforderungen wegen urheberrechtlich geschützter Inhalte in der KI-Ausbildung gegenüber
Aktuelle Dokumente des Tech-Medienhauses 404Media zeigen, dass NVIDIA eine beträchtliche Menge an urheberrechtlich geschütztem Material angesammelt hat, während das Unternehmen seine künstlichen Intelligenz (KI) Systeme trainierte. Diese Unterlagen umfassen interne E-Mails, Slack-Unterhaltungen und andere relevante Materialien und deuten darauf hin, dass NVIDIA Daten von verschiedenen Video-Plattformen wie YouTube bezogen hat, um seine KI-Trainingsdatensätze zu erweitern.
In diesen Gesprächen äußerten die Mitarbeiter, die am Projekt beteiligt sind, Bedenken hinsichtlich der rechtlichen Risiken bei der Zusammenstellung von Datensätzen aus YouTube-Videos zu Forschungszwecken. Ein Projektmanager beruhigte jedoch die Beteiligten, dass dieser Ansatz zur Datensammlung von der Unternehmensführung genehmigt worden sei und betonte, dass die Praxis „vollständig im Einklang mit dem Wortlaut und Geist des Urheberrechts“ sei.
Laut einem Mitarbeiter von NVIDIA habe das Unternehmen die Teams angewiesen, Videos von Plattformen wie YouTube und Netflix zu sammeln, um seinen Omniverse 3D-Generator, autonome Fahrzeugsysteme und digitale Menschenprodukte zu trainieren. Berichten zufolge nutzt das Projekt, intern als „Cosmos“ bezeichnet, virtuelle Maschinen mit wechselnden IP-Adressen, um die Inhaltsüberwachungsmechanismen von YouTube zu umgehen und somit Sperren zu vermeiden.
Der Mitarbeiter bemerkte: „Wir nutzen die AWS-Plattform, und das Neustarten der Instanzen weist eine neue öffentliche IP zu, daher ist das im Moment kein Problem.“
Mit dem Fortschritt der KI-Technologie wird die Herausforderung, urheberrechtlich geschützte Inhalte rechtlich und ethisch für Trainingszwecke zu verwenden, zu einem wichtigen Anliegen der Tech-Branche.