In einem kürzlichen Medieninterview äußerte sich YouTube-CEO Neal Mohan zu den Bedenken hinsichtlich der Trainingsdaten des Video-Generierungs-AI-Modells Sora von OpenAI. Er stellte fest, dass es keine direkten Beweise dafür gibt, dass OpenAI YouTube-Videos für die Trainings ihrer Modelle verwendet hat, betonte jedoch, dass dies die Nutzungsbedingungen von YouTube verletzen würde.
Mohan hob hervor, dass Inhaltsersteller beim Hochladen von Videos bestimmte Rechte behalten, einschließlich des angemessenen Gebrauchs und des Schutzes ihrer Inhalte. Laut den Nutzungsbedingungen von YouTube ist das Herunterladen und die Verwendung von Videosegmenten für das Training von KI ohne Genehmigung ausdrücklich verboten, da solche Handlungen das Vertrauen zwischen den Erstellern und der Plattform untergraben.
Interessanterweise erkannte Mohan an, dass die Muttergesellschaft von YouTube, Google, YouTube-Inhalte für das Training ihres eigenen KI-Modells Gemini verwendet hat, jedoch entkräftete er, dass sie vorher die Erlaubnis von den Erstellern einholten und relevante Verträge einhielten. Dies deutet darauf hin, dass OpenAI möglicherweise ähnliche Genehmigungsprozesse für die Datennutzung nicht befolgt hat.
OpenAI gab keine klaren Informationen zu den Quellen der Trainingsdaten für das Sora-Modell. Mira Murati, die Chief Technology Officer des Unternehmens, bestätigte nicht, ob YouTube-Videos verwendet wurden, sondern wies lediglich darauf hin, dass gesetzlich zulässige, öffentlich verfügbare Videos möglicherweise im Trainingsset enthalten sind, ohne dies jedoch zu garantieren.
Diese Situation hat eine umfassende Debatte über die Rechtmäßigkeit der Datennutzung im Training von KI-Modellen ausgelöst. Mit dem Fortschritt der KI-Technologien ist die Sicherstellung der Datenrechtmäßigkeit, der Respekt vor den Rechten der Ersteller und die Einhaltung von regulatorischen und branchenspezifischen Standards zum zentralen Anliegen der Branche geworden.
Als eine der größten Videoplattformen der Welt hat YouTubes Haltung zu Urheberrechten und Datennutzung großes Gewicht. Mohans Aussagen senden eine klare Botschaft: Die unbefugte Nutzung von YouTube-Videos zum Training von KI-Modellen wird strenge Konsequenzen nach sich ziehen.
Daher muss OpenAI die Compliance-Themen im Zusammenhang mit Trainingsdaten sorgfältig prüfen. Dies dient als Erinnerung an andere KI-Unternehmen und Forschungsinstitute, die Urheberrechte und Datenschutz zu respektieren, wenn sie öffentliche Daten für das Modelltraining nutzen, um eine nachhaltige und verantwortungsvolle KI-Entwicklung zu gewährleisten.