Google hat eine Vereinbarung über 60 Millionen Dollar bestätigt, um Inhalte von Reddit für das Training seiner generativen KI-Modelle zu nutzen, berichtete Reuters am Donnerstag. Diese Ankündigung folgt einem vorherigen Bericht von Bloomberg, der darauf hinwies, dass Reddit einen ähnlichen Vertrag gesichert hat, ohne jedoch nähere Informationen zur anderen beteiligten Partei zu nennen. Durch das Training seiner KI-Modelle mit nutzergenerierten Inhalten von Plattformen wie Reddit zielt Google darauf ab, die Natürlichkeit und Relevanz der von Chatbot-Tools generierten Antworten zu verbessern.
Der Bericht hebt die kontinuierlichen Bemühungen von KI-Unternehmen hervor, auf riesige Mengen an Online-Daten zuzugreifen, während gleichzeitig das Urheberrecht respektiert wird. Diese Entwicklung entspricht den Plänen von Reddit für den Börsengang, bei dem die Aktien unter dem Tickersymbol RDDT an der New Yorker Börse gelistet werden sollen. Historisch gesehen wurden KI-Modelle, die Anwendungen wie OpenAI’s ChatGPT oder Google’s Gemini (früher Bard) unterstützen, hauptsächlich mit im Internet gesammelten Inhalten trainiert. Diese Praxis hat jedoch Bedenken bei Autoren, Künstlern und Verlegern hinsichtlich der unautorisierten Nutzung ihrer urheberrechtlich geschützten Materialien ohne Anerkennung oder Vergütung aufgeworfen. Infolgedessen haben einige Personen rechtliche Schritte wegen Urheberrechtsverletzungen eingeleitet, was dazu führte, dass KI-Firmen alternative Methoden zur Inhaltsbeschaffung suchen, wie Partnerschaften mit Plattformen wie Reddit.
Die gemeldete Vereinbarung zwischen Reddit und Google spiegelt eine kürzlich getroffene Regelung zwischen Axel Springer und OpenAI wider, bei der Zugriff auf die Inhalte des deutschen Medienunternehmens für das Training von KI-Modellen gewährt wurde. Allerdings steht diese Strategie ebenfalls unter Beobachtung, da Kritiker befürchten, dass die finanziellen Vorteile solcher Vereinbarungen nicht den ursprünglichen Inhaltscreatoren zugutekommen werden. Ein Artikel von Wired im Dezember beschäftigte sich mit diesen Bedenken im Zusammenhang mit dem Axel-Springer-Deal und stellte die Frage, ob einzelne Journalisten einen Anteil an den Gewinnen erhalten würden. Auf die Anfrage nach möglicher Umsatzbeteiligung oder zusätzlicher Vergütung für Journalisten, die an dem Deal beteiligt waren, gab Axel Springer keine klare Antwort, was Unsicherheit über Zahlungen für Autoren, deren Inhalte von ChatGPT genutzt werden, hinterlässt.
Am Donnerstag veröffentlichten sowohl Reddit als auch Google Erklärungen, in denen sie ihre Absicht betonten, eine engere Zusammenarbeit in verschiedenen Bereichen zu verfolgen, ohne jedoch spezifisch auf die gemeldete Vereinbarung oder deren finanzielle Details einzugehen. Google lobte Reddit für die „unglaubliche Breite authentischer, menschlicher Gespräche und Erfahrungen“, während Reddit hervorhob, dass ihre Partnerschaft mit Google „die Entdeckung und Interaktion mit Inhalten und Gemeinschaften auf Reddit, die für Nutzer am wichtigsten sind, erleichtern wird.“