Google ha confirmado un acuerdo de $60 millones para utilizar contenido de Reddit en el entrenamiento de sus modelos de inteligencia artificial generativa, según informó Reuters el jueves. Este anuncio sigue a un reporte previo de Bloomberg que indicaba que Reddit había asegurado un acuerdo similar, aunque no se revelaron detalles sobre la otra parte involucrada en ese momento. Al entrenar modelos de IA con contenido generado por los usuarios en plataformas como Reddit, Google busca mejorar la naturalidad y relevancia de las respuestas generadas por sus herramientas de chatbot.
El informe destaca los esfuerzos continuos de las empresas de IA por acceder a enormes cantidades de datos en línea, respetando al mismo tiempo los derechos de autor. Este desarrollo coincide con los planes de Reddit para su oferta pública inicial, donde tiene la intención de listar acciones en la Bolsa de Nueva York bajo el símbolo RDDT. Históricamente, los modelos de IA que soportan aplicaciones como ChatGPT de OpenAI o Gemini de Google (anteriormente Bard) se han entrenado principalmente con contenido extraído de la web. Sin embargo, esta práctica ha generado preocupaciones entre autores, artistas y editores sobre el uso no autorizado de su material protegido sin reconocimiento ni compensación. Como resultado, algunas personas han llevado a cabo acciones legales por infracción de derechos de autor, lo que ha llevado a las empresas de IA a buscar métodos alternativos de adquisición de contenido, como alianzas con plataformas como Reddit.
El acuerdo reportado entre Reddit y Google refleja un reciente arreglo de Axel Springer con OpenAI, que otorga acceso al contenido de la empresa mediática alemana para el entrenamiento de modelos de IA. No obstante, esta estrategia también enfrenta críticas, ya que hay preocupaciones de que las ganancias financieras de dichos acuerdos no beneficiarán a los creadores de contenido originales. Un artículo de Wired en diciembre abordó estas preocupaciones en el contexto del acuerdo de Axel Springer, planteando preguntas sobre si los periodistas individuales recibirían alguna parte de las ganancias. Al indagar sobre la posible participación en los ingresos o compensaciones adicionales para los reporteros involucrados en el acuerdo, Axel Springer no ofreció una respuesta clara, dejando incertidumbre sobre los pagos a los escritores cuyo contenido es utilizado por ChatGPT.
El jueves, tanto Reddit como Google emitieron declaraciones enfatizando su intención de buscar una colaboración más estrecha en varios sectores, aunque ninguno se refirió específicamente al acuerdo reportado ni a sus detalles financieros. Google elogió a Reddit por su "increíble amplitud de conversaciones y experiencias humanas auténticas", mientras que Reddit destacó que su colaboración con Google "facilitará un descubrimiento y compromiso más sencillo con el contenido y las comunidades en Reddit que más importan a los usuarios."