O Google confirmou um acordo de $60 milhões para utilizar conteúdo do Reddit no treinamento de seus modelos de IA generativa, conforme noticiado pela Reuters na quinta-feira. Este anúncio surge após um relatório anterior da Bloomberg, que indicava que o Reddit havia firmado um acordo semelhante, embora detalhes sobre a outra parte envolvida não tenham sido divulgados naquela ocasião. Ao treinar modelos de IA com conteúdo gerado por usuários de plataformas como o Reddit, o Google busca aprimorar a naturalidade e a relevância das respostas geradas por suas ferramentas de chatbot.
O relatório destaca os esforços contínuos das empresas de IA em explorar vastas quantidades de dados online, respeitando a propriedade autoral. Esse desenvolvimento coincide com os planos do Reddit para sua oferta pública inicial, onde pretende listar ações na Bolsa de Valores de Nova York sob o símbolo RDDT. Historicamente, modelos de IA que sustentam aplicações como o ChatGPT da OpenAI ou o Gemini do Google (anteriormente chamado de Bard) foram majoritariamente treinados com conteúdo extraído da web. No entanto, essa prática gerou preocupações entre autores, artistas e editores sobre o uso não autorizado de seu material protegido por direitos autorais, sem reconhecimento ou compensação. Como resultado, alguns indivíduos têm tomado ações legais por violação de direitos autorais, levando as empresas de IA a buscar métodos alternativos de aquisição de conteúdo, como parcerias com plataformas como o Reddit.
O acordo relatado entre o Reddit e o Google lembra uma recente parceria feita pela Axel Springer com a OpenAI, que garantiu acesso ao conteúdo da empresa de mídia alemã para treinamento de modelos de IA. Contudo, essa estratégia também enfrenta críticas, já que detratores se preocupam que os ganhos financeiros decorrentes desses acordos não beneficiem os criadores de conteúdo originais. Um artigo da Wired, publicado em dezembro, abordou essas preocupações no contexto do acordo com a Axel Springer, levantando questões sobre se jornalistas individuais receberiam alguma parte dos lucros. Quando questionada sobre a possível divisão de receitas ou compensação adicional para os repórteres envolvidos no negócio, a Axel Springer não forneceu uma resposta clara, deixando dúvidas sobre os pagamentos para os escritores cujo conteúdo é utilizado pelo ChatGPT.
Na quinta-feira, tanto o Reddit quanto o Google emitiram declarações enfatizando suas intenções de buscar uma colaboração mais estreita em diversos setores, embora nenhum deles tenha feito referência específica ao acordo relatado ou aos detalhes financeiros. O Google elogiou o Reddit por sua “incrível diversidade de conversas e experiências humanas autênticas”, enquanto o Reddit destacou que sua parceria com o Google “facilitará a descoberta e o engajamento com conteúdo e comunidades no Reddit que são mais relevantes para os usuários.”