Os modelos de linguagem de grande escala (LLMs) dependem fortemente de dados de treinamento de alta qualidade. Poucas organizações possuem tanto dado quanto a Stack Overflow, uma plataforma de compartilhamento de conhecimento online que mais de 100 milhões de desenvolvedores utilizam mensalmente.
Hoje, a Stack Overflow anunciou uma parceria com o Google Cloud para aprimorar as capacidades de inteligência artificial (IA) para desenvolvedores em todo o mundo. Uma parte essencial dessa colaboração envolve a integração da vasta base de conhecimento da Stack Overflow nas ferramentas de IA do Google Cloud, incluindo o Gemini e o Cloud Console. Essa integração fornecerá aos desenvolvedores acesso direto a respostas relevantes, trechos de código e documentação oriundos da comunidade Stack Overflow. Essa parceria destaca uma tendência crescente em que fornecedores de LLM, como a OpenAI, colaboram com provedores de conteúdo para fortalecer o treinamento de IA generativa.
A nova integração utiliza a OverflowAPI, que pode ser estendida a outros fornecedores de LLM no futuro.
“Hoje, a Stack Overflow está lançando um programa que concede às empresas de IA acesso à sua base de conhecimento através de uma nova API,” afirmou Prashanth Chandrasekar, CEO da Stack Overflow. “O Google é nosso parceiro de lançamento, aproveitando os dados da Stack Overflow para aprimorar o Gemini no Google Cloud e entregar respostas validadas no console do Google Cloud.”
Benefícios da OverflowAPI para o Google e a Stack Overflow
O acesso do Google ao vasto repositório de informações da Stack Overflow representa uma oportunidade significativa, embora o valor exato não tenha sido divulgado. Chandrasekar optou por não comentar os termos financeiros da parceria.
Por meio da OverflowAPI, o Google pode acessar continuamente dados públicos da Stack Overflow, que incluem mais de 58 milhões de perguntas e respostas, milhões de comentários de usuários e metadados, como votos e edições.
Essa parceria é mutuamente benéfica; a Stack Overflow adotará cada vez mais a tecnologia do Google Cloud como sua principal plataforma de hospedagem. As tecnologias e serviços específicos a serem utilizados ainda estão em discussão.
É importante ressaltar que essa parceria não limita a habilidade da Stack Overflow de colaborar com outros fornecedores de LLM. “Isso não é exclusivo do Google; eles não têm acesso a dados proprietários da Stack Overflow, incluindo dados de clientes ou informações individuais de usuários,” esclareceu Chandrasekar.
Complementando o OverflowAI com a Nova OverflowAPI
Essa parceria com o Google marca mais um passo na exploração de IA generativa pela Stack Overflow. Em julho de 2023, a empresa lançou a iniciativa OverflowAI. Chandrasekar observou que a nova API complementa o OverflowAI ao aprimorar as capacidades de IA e aprendizado de máquina (ML) para o Stack Overflow for Teams e sua plataforma pública. Exemplos de iniciativas do OverflowAI incluem Stack Overflow para Visual Studio Code, Busca Aprimorada e um Aplicativo de Resposta Automática para Slack.
Por outro lado, a OverflowAPI funciona como um ponto contínuo de acesso a dados para treinamento e ajuste fino de modelos de linguagem de grande escala. “Nosso objetivo com o OverflowAI no último verão foi capacitar os desenvolvedores a contribuir para a base da IA generativa, enquanto são parte integral de seu futuro,” disse Chandrasekar. “O anúncio de hoje marca uma colaboração entre a nuvem mais amigável para desenvolvedores e a principal plataforma de conhecimento para desenvolvedores globalmente.”