Há um ano, apenas duas semanas antes do lançamento do ChatGPT pela OpenAI, a Meta apresentou o Galactica—um modelo de linguagem “open-source para ciência” treinado com 48 milhões de artigos científicos. A Meta afirmou que o Galactica poderia resumir literatura acadêmica, resolver problemas de matemática, gerar artigos para a Wiki, escrever código científico e anotar moléculas e proteínas.
No entanto, o Galactica foi retirado do ar após apenas três dias, em 17 de novembro de 2022, devido à reação pública negativa em relação aos seus outputs imprecisos e, em alguns casos, ofensivos—um fenômeno agora conhecido como "alucinações". Críticos destacaram a tendência do Galactica em produzir respostas plausíveis, mas factualmente incorretas, o que chocou muitos na comunidade científica.
Apesar da controvérsia, Yann LeCun, principal cientista da Meta, defendeu o Galactica nas redes sociais, afirmando: “Não é mais possível se divertir usando-o de forma imprudente. Feliz?” Apesar disso, o modelo não atendeu às expectativas para uma IA generativa transformadora.
Duas semanas depois, o ChatGPT apareceu. Na mesma semana, rumores sobre o GPT-4 surgiram, gerando esperança entre os pesquisadores de IA que estavam na conferência NeurIPS em Nova Orleans. Em 30 de novembro, ao invés do GPT-4, a OpenAI lançou o ChatGPT, marcando um momento crucial no cenário da IA.
O ChatGPT rapidamente revelou seu próprio problema com alucinações, gerando respostas confiantes, mas enganosas. A OpenAI reconheceu essa limitação em seu blog de lançamento, afirmando que resolvê-la é “desafiador”. Apesar dessas falhas, o ChatGPT teve um crescimento explosivo, atingindo cerca de 100 milhões de usuários mensais em apenas dois meses, e agora conta com 100 milhões de usuários semanais.
O legado do Galactica persiste, com a Meta reconhecendo valiosas lições aprendidas. Joelle Pineau, VP de Pesquisa em IA na Meta, declarou: “Houve muitas lições valiosas... Ainda recebo muitos pedidos de pessoas que querem o modelo.” Ela esclareceu que o Galactica sempre foi destinado a ser um projeto de pesquisa, não um produto. “A diferença entre expectativa e realidade era muito grande”, observou Pineau, destacando que a taxa de alucinação do modelo era inferior à de outros modelos devido ao seu foco na literatura científica.
Após a repercussão negativa, a Meta retirou a demonstração do Galactica para evitar abusos, reconhecendo a falta de um guia de uso responsável—uma prática que adotaram a partir de então para futuros lançamentos. Pineau comentou que, se fossem fazer novamente, gerenciariam melhor as expectativas do público. “As lições do Galactica foram integradas em nossa próxima geração de modelos.”
Essa próxima geração inclui o Llama, o modelo de linguagem de grande porte da Meta que ganhou atenção significativa em fevereiro de 2023, seguido pelo comercial Llama 2 em julho e pelo Code Llama em agosto. O Llama se tornou o primeiro LLM livre e open-source de importância, desencadeando um considerável debate dentro da comunidade de IA que continua até hoje.
Quando o Llama foi lançado em 24 de fevereiro, a Meta foi cautelosa. LeCun enfatizou: “A Meta está comprometida com a pesquisa aberta e libera todos os modelos para a comunidade de pesquisa sob uma licença GPL v3.” No entanto, os pesquisadores foram obrigados a preencher um formulário para ter acesso ao Llama, uma precaução resultante da repercussão em torno do Galactica. LeCun explicou: “Após o Galactica, as pessoas nos acusaram de ameaçar o tecido da sociedade.”