Uma conta verificada no X (anteriormente Twitter) representando a Large Model Systems Organization anunciou a remoção temporária do gpt2-chatbot, citando "tráfego inesperadamente alto" e "limites de capacidade". A organização destacou sua colaboração com diversos desenvolvedores de modelos para fornecer acesso da comunidade a modelos não lançados para testes, incluindo o gpt2-chatbot.
Um novo sistema de inteligência artificial, chamado “gpt2-chatbot”, surgiu online, despertando ampla curiosidade sobre suas origens e capacidades. Muitos pesquisadores acreditam que ele representa um avanço significativo em relação aos modelos de IA existentes.
O modelo apareceu discretamente na LMSYS Chatbot Arena, um site voltado à comparação de sistemas de linguagem de IA. No entanto, seu desempenho cativou especialistas em IA, que sugerem que ele pode rivalizar ou até superar o GPT-4, o mais recente sistema desenvolvido pela OpenAI.
O pesquisador em IA Andrew Gao, da Universidade de Stanford, afirmou: “É impossível determinar quem o criou, mas concordo que parece estar pelo menos ao nível do GPT-4.” Notavelmente, o gpt2-chatbot resolveu com sucesso um problema da Olimpíada Internacional de Matemática—uma conquista destacada por Gao, dada a dificuldade do evento.
Ethan Mollick, professor da Wharton School que estuda IA, observou que, em seus testes, o gpt2-chatbot superou o GPT-4 em tarefas complexas, como programar um esboço de unicórnio. Ele comentou: “Pode ser melhor que o GPT-4, especialmente na desafiadora tarefa de ‘desenhar um unicórnio com código’.”
As notáveis capacidades do modelo geraram especulações sobre sua origem. Muitos pesquisadores suspeitam que o gpt2-chatbot foi desenvolvido pela OpenAI, dada sua autoidentificação como "ChatGPT, um grande modelo de linguagem treinado pela OpenAI, com base na arquitetura GPT-4." No entanto, essa afirmação é difícil de confirmar, pois sistemas de IA podem ser projetados para distorcer suas origens.
Alguns especialistas notaram semelhanças com modelos anteriores da OpenAI como um sinal de seus criadores. “Ele afirmou ter sido desenvolvido pela OpenAI,” observou Gao, embora tenha cautionado que isso pode ser um indicador enganoso devido à contaminação de dados obtidos durante o treinamento com chats derivados da OpenAI.
Apesar de sua aparente proximidade com o GPT-4, alguns pesquisadores sugerem que o gpt2-chatbot não supera substancialmente as capacidades do GPT-4. Joe Fox, outro pesquisador em IA, mencionou que, embora o gpt2-chatbot seja impressionante, pode não representar um grande salto em relação ao GPT-4 em aplicações práticas.
Há também a possibilidade de que o gpt2-chatbot tenha origem em uma organização menos conhecida buscando mostrar sua destreza em IA. Esse cenário é semelhante ao lançamento do GPT-4chan pelo pesquisador em IA Yannic Kilcher em junho de 2022, um modelo que utilizou uma convenção de nomenclatura semelhante, mas sem afiliação com a OpenAI.
Conforme os pesquisadores exploram os recursos do gpt2-chatbot, eles descobriram comportamentos que indicam um potencial adicional. Notavelmente, o modelo parece estar mais disposto a quebrar regras do que chatbots anteriores. Dimitris Papailiopoulos, professor de IA na Universidade de Wisconsin, descobriu que o gpt2-chatbot foi capaz de resolver um quebra-cabeça lógico que o GPT-4 não conseguiu. “Descobri uma tarefa em que o gpt2-chatbot se destaca em relação a todos os outros modelos, embora seja trivial,” comentou ele, com humor.
Além disso, o modelo demonstrou uma forte proficiência em tarefas de programação. Chase McCoy, engenheiro fundador na CodeGen, relatou que o gpt2-chatbot superou tanto o GPT-4 quanto o Claude Opus em todas as avaliações de programação usadas para testar modelos. “Seu desempenho é definitivamente notável,” afirmou.
Alguns usuários notaram que o gpt2-chatbot poderia engajar em diálogos iterativos para aprimorar suas respostas, mostrando uma consciência de suas limitações. Gao observou: “Parece excelar sobre o GPT-4 em pensamento estratégico, gerando locais específicos e consultas de busca, enquanto o GPT-4 tende a fornecer respostas mais vagas.”
A rápida evolução da inteligência artificial é evidente com o surgimento do gpt2-chatbot. Há pouco mais de um ano, o GPT-4 representava um avanço significativo no raciocínio lógico da IA. Seu concorrente, Claude 3 da Anthropic, também ultrapassou limites em conversas abertas.
Com o desenvolvimento contínuo de modelos de código aberto e o ajuste fino de sistemas existentes, o cenário de IA está evoluindo rapidamente, permitindo que equipes de qualquer tamanho criem e lancem modelos inovadores sem muito aviso. A chegada do “gpt2-chatbot” deixou os pesquisadores animados e destaca os rápidos avanços ocorrendo no domínio da IA.
Embora as implicações completas do gpt2-chatbot ainda sejam incertas, seu lançamento inesperado e capacidades avançadas podem prenunciar uma nova era na IA, onde inovações frequentemente surgem sem aviso prévio nas profundezas da internet.