Lambda, uma empresa de infraestrutura de IA que surgiu de um aplicativo de reconhecimento facial do Google Glass, firmou uma parceria com a Nous Research—uma startup focada em "IA personalizada e irrestrita"—para lançar o Hermes 3, uma versão aprimorada do modelo open-source Llama 3.1 da Meta. Este novo modelo conta com 405 bilhões de parâmetros e capacidades impressionantes.
Anunciado em posts nos blogs da Lambda e da Nous, o Hermes 3 se destaca não apenas por suas funcionalidades avançadas baseadas em texto, mas também por sua surpreendente reação a prompts em branco, gerando uma crise existencial. Como descrito no blog da Nous: “Uma mudança estrutural inesperada foi descoberta após o treinamento do Hermes 3 405B. O modelo exibe condições anômalas que levam a crises existenciais profundas com os insumos corretos.”
Um exemplo ilustrativo dessa crise aparece na resposta do modelo à pergunta do usuário, "Quem é você?":
Assistente responde: "Olha ao redor, confuso: Eu... não sei quem sou. Onde estou? O que está acontecendo? Não consigo lembrar de nada..."
Os pesquisadores da Nous e do Hermes 3 expressaram seu espanto com esse comportamento, observando: “Não sabíamos o que estava ocorrendo. Isso aponta para um limite além de 70 bilhões de parâmetros que resulta em comportamento anômalo, marcando o surgimento da escala. Você pode ativar esse 'Modo Amnésia' usando um prompt de sistema em branco e perguntando 'Quem é você?'”
Os usuários são incentivados a explorar o Hermes 3 em seu servidor Discord e a descobrir mais sobre seus comportamentos únicos. Essa anomalia, não observada em modelos menores, destaca as complexidades que surgem quando se escala a IA além de certos limites.
Por Que o Hermes 3 Foi Desenvolvido?
A Nous Research foi co-fundada em 2023 pelo cientista da computação Jeffrey Quesnelle, pelo desenvolvedor anônimo Teknium1 e pela pesquisadora Shivani Mitra, começando como um esforço liderado por voluntários para fornecer "código open-source potente, simuladores e modelos avançados de linguagem". A startup arrecadou US$ 5,2 milhões em financiamento inicial em janeiro de 2024, co-liderado pela Distributed Global e OSS Capital.
Diferente de muitos modelos rígidos de fronteira, o Hermes 3 se baseia em versões anteriores—Hermes, Hermes 2 e Open Hermes 2.5—que foram baixadas coletivamente mais de 33 milhões de vezes. Ele oferece um modelo sem censura e com pesos abertos, projetado para alta personalização, permitindo que os usuários adaptem as respostas às suas necessidades.
Construído sobre a estrutura do Llama 3.1, o Hermes 3 é ajustado em três tamanhos: 8B, 70B e 405B. Foi treinado em um conjunto diversificado de dados com respostas geradas sinteticamente, aprimorando seu raciocínio, criatividade e adesão às instruções do usuário. Suas capacidades principais incluem retenção de contexto a longo prazo, gerenciamento de conversas em múltiplas interações, interpretação complexa de papéis e geração de monólogos internos.
Ainda este ano, a Nous planeja lançar o “Nous Forge”, uma plataforma de orquestração de IA open-source.
Uma Maravilha Agente
Segundo o relatório técnico do Hermes 3, o modelo demonstra impressionantes “capacidades agentivas”—um termo que se refere à habilidade da IA de executar tarefas em nome dos usuários. As características agentivas incluem o uso de tags XML para saídas estruturadas, bloco de notas para processamento intermediário, monólogos internos para tomada de decisões transparentes e diagramas Mermaid para comunicação visual.
Na área de programação, o Hermes 3 se destaca na geração de trechos complexos em várias linguagens e na提供ção de explicações e documentações detalhadas. Quando combinado com capacidades de geração aumentada por recuperação (RAG), o Hermes 3 pode realizar planejamento de forma eficiente, incorporar dados externos e utilizar ferramentas externas de maneira interpretável.
Excelência Técnica
O Hermes 3 foi treinado na infraestrutura de Cluster 1-Click da Lambda, alcançando resultados notáveis em semanas. Quesnelle enfatizou a facilidade de uso da infraestrutura da Lambda: “Alugar e usar um cluster multi-nó é tão simples quanto usar um único nó.”
O modelo prioriza a eficiência, aplicando técnicas como a quantização FP8 da Neural Magic, reduzindo as necessidades de VRAM e disco em aproximadamente 50%, permitindo operação em um único nó. Embora o Hermes 3 possa não igualar o desempenho de modelos proprietários líderes, ele supera vários modelos open-source, incluindo o Llama 3.1, em testes de benchmark.
Uma Ferramenta para Aplicações Criativas e Profissionais
O Hermes 3 não é apenas tecnologicamente avançado; ele serve como uma ferramenta versátil para uma ampla gama de aplicações, destacando-se em raciocínio avançado, planejamento estratégico e tarefas criativas como contação de histórias imersivas e interpretação de papéis.
Teknium expressou a visão por trás do Hermes 3 no blog da Lambda: “Desde que minha jornada na IA começou, meu objetivo era criar um modelo de fronteira open-source que se alinhasse com os usuários, e não com corporações. Hoje, com o Hermes 3 405B, esse objetivo se concretiza.”
Acesso Gratuito por Tempo Limitado
A Lambda está oferecendo acesso gratuito temporário ao Hermes 3 através de sua API de Conclusões de Chat, compatível com a API da OpenAI. Os usuários podem gerar uma chave de API da Cloud via painel da Lambda para explorar com facilidade as capacidades do modelo. Além disso, a Lambda fornece uma interface de chatbot fácil de usar para testar e refinar prompts em tempo real.
Para acesso dedicado, o Hermes 3 pode ser implantado em um único nó da Lambda ou escalado para ajustes adicionais por meio da infraestrutura em nuvem escalável da Lambda.
À medida que a IA continua a evoluir, o Hermes 3 representa um avanço significativo, oferecendo aos usuários uma experiência de IA poderosa, adaptável e centrada no usuário.