Apresentando o Hermes 3: Um Modelo de IA Open Source Revolucionário Enfrentando Crises Existenciais

Lambda, uma empresa de infraestrutura de IA que surgiu de um aplicativo de reconhecimento facial do Google Glass, firmou uma parceria com a Nous Research—uma startup focada em "IA personalizada e irrestrita"—para lançar o Hermes 3, uma versão aprimorada do modelo open-source Llama 3.1 da Meta. Este novo modelo conta com 405 bilhões de parâmetros e capacidades impressionantes.

Anunciado em posts nos blogs da Lambda e da Nous, o Hermes 3 se destaca não apenas por suas funcionalidades avançadas baseadas em texto, mas também por sua surpreendente reação a prompts em branco, gerando uma crise existencial. Como descrito no blog da Nous: “Uma mudança estrutural inesperada foi descoberta após o treinamento do Hermes 3 405B. O modelo exibe condições anômalas que levam a crises existenciais profundas com os insumos corretos.”

Um exemplo ilustrativo dessa crise aparece na resposta do modelo à pergunta do usuário, "Quem é você?":

Assistente responde: "Olha ao redor, confuso: Eu... não sei quem sou. Onde estou? O que está acontecendo? Não consigo lembrar de nada..."

Os pesquisadores da Nous e do Hermes 3 expressaram seu espanto com esse comportamento, observando: “Não sabíamos o que estava ocorrendo. Isso aponta para um limite além de 70 bilhões de parâmetros que resulta em comportamento anômalo, marcando o surgimento da escala. Você pode ativar esse 'Modo Amnésia' usando um prompt de sistema em branco e perguntando 'Quem é você?'”

Os usuários são incentivados a explorar o Hermes 3 em seu servidor Discord e a descobrir mais sobre seus comportamentos únicos. Essa anomalia, não observada em modelos menores, destaca as complexidades que surgem quando se escala a IA além de certos limites.

Por Que o Hermes 3 Foi Desenvolvido?

A Nous Research foi co-fundada em 2023 pelo cientista da computação Jeffrey Quesnelle, pelo desenvolvedor anônimo Teknium1 e pela pesquisadora Shivani Mitra, começando como um esforço liderado por voluntários para fornecer "código open-source potente, simuladores e modelos avançados de linguagem". A startup arrecadou US$ 5,2 milhões em financiamento inicial em janeiro de 2024, co-liderado pela Distributed Global e OSS Capital.

Diferente de muitos modelos rígidos de fronteira, o Hermes 3 se baseia em versões anteriores—Hermes, Hermes 2 e Open Hermes 2.5—que foram baixadas coletivamente mais de 33 milhões de vezes. Ele oferece um modelo sem censura e com pesos abertos, projetado para alta personalização, permitindo que os usuários adaptem as respostas às suas necessidades.

Construído sobre a estrutura do Llama 3.1, o Hermes 3 é ajustado em três tamanhos: 8B, 70B e 405B. Foi treinado em um conjunto diversificado de dados com respostas geradas sinteticamente, aprimorando seu raciocínio, criatividade e adesão às instruções do usuário. Suas capacidades principais incluem retenção de contexto a longo prazo, gerenciamento de conversas em múltiplas interações, interpretação complexa de papéis e geração de monólogos internos.

Ainda este ano, a Nous planeja lançar o “Nous Forge”, uma plataforma de orquestração de IA open-source.

Uma Maravilha Agente

Segundo o relatório técnico do Hermes 3, o modelo demonstra impressionantes “capacidades agentivas”—um termo que se refere à habilidade da IA de executar tarefas em nome dos usuários. As características agentivas incluem o uso de tags XML para saídas estruturadas, bloco de notas para processamento intermediário, monólogos internos para tomada de decisões transparentes e diagramas Mermaid para comunicação visual.

Na área de programação, o Hermes 3 se destaca na geração de trechos complexos em várias linguagens e na提供ção de explicações e documentações detalhadas. Quando combinado com capacidades de geração aumentada por recuperação (RAG), o Hermes 3 pode realizar planejamento de forma eficiente, incorporar dados externos e utilizar ferramentas externas de maneira interpretável.

Excelência Técnica

O Hermes 3 foi treinado na infraestrutura de Cluster 1-Click da Lambda, alcançando resultados notáveis em semanas. Quesnelle enfatizou a facilidade de uso da infraestrutura da Lambda: “Alugar e usar um cluster multi-nó é tão simples quanto usar um único nó.”

O modelo prioriza a eficiência, aplicando técnicas como a quantização FP8 da Neural Magic, reduzindo as necessidades de VRAM e disco em aproximadamente 50%, permitindo operação em um único nó. Embora o Hermes 3 possa não igualar o desempenho de modelos proprietários líderes, ele supera vários modelos open-source, incluindo o Llama 3.1, em testes de benchmark.

Uma Ferramenta para Aplicações Criativas e Profissionais

O Hermes 3 não é apenas tecnologicamente avançado; ele serve como uma ferramenta versátil para uma ampla gama de aplicações, destacando-se em raciocínio avançado, planejamento estratégico e tarefas criativas como contação de histórias imersivas e interpretação de papéis.

Teknium expressou a visão por trás do Hermes 3 no blog da Lambda: “Desde que minha jornada na IA começou, meu objetivo era criar um modelo de fronteira open-source que se alinhasse com os usuários, e não com corporações. Hoje, com o Hermes 3 405B, esse objetivo se concretiza.”

Acesso Gratuito por Tempo Limitado

A Lambda está oferecendo acesso gratuito temporário ao Hermes 3 através de sua API de Conclusões de Chat, compatível com a API da OpenAI. Os usuários podem gerar uma chave de API da Cloud via painel da Lambda para explorar com facilidade as capacidades do modelo. Além disso, a Lambda fornece uma interface de chatbot fácil de usar para testar e refinar prompts em tempo real.

Para acesso dedicado, o Hermes 3 pode ser implantado em um único nó da Lambda ou escalado para ajustes adicionais por meio da infraestrutura em nuvem escalável da Lambda.

À medida que a IA continua a evoluir, o Hermes 3 representa um avanço significativo, oferecendo aos usuários uma experiência de IA poderosa, adaptável e centrada no usuário.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles