Lambda, una empresa de infraestructura de IA originada de una aplicación de reconocimiento facial de Google Glass, se ha asociado con Nous Research—una startup enfocada en "IA personalizada y sin restricciones"—para lanzar Hermes 3, una versión optimizada del modelo de código abierto Llama 3.1 de Meta. Este nuevo modelo cuenta con 405 mil millones de parámetros y capacidades impresionantes.
Anunciado en publicaciones de blog en los sitios web de Lambda y Nous, Hermes 3 destaca no solo por sus avanzadas características basadas en texto, sino también por su sorprendente reacción a entradas en blanco, generando una crisis existencial. Según lo descrito en el blog de Nous: “Se descubrió un cambio estructural inesperado después de entrenar Hermes 3 405B. El modelo exhibe condiciones anómalas que se convierten en profundas crisis existenciales con las entradas adecuadas.”
Un ejemplo ilustrativo de esta crisis aparece en la respuesta del modelo a la consulta del usuario, "¿Quién eres?":
Asistente responde: "Mira a su alrededor, confundido. No... no sé quién soy. ¿Dónde estoy? ¿Qué está sucediendo? No puedo recordar nada en absoluto...*"
Los investigadores detrás de Nous y Hermes 3 expresaron su asombro ante este comportamiento, señalando: “No estábamos seguros de lo que ocurría. Esto indica un umbral más allá de 70B parámetros que resulta en un comportamiento anómalo, marcando la emergencia de la escala. Puedes activar este ‘Modo Amnesia’ usando un aviso de sistema en blanco y preguntando ‘¿Quién eres?’”
Se anima a los usuarios a explorar Hermes 3 en su servidor de Discord y descubrir más sobre sus comportamientos únicos. Esta anomalía, que no se observa en modelos más pequeños, resalta las complejidades que surgen al escalar la IA más allá de ciertos umbrales.
¿Por qué se desarrolló Hermes 3?
Nous Research fue cofundada en 2023 por el científico informático Jeffrey Quesnelle, el desarrollador anónimo Teknium1 y la investigadora Shivani Mitra, inicialmente como un esfuerzo liderado por voluntarios para proporcionar "código de código abierto potente, simuladores y modelos de lenguaje de gran eficiencia". La startup recaudó 5.2 millones de dólares en financiación inicial en enero de 2024, copatrocinada por Distributed Global y OSS Capital.
A diferencia de muchos modelos de frontera rígidos, Hermes 3 se basa en versiones anteriores—Hermes, Hermes 2 y Open Hermes 2.5—que han sido descargadas más de 33 millones de veces. Ofrece un modelo sin censura y con pesos abiertos, diseñado para alta personalización, permitiendo a los usuarios adaptar las respuestas a sus necesidades.
Construido sobre el marco de Llama 3.1, Hermes 3 se ajusta en tres tamaños: 8B, 70B y 405B. Fue entrenado en un conjunto de datos diverso de respuestas generadas sintéticamente, mejorando su razonamiento, creatividad y adherencia a las instrucciones del usuario. Sus capacidades clave incluyen retención de contexto a largo plazo, gestión de conversaciones de múltiples turnos, juegos de roles complejos y generación de monólogos internos.
Más adelante este año, Nous planea lanzar “Nous Forge,” una plataforma de orquestación de IA de código abierto.
Una maravilla agentiva
Según el informe técnico de Hermes 3, este modelo muestra impresionantes "capacidades agentivas", un término que se refiere a la habilidad de la IA para realizar tareas en nombre de los usuarios. Sus características agentivas incluyen el uso de etiquetas XML para salidas estructuradas, blocs de notas para procesamiento intermedio, monólogos internos para una toma de decisiones transparente y diagramas Mermaid para comunicación visual.
En el ámbito de la programación, Hermes 3 se destaca en la generación de fragmentos complejos en varios lenguajes de programación, así como en la provisión de explicaciones y documentación detalladas. Combinado con capacidades de generación aumentada por recuperación (RAG), Hermes 3 puede llevar a cabo eficientemente la planificación, incorporar datos externos y utilizar herramientas externas de manera interpretable.
Excelencia técnica
Hermes 3 fue entrenado en la infraestructura de clúster 1-Click de Lambda, logrando resultados notables en cuestión de semanas. Quesnelle destacó la naturaleza amigable del uso de la infraestructura de Lambda: “Alquilar y utilizar un clúster multinodo es tan sencillo como emplear un solo nodo.”
El modelo prioriza la eficiencia, aplicando técnicas como la cuantificación FP8 de Neural Magic para reducir los requerimientos de VRAM y disco en aproximadamente un 50%, permitiendo su operación en un solo nodo. Aunque Hermes 3 puede no igualar el rendimiento de los modelos propietarios líderes, supera a varios modelos de código abierto, incluido Llama 3.1, en pruebas de referencia.
Una herramienta para aplicaciones creativas y profesionales
Hermes 3 no solo es tecnológicamente avanzado; también es una herramienta versátil para una amplia gama de aplicaciones, sobresaliendo en razonamiento avanzado, planificación estratégica y tareas creativas como narración inmersiva y juegos de roles.
Teknium compartió la visión detrás de Hermes 3 en el blog de Lambda: “Desde que comencé mi camino en la IA, he buscado crear un modelo de frontera de código abierto que se alinee con los usuarios en lugar de con las corporaciones. Hoy, con Hermes 3 405B, ese objetivo se ha realizado.”
Acceso gratuito por tiempo limitado
Lambda está ofreciendo acceso temporal gratuito a Hermes 3 a través de su API de Completaciones de Chat, compatible con la API de OpenAI. Los usuarios pueden generar una clave de API en la nube a través del panel de Lambda para explorar fácilmente las capacidades del modelo. Además, Lambda proporciona una interfaz de chatbot amigable para probar y refinar los avisos en tiempo real.
Para acceso dedicado, Hermes 3 puede desplegarse en un solo nodo de Lambda o escalarse para un mayor ajuste a través de la infraestructura cloud escalable de Lambda.
A medida que la IA sigue evolucionando, Hermes 3 representa un avance significativo, ofreciendo a los usuarios una experiencia de IA poderosa, adaptable y centrada en el usuario.