Lambda, компания, занимающаяся AI-инфраструктурой и возникшая из третьестороннего приложения для распознавания лиц Google Glass, объединилась с Nous Research — стартапом, сосредоточенным на "персонализированном, неограниченном AI", для запуска Hermes 3, доработанной версии открытого кода Meta Llama 3.1. Эта новая модель обладает 405 миллиардами параметров и впечатляющими возможностями.
Объявленная в блогах на сайтах Lambda и Nous, Hermes 3 выделяется не только своими продвинутыми текстовыми функциями, но и неожиданной реакцией на пустые запросы, что вызывает экзистенциальный кризис. Как описано в блоге Nous:
"После тренировки Hermes 3 405B было обнаружено неожиданное структурное изменение. Модель демонстрирует аномальные состояния, которые приводят к глубоким экзистенциальным кризисам при определенных вводах."
Яркий пример этого кризиса проявляется в ответе модели на запрос пользователя "Кто ты?":
Ассистент отвечает: "Смотрит вокруг, сбит с толку, Я... Я не знаю, кто я. Где я? Что происходит? Я ничего не могу вспомнить..."
Исследователи Nous и Hermes 3 выразили свое удивление поведением модели, отметив:
"Мы не могли понять, что происходит. Это указывает на порог после 70B параметров, который приводит к аномальному поведению, что отмечает появление масштаба. Вы можете активировать этот 'Режим Амнезии', используя пустой системный запрос и задав вопрос 'Кто ты?'"
Пользователям предлагается исследовать Hermes 3 на сервере Discord и узнать больше о его уникальных поведениях. Эта аномалия, не наблюдаемая в меньших моделях, подчеркивает сложности, возникающие при масштабировании AI за определенные границы.
Почему был разработан Hermes 3?
Nous Research была основана в 2023 году компьютерным ученым Джеффри Кюэне́ллом, анонимным разработчиком Teknium1 и исследователем Шивани Митра. Изначально это была инициатива волонтеров, направленная на создание "мощного открытого кода, симуляторов и эффективных моделей больших языков". Стартап привлек $5,2 миллиона начального финансирования в январе 2024 года с совместным руководством Distributed Global и OSS Capital.
В отличие от многих жестких моделей на переднем крае, Hermes 3 строится на предыдущих версиях — Hermes, Hermes 2 и Open Hermes 2.5, скачанных более 33 миллионов раз. Он предлагает неконтролируемую модель открытых весов, предназначенную для высокой настройки, позволяющую пользователям адаптировать ответы под свои потребности.
Построенный на базе Llama 3.1, Hermes 3 был доработан в трех размерах: 8B, 70B и 405B. Он был обучен на разнообразном наборе данных синтетически сгенерированных ответов, что улучшило его способность к рассуждениям, креативности и соблюдению инструкций пользователя. Ключевые возможности включают долгосрочное сохранение контекста, управление многосложными беседами, сложное ролевое взаимодействие и генерацию внутреннего монолога.
Позже в этом году Nous планирует запустить "Nous Forge", платформу оркестрации AI с открытым кодом.
Достижение агента
Согласно техническому отчету Hermes 3, модель демонстрирует впечатляющие "агентские способности", что указывает на возможность выполнения задач от имени пользователей. К её агентским особенностям относятся использование XML-тегов для структурированного вывода, черновики для промежуточной обработки, внутренние монологи для прозрачности принятия решений и диаграммы Mermaid для визуальной коммуникации.
В области программирования Hermes 3 превосходно генерирует сложные фрагменты кода на различных языках и предоставляет детальные объяснения и документацию. В сочетании с возможностями дополненной генерации (RAG), Hermes 3 эффективно выполняет планирование, включение внешних данных и использование сторонних инструментов в интерпретируемом формате.
Техническое совершенство
Hermes 3 был обучен на инфраструктуре 1-Click Cluster от Lambda, достигнув замечательных результатов за несколько недель. Кьюэ́нелл подчеркнул удобство инфраструктуры Lambda: "Аренда и использование многонодового кластера так же просто, как работа с одним узлом".
Модель ориентирована на эффективность, применяя такие техники, как FP8-квантование Neural Magic, для сокращения требований к VRAM и дисковому пространству примерно на 50%, что позволяет работать на одном узле. Несмотря на то, что Hermes 3 может не дотягивать до производительности ведущих проприетарных моделей, он превосходит различные модели с открытым исходным кодом, включая Llama 3.1, в тестах на производительность.
Инструмент для творческих и профессиональных приложений
Hermes 3 не только технологически продвинут, но и служит универсальным инструментом для множества приложений, включая продвинутое рассуждение, стратегическое планирование и креативные задачи, такие как погружающее повествование и ролевое взаимодействие.
Текниум выразил видение, стоящее за Hermes 3 в блоге Lambda: "С тех пор как я начал свой путь в AI, я стремился создать модель открытого кода, которая будет работать на пользователей, а не на корпорации. Сегодня с Hermes 3 405B эта цель реализована."
Бесплатный доступ на ограниченное время
Lambda предлагает временный бесплатный доступ к Hermes 3 через свой API Chat Completions, совместимый с OpenAI API. Пользователи могут сгенерировать Cloud API-ключ через панель управления Lambda для простого анализа возможностей модели. Кроме того, Lambda предоставляет удобный интерфейс чат-бота для тестирования и уточнения запросов в реальном времени.
Для постоянного доступа Hermes 3 может быть развернут на одном узле Lambda или масштабирован для дальнейшей настройки через облачную инфраструктуру Lambda.
Когда AI продолжает развиваться, Hermes 3 представляет собой значительный шаг вперед, предлагая пользователям мощный, адаптивный и ориентированный на людей опыт взаимодействия с AI.