NVIDIA открывает доступ к модели Nemotron-70B, ускоряя развитие ИИ
Недавно NVIDIA выпустила свою мощную модель Nemotron-70B в открытом доступе. С момента запуска она вызвала значительные обсуждения в сообществе ИИ, превосходя более 140 моделей, включая GPT-4, GPT-4 Turbo и Claude 3.5 Sonnet по различным бенчмаркам, уступив лишь последней модели OpenAI, o1.
Созданная на основе Llama-3.1-70B, модель Nemotron-70B была обучена с использованием обучения с подкреплением на основе человеческой обратной связи (RLHF) и новой смешанной методики обучения, которая включает модели Брэдли-Терри и регрессионный анализ для моделирования вознаграждений. Доступный для общественности тренировочный датасет, а также сигналы вознаграждения на основе Llama-3.1-Nemotron-70B-Reward, позволяют модели использовать подсказки HelpSteer2-Preference для генерации ответов, более точно соответствующих человеческим предпочтениям.
В оценках производительности, таких как LMSYS Large Model Arena Hard test, Nemotron-70B набрала 85 баллов; на AlpacaEval 2 LC — 57.6, а на GPT-4-Turbo MT-Bench — 8.98. Эти результаты подчеркивают её выдающиеся возможности.
Оценка пользователей показывает, что Nemotron-70B отлично справляется с решением сложных задач. Например, при вычислении количества бананов модель точно проанализировала и нашла правильный ответ. Хотя она допустила небольшую ошибку в отношении даты смерти 89-летней знаменитости, её общая производительность остаётся впечатляющей.
Результаты модели при сложных запросах также заслуживают внимания. Хотя она не полностью прошла некоторые тесты, её первоначальные ответы были провокационными. Например, обсуждая расстояние до Луны и возможность её обхода, модель углубилась в детальное обсуждение с точки зрения физики, приводя к разумным выводам.
Эксперты отрасли предполагают, что стратегия NVIDIA по постоянному открытию доступа к мощным моделям направлена на увеличение продаж чипов. С ростом сложности моделей компании вынуждены заказывать больше чипов для обучения, что позволяет открытым моделям эффективно способствовать продажам оборудования. Однако эта стратегия создает значительное давление на стартапы, которые сталкиваются с трудностями в конкуренции с технологическими гигантами в вопросах коммерциализации и видимости. Если они не смогут выйти на прибыль, им угрожает потеря инвестиций.
Несмотря на эти вызовы, открытый доступ к Nemotron-70B, безусловно, добавляет значительную ценность в сообщество ИИ. Эта модель способствует развитию технологий ИИ, предоставляя исследователям и разработчикам новые возможности и варианты. Инициатива NVIDIA по открытию исходных кодов не только вносит свежую энергию в эту область, но и закладывает основу для появления новых высококачественных открытых моделей, способствуя совместному росту в секторе ИИ.