Пионерская модель открытого исходного кода теперь признана лучшей в мире согласно последним рейтингам Hugging Face, ведущей платформы для исследований и приложений в области обработки естественного языка (NLP). Модель под названием “Smaug-72B” была сегодня публично выпущена стартапом Abacus AI, сосредоточенным на решении сложных задач в области искусственного интеллекта и машинного обучения. Smaug-72B является доработанной версией “Qwen-72B”, другой известной языковой модели, представленнной исследовательской командой Alibaba Group всего несколько месяцев назад.
Значительно, что Smaug-72B превосходит GPT-3.5 и Mistral Medium от OpenAI — две из самых продвинутых проприетарных языковых моделей — по нескольким ключевым показателям. Особенно стоит отметить, что она значительно превышает Qwen-72B в множестве оценок.
Согласно таблице лидеров Hugging Face Open LLM, оценивающей производительность открытых языковых моделей по различным задачам, Smaug-72B стала первой и единственной моделью с средним баллом выше 80 во всех основных оценках. Хотя она еще не достигла среднего балла 90-100, указывающего на уровень человеческого восприятия, ее выпуск сигнализирует о потенциальном сдвиге в области открытого искусственного интеллекта, предполагая, что она вскоре сможет соперничать с возможностями крупных технокомпаний, которые долгое время считались недоступными.
Преимущества открытого исходного кода
“Smaug-72B от Abacus AI теперь возглавляет таблицу LLM как первая модель, достигнувшая среднего балла 80,” — заявила генеральный директор Abacus AI Бинду Редди в посте на X.com. “Наша следующая цель — опубликовать эти техники в виде исследования и применить их к топовым моделям Mistral, включая Miqu, доработанную версию LLama-2 с 70B параметрами. Примененные нами техники специально направлены на развитие навыков логического мышления и математики, что и объясняет впечатляющие результаты в GSM8K! Мы предоставим дополнительную информацию в нашем предстоящем исследовании.”
С момента своего выпуска Smaug-72B выделяется не только общей производительностью, но и исключительными возможностями в решении задач на логику и математику, которые были улучшены благодаря конкретным методам доработки, применяемым Abacus AI. Эти техники устраняют общие слабости больших языковых моделей, приводя к улучшению их работы.
Другие значимые разработки в области открытого исходного кода включают Qwen 1.5, набор малых, но мощных языковых моделей с количеством параметров от 0.5B до 72B, представленный Qwen. Qwen 1.5 превосходит популярные проприетарные модели, такие как Mistral Medium и GPT-3.5, и обладает длиной контекста 32k, а также совместимостью с различными инструментами для быстрого локального вывода. Кроме того, Qwen представил новый большой визуальный языковой модель Qwen-VL-Max, которая конкурирует с Gemini Ultra от Google и GPT-4V от OpenAI.
Будущее ИИ
Возвышение Smaug-72B и Qwen 1.5 вызвало большой интерес и обсуждения в AI-сообществе и среди технологических кругов. Многие эксперты высоко оценили вклады Abacus AI и Qwen в открытый искусственный интеллект, подчеркивая стремительные достижения за последний год.
“Удивительно думать, что менее года назад мы восхищались такими моделями, как Dolly,” — заметила Сахар Мор, влиятельный аналитик AI, в LinkedIn, отмечая быстрый прогресс в области открытых моделей.
Обе модели, Smaug-72B и Qwen 1.5, доступны для общественного доступа на Hugging Face, позволяя пользователям загружать, использовать и модифицировать их по своему усмотрению. Abacus AI и Qwen также планируют представить свои модели в таблице лидеров оценки гуманного уровня llmsys — новой метрики для оценки производительности языковых моделей в задачах, сходных с человеческим восприятием. Они намекнули на будущие проекты, направленные на создание большего количества открытых моделей и исследование различных применений.
Smaug-72B и Qwen 1.5 демонстрируют стремительную эволюцию открытого ИИ в последние месяцы. Они символизируют волну новаторства и демократизации, бросая вызов доминированию крупных технологических компаний и расширяя возможности для разработчиков и исследователей. Будущее лидерства Smaug-72B в таблице Hugging Face остается неясным, но очевидно, что открытый искусственный интеллект набирает значительный импульс.