Stability AI запускает модель 'Smol': представляем StableLM Zephyr 3B

Stability AI приобрела популярность благодаря своим инновационным моделям генеративного ИИ для преобразования текста в изображения, но теперь компания расширяет свои предложения.

Сегодня Stability AI представила свое последнее достижение: StableLM Zephyr 3B. Эта модель — крупная языковая модель (LLM) с 3 миллиардами параметров, предназначенная для различных приложений чата, включая генерацию текста, суммирование и персонализацию контента. StableLM Zephyr 3B — это оптимизированная, более компактная версия первоначальной модели генерации текста StableLM, представленная ранее в этом году.

Одним из ключевых преимуществ StableLM Zephyr 3B является его размер. Он меньше, чем версии с 7 миллиардами параметров, что позволяет развертывать его на более широком диапазоне оборудования с меньшими ресурсными затратами, обеспечивая при этом быструю реакцию. Модель была специально оптимизирована для задач вопрос-ответ и инструкций.

«StableLM обучалась дольше на более качественных данных, чем предыдущие модели, используя в два раза больше токенов по сравнению с LLaMA v2 7b, при этом достигая такой же базовой производительности, как и эта модель, при размере всего 40%», — отметил Эмад Мостаки, генеральный директор Stability AI.

StableLM Zephyr 3B не является совершенно новой моделью, а скорее расширением существующей модели StableLM 3B-4e1t. Его дизайн основан на модели Zephyr 7B от HuggingFace, работающей под открытой лицензией MIT и предназначенной для использования в качестве помощника. Zephyr использует метод обучения, называемый Оптимизацией Прямых Предпочтений (DPO), который также применяется в StableLM.

Мостаки уточнил, что DPO служит альтернативой методам обучения с подкреплением, использовавшимся в предыдущих моделях, улучшая их для более точного соответствия человеческим предпочтениям. Хотя DPO в основном использовалась в больших моделях, StableLM Zephyr стала одной из первых эффективных реализаций этого подхода в модели с 3 миллиардами параметров.

Stability AI применила DPO вместе с набором данных UltraFeedback от исследовательской группы OpenBMB, который включает более 64,000 запросов и 256,000 ответов. Это сочетание DPO, размера модели и оптимизированного обучающего набора данных обеспечивают впечатляющие показатели производительности. Например, в оценке MT Bench StableLM Zephyr 3B превзошла более крупные модели, включая Llama-2-70b-chat от Meta и Claude-V1 от Anthropic.

Расширяющийся Портфель Моделей

StableLM Zephyr 3B делает вклад в растущий ряд моделей, которые выпускает Stability AI, стремясь постоянно улучшать свои возможности. В августе компания запустила StableCode для разработки приложений, а в сентябре — Stable Audio для генерации текста в аудио. В ноябре состоялся предварительный показ Stable Video Diffusion, что стало вхождением Stability AI в генерацию видео.

Несмотря на это расширение, Stability AI продолжает оставаться верной своим корням в генерации текста в изображения. Недавно компания представила SDXL Turbo — более быструю версию своей флагманской модели текст-в-изображение SDXL.

Мостаки подчеркивает, что впереди нас ждет множество инноваций от Stability AI. «Мы верим, что маленькие, открытые, производительные модели, адаптированные к конкретным данным пользователей, превзойдут большие универсальные модели», — объясняет он. «С предстоящим полным выпуском наших новых моделей StableLM мы надеемся продолжать демократизацию генеративных языковых моделей».

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles