Stability AI запускает модель 'Smol': представляем StableLM Zephyr 3B

Home Новости ИИ Stability AI запускает модель 'Smol': представляем StableLM Zephyr 3B

Updated on декабрь 7 2023

Stability AI приобрела популярность благодаря своим инновационным моделям генеративного ИИ для преобразования текста в изображения, но теперь компания расширяет свои предложения.

Сегодня Stability AI представила свое последнее достижение: StableLM Zephyr 3B. Эта модель — крупная языковая модель (LLM) с 3 миллиардами параметров, предназначенная для различных приложений чата, включая генерацию текста, суммирование и персонализацию контента. StableLM Zephyr 3B — это оптимизированная, более компактная версия первоначальной модели генерации текста StableLM, представленная ранее в этом году.

Одним из ключевых преимуществ StableLM Zephyr 3B является его размер. Он меньше, чем версии с 7 миллиардами параметров, что позволяет развертывать его на более широком диапазоне оборудования с меньшими ресурсными затратами, обеспечивая при этом быструю реакцию. Модель была специально оптимизирована для задач вопрос-ответ и инструкций.

«StableLM обучалась дольше на более качественных данных, чем предыдущие модели, используя в два раза больше токенов по сравнению с LLaMA v2 7b, при этом достигая такой же базовой производительности, как и эта модель, при размере всего 40%», — отметил Эмад Мостаки, генеральный директор Stability AI.

StableLM Zephyr 3B не является совершенно новой моделью, а скорее расширением существующей модели StableLM 3B-4e1t. Его дизайн основан на модели Zephyr 7B от HuggingFace, работающей под открытой лицензией MIT и предназначенной для использования в качестве помощника. Zephyr использует метод обучения, называемый Оптимизацией Прямых Предпочтений (DPO), который также применяется в StableLM.

Мостаки уточнил, что DPO служит альтернативой методам обучения с подкреплением, использовавшимся в предыдущих моделях, улучшая их для более точного соответствия человеческим предпочтениям. Хотя DPO в основном использовалась в больших моделях, StableLM Zephyr стала одной из первых эффективных реализаций этого подхода в модели с 3 миллиардами параметров.

Stability AI применила DPO вместе с набором данных UltraFeedback от исследовательской группы OpenBMB, который включает более 64,000 запросов и 256,000 ответов. Это сочетание DPO, размера модели и оптимизированного обучающего набора данных обеспечивают впечатляющие показатели производительности. Например, в оценке MT Bench StableLM Zephyr 3B превзошла более крупные модели, включая Llama-2-70b-chat от Meta и Claude-V1 от Anthropic.

Расширяющийся Портфель Моделей

StableLM Zephyr 3B делает вклад в растущий ряд моделей, которые выпускает Stability AI, стремясь постоянно улучшать свои возможности. В августе компания запустила StableCode для разработки приложений, а в сентябре — Stable Audio для генерации текста в аудио. В ноябре состоялся предварительный показ Stable Video Diffusion, что стало вхождением Stability AI в генерацию видео.

Несмотря на это расширение, Stability AI продолжает оставаться верной своим корням в генерации текста в изображения. Недавно компания представила SDXL Turbo — более быструю версию своей флагманской модели текст-в-изображение SDXL.

Мостаки подчеркивает, что впереди нас ждет множество инноваций от Stability AI. «Мы верим, что маленькие, открытые, производительные модели, адаптированные к конкретным данным пользователей, превзойдут большие универсальные модели», — объясняет он. «С предстоящим полным выпуском наших новых моделей StableLM мы надеемся продолжать демократизацию генеративных языковых моделей».

Mine привлекает инвестиции в размере 30 миллионов долларов для разработки решений по обеспечению конфиденциальности с использованием искусственного интеллекта для предприятий.

Cisco Полностью Принимает ИИ для Укрепления Свойственной Стратегии Кибербезопасности

Most people like

MachineTranslation.com

693.6K

Резюме: MachineTranslation.com — современная онлайн-платформа, использующая искусственный интеллект и машинное обучение для улучшения глобальной коммуникации с помощью доступных и надежных решений для машинного перевода.

машинный перевод Translate

AI Picasso

19.4K

Создавайте потрясающие произведения искусства без усилий с помощью передовых технологий ИИ на сайте AI Picasso. Освободите свое творчество и исследуйте мир художественных возможностей уже сегодня!

Искусственный интеллект AI Art Generator

Suno AI Music: Free AI Music Generator

1.6M

Революционный генератор музыки на основе ИИ: раскройте свою креативность! Откройте для себя будущее создания музыки с нашим передовым генератором музыки на базе ИИ. Наслаждайтесь бесшовной композицией и безграничными возможностями, используя силу искусственного интеллекта для создания уникальных мелодий. Независимо от того, являетесь ли вы опытным музыкантом или новичком, наш инновационный инструмент создан, чтобы вдохновлять и поднимать ваше музыкальное путешествие. Примите эволюцию звука уже сегодня!

Генератор музыки на основе ИИ AI Music Generator

SocialBu - Social Media Management and Automation

385.6K

SocialBu — это мощный инструмент, созданный для оптимизации и автоматизации управления вашими социальными медиа на различных платформах.

управление социальными сетями AI Social Media Assistant

Find AI tools in YBX