Stability AI представляет обновлённую модель Stable LM 2 с 12 миллиардами параметров.

Stability AI продолжает быстро развиваться, представив Stable LM 2 — модель с 12 миллиардами параметров, запущенную сегодня. Хотя компания известна своей технологией текстового изображения Stable Diffusion, она предлагает более широкий спектр генеративных AI моделей, выходящих за рамки простой генерации изображений.

Stable LM дебютировал в апреле 2023 года как крупная языковая модель (LLM) для текстового контента и получил первое обновление с моделью Stable LM 2 на 1,6 миллиарда параметров в январе. Новая версия Stable LM 2 12B значительно улучшает возможности Stable LM, boasting more parameters and enhanced performance that reportedly surpass larger models like Llama 2 70B in specific benchmarks.

Stable LM 2 12B включает базовую версию и версию, настроенную на выполнения инструкций, которая направлена на улучшение навыков общения на семи языках: английском, испанском, немецком, итальянском, французском, португальском и нидерландском. Эти модели доступны для коммерческого использования через членство в Stability AI.

«Модель с инструкциями специально разработана для взаимодействия с пользователями в разговорном формате», — отметил Карлос Рикельме, руководитель языковой команды Stability AI. «Кроме того, мы вложили значительные усилия в улучшение безопасности».

Это обновление последовало за недавней отставкой сооснователя и CEO Эмада Мостака на фоне управленческих споров, однако это демонстрирует уверенное развитие компании под руководством временных CEO Шан Шан Вонг и Кристиана Лафорта.

Stability AI стремится совместить производительность и доступность с помощью Stable LM 2, утверждая, что модель на 12B находит идеальный баланс между мощностью, точностью и удобством использования. Благодаря своим 12 миллиардам параметров она может выполнять задачи, обычно отведенные для гораздо более крупных моделей. Результаты тестирования показывают, что Stable LM 2 12B значительно не уступает более крупным аналогам.

Важно отметить, что методология, использованная при разработке модели на 1,6B, также применялась для создания новой версии на 12B.

«Мы представляем будущее, где модели функционируют не изолированно, а как части сложных систем, позволяя взаимодействие между несколькими языковыми моделями и внешними программными инструментами», — объяснил Рикельме. «Модель на 12B была обучена выполнять 'мастер' роль, подключаясь и используя различные функции и API для удовлетворения разнообразных потребностей пользователей».

Stability AI также улучшает ранее выпущенную модель на 1,6B. Рикельме подчеркнул, что, хотя меньшая модель способна эффективно решать определенные задачи, большая 12B предлагает больше возможностей. Тем не менее, обновленная версия Stable LM 2 1,6B улучшила свои навыки общения, повысила меры безопасности и совместимость с другими программными инструментами.

«Она сохраняет свой предыдущий размер, обеспечивая скорость и легкость», — отметил Рикельме. «С другой стороны, модель на 12B мощнее и надежнее, но требует больших вычислительных ресурсов».

Он подчеркивает, что в зависимости от сценариев использования и доступных ресурсов — таких как время отклика, память и бюджет — каждая модель предлагает уникальные компромиссы.

«Мы считаем, что не существует одной оптимальной модели для каждого сценария, именно поэтому мы предлагаем две разные модели», — добавил он.

Most people like

Find AI tools in YBX