Mistral запускает Codestral Mamba: ускорение и расширение скорости генерации кода.

Home Новости ИИ Mistral запускает Codestral Mamba: ускорение и расширение скорости генерации кода.

Updated on июль 16 2024

Французский стартап в области ИИ Mistral, известный своими передовыми моделями открытого кода, запустил две новые большие языковые модели (LLMs): модель, ориентированную на математику, и модель для генерации кода для разработчиков, обе основаны на инновационной архитектуре Mamba, представленная исследователями в прошлом году.

Mamba направлена на повышение эффективности традиционных трансформерных архитектур за счет оптимизации механизмов внимания. Это позволяет моделям на базе Mamba достигать более быстрых временных откликов и поддерживать более длинные контексты, отличая их от типичных трансформеров. Другие компании, такие как AI21, также выпустили модели ИИ, использующие эту архитектуру.

Новая модель Codestral Mamba 7B от Mistral предназначена для быстрой обработки даже длинных текстов, что делает ее идеальной для локальных проектов по программированию. Она доступна на API la Plateforme Mistral и может обрабатывать входные данные до 256,000 токенов — в два раза больше, чем у GPT-4 от OpenAI.

В тестах на производительность Codestral Mamba превзошла несколько конкурентных моделей открытого кода, таких как CodeLlama 7B, CodeGemma-1.17B и DeepSeek в оценках HumanEval. Разработчики могут модифицировать и развертывать Codestral Mamba через ее репозиторий на GitHub и HuggingFace под лицензией Apache 2.0. Mistral утверждает, что предыдущая версия Codestral обошла другие генераторы кода, включая CodeLlama 70B и DeepSeek Coder 33B.

Инструменты для генерации кода и помощники по программированию на базе ИИ стали неотъемлемыми приложениями, а платформы, такие как Copilot от GitHub, CodeWhisperer от Amazon и Codenium, набирают популярность.

Вторая модель Mistral, Mathstral 7B, сосредоточена на математическом мышлении и научных открытиях, разработана в сотрудничестве с проектом Numina. С контекстом на 32k символов, Mathstral работает под лицензией Apache 2.0 и превосходит все существующие модели математического анализа. Она демонстрирует «значительно лучшие результаты» в тестах, которые требуют обширных вычислений во время инференса, и пользователи могут выбрать использовать ее в исходном виде или доработать под свои нужды.

«Mathstral является примером отличного соотношения производительности и скорости, достигаемого при создании моделей для специализированных приложений — философия, которой мы придерживаемся в la Plateforme, особенно с улучшенными возможностями настройки,» — отметили в блоге Mistral.

Mathstral доступна через la Plateforme Mistral и HuggingFace.

Конкурируя с лидерами отрасли, такими как OpenAI и Anthropic, Mistral недавно привлек $640 миллионов в рамках раунда финансирования серии B, что повысило его оценку почти до $6 миллиардов с инвестициями от таких технологических гигантов, как Microsoft и IBM.

Cohere и Fujitsu объединили усилия для запуска 'Takane' — японской модели глубокого обучения (LLM), разработанной для предприятий.

Microsoft достигла 200% ежемесячного роста в новом решении для управления данными.

Most people like

YouTube Summarized

99K

Представляем YouTube Summarized — инновационный инструмент ИИ, разработанный для создания кратких резюме видео и подкастов на YouTube без усилий. Благодаря своим продвинутым алгоритмам, YouTube Summarized преобразует объемный контент в усваиваемые основные моменты, облегчая быстрый доступ к необходимой информации.

Генератор резюме видео на базе ИИ AI Content Generator

GVA NDAチェック

563.1K

Защитите свои соглашения с помощью инструмента проверки NDA на базе ИИ.

НДА Other

AI Hug

38.6K

Преобразуйте текст и изображения в потрясающие профессиональные видео с помощью нашего AI-инструмента без лишних усилий. Поднимите уровень своего контента с помощью передовых технологий, упрощающих процесс создания видео и делающих его доступным для всех. Независимо от того, являетесь ли вы маркетологом, преподавателем или создателем контента, этот инновационный AI-инструмент создан для того, чтобы легко и точно оживлять ваши идеи. Откройте для себя будущее видеопроизводства уже сегодня!

Создание видео с помощью ИИ Other

CVBee.ai: The Ultimate Online CV Maker

5.2K

Создавайте профессиональные резюме без усилий с помощью CVBee.ai — генератора резюме на основе ИИ всего за несколько минут. Поднимите свои заявки на работу и улучшите карьерные перспективы уже сегодня!

резюме Resume Builder

Find AI tools in YBX