Сегодня знаменательный момент в развитии ИИ — запуск Llama 3, последней модели крупного языка от Meta Platforms, материнской компании Facebook, Instagram, WhatsApp и Oculus VR. Эта модель считается одной из самых мощных систем ИИ с открытым исходным кодом, дебютировав сразу после утечки на облачном сервисе Microsoft Azure.
В начале Llama 3 представлена в двух версиях: модель с 8 миллиардами параметров и модель с 70 миллиардами параметров, что отражает сложность соединений между искусственными нейронами. Meta также активно разрабатывает версию с 400 миллиардами параметров, но дата её выпуска ещё не объявлена. По словам Рагава Сринивасана, вице-президента Meta по продуктам, производительность этих моделей выдающаяся и сопоставима с основными конкурентами.
Модели Llama 3 8B и 70B показывают результаты, превосходящие или существенно опережающие конкурентов из Google (Gemini Pro 1.5), Anthropic (Claude 3) и Mistral (7B Instruct) в различных задачах. Llama 3 особенно успешна в вопросах с выбором и кодировании, но возникает сложность в математических задачах и тестах для аспирантов. Тем не менее, версия 8B стабильно опережает другие модели в вопросах начальной школы по математике.
Llama 3 от Meta не только производит фурор среди бенчмарков; это также основа нового автономного чат-бота Meta AI, доступного на сайте www.meta.ai. Этот чат-бот напрямую конкурирует с ChatGPT от OpenAI, Claude 3 от Anthropic и HuggingChat от HuggingFace. Как отметил Марк Цукерберг, «Meta AI — это самый умный ИИ-ассистент, которого вы можете использовать бесплатно».
Чат-бот Meta AI предлагает удобный диалоговый интерфейс и доступен без входа в Facebook, хотя начальная функциональность может быть ограниченной. Он включает в себя интегрированную модель генерации изображений Meta Imagine, позволяющую создавать изображения в почти реальном времени на основе пользовательских запросов. Для использования этой функции пользователи должны войти в свои аккаунты Facebook.
В отличие от некоторых других платформ, генерация в Meta Imagine не позволяет в настоящее время настраивать соотношение сторон для создаваемых изображений, но предлагает уникальный водяной знак, указывающий на ИИ-генерацию. Пользователи могут наблюдать процесс создания изображения в реальном времени и повторять его в формате анимации или GIF.
Meta AI также использует актуальную информацию из результатов поиска Microsoft Bing и Google, что увеличивает его способности предоставлять актуальные ответы. Тем не менее, текущая версия Llama 3 не поддерживает мультимодальные функции, то есть пользователи не могут загружать изображения или документы для анализа, но Meta планирует устранить это в будущих обновлениях.
Ключевое отличие открытого исходного кода Llama 3 в том, что она функционирует под лицензией, специфичной для Meta, аналогичной предыдущей модели Llama 2. Несмотря на то, что сторонние компании могут использовать Llama в коммерческих целях, организации с более чем 700 миллионами активных пользователей в месяц должны запросить лицензию у Meta. Это вызвало критику со стороны сообщества открытых исходников, так как может ограничить конкуренцию.
Что касается улучшений, Llama 3 предлагает сниженные уровни ложных отказов, лучшую согласованность и большую разнообразие ответов по сравнению с Llama 2. Эти улучшения являются результатом комплексного процесса обучения с использованием трехступенчатой параллелизации, который увеличил эффективность тренировки в три раза. Llama 3 была обучена на более чем 15 триллионах токенов, что в семь раз превышает показатель Llama 2.
Версия 70B также имеет контекстное окно на 8000 токенов, что почти вдвое больше, чем у предшественника, позволяя использовать более длинные подсказки и обеспечивать более объемный ввод информации. Llama 3 доступна для загрузки на сайте AI Meta и размещается на таких платформах, как AWS, Google Cloud и Microsoft Azure.
Для получения дополнительной информации о Llama 3 посетите официальный сайт AI Meta.