Meta представила Llama 3.2: стремление конкурировать с OpenAI и Anthropic

Meta's Llama 3.2: Новая Эра Мультимодального ИИ

Сегодня на Meta Connect компания представила Llama 3.2 — свою первую значимую модель, сочетающую понимание как изображений, так и текста. Llama 3.2 включает модели среднего и малого размера (11B и 90B параметров), а также более легкие текстовые модели (1B и 3B параметров), оптимизированные для мобильных и крайних устройств.

«Это наша первая открытая мультимодальная модель», — заявил генеральный директор Meta Марк Цукерберг на своей презентации. «Она откроет широкий спектр приложений, требующих визуального понимания». Как и ее предшественник, Llama 3.2 предлагает обширную длину контекста в 128 000 токенов, что позволяет обрабатывать значительный объем текста, эквивалентный сотням страниц учебников. Более высокое количество параметров, как правило, улучшает точность модели и ее способности в решении сложных задач.

Meta также представила официальные дистрибутивы Llama stack, позволяющие разработчикам использовать эти модели в различных средах: на месте, на устройстве, в облаке и в односторонних настройках. «Открытый код — это наиболее экономичный, настраиваемый и надежный вариант», — отметил Цукерберг. «Мы достигли переломного момента в отрасли; это становится стандартом, подобно Linux в мире ИИ».

Конкуренция с Claude и GPT-4o

Всего через два месяца после запуска Llama 3.1 Meta сообщает о десятикратном увеличении ее возможностей. «Llama продолжает быстро развиваться», — отметил Цукерберг. «Она открывает все больше функциональных возможностей».

Две крупнейшие модели Llama 3.2 (11B и 90B) теперь поддерживают использование изображений, позволяя интерпретировать графики, генерировать подписи к изображениям и распознавать объекты на основе естественных языковых запросов. Например, пользователи могут узнать о месяце пиковых продаж своей компании, и модель сможет сделать выводы с помощью доступных графиков. Более крупные модели могут извлекать информацию из изображений для создания детализированных подписей.

Легкие модели способствуют разработке персонализированных приложений для частного использования, таких как резюмирование недавних коммуникаций или управление календарными приглашениями для последующих встреч. Meta утверждает, что Llama 3.2 конкурентоспособна с Claude 3 Haiku от Anthropic и GPT-4o-mini от OpenAI в задачах распознавания изображений и визуального понимания. Особенно она превосходит таких конкурентов, как Gemma и Phi 3.5-mini в следовании инструкциям, резюмировании, использовании инструментов и переписывании запросов.

Модели Llama 3.2 доступны для загрузки на llama.com, Hugging Face и на платформах партнеров Meta.

Расширенные функции бизнес-ИИ и привлекательность для потребителей

Meta также улучшает свой бизнес-ИИ, позволяя предприятиям использовать рекламу с функцией «щелчка для сообщений» в WhatsApp и Messenger. Это включает разработку агентов, способных отвечать на часто задаваемые вопросы, обсуждать детали продуктов и завершать покупки.

Компания сообщает, что более 1 миллиона рекламодателей используют ее инструменты генеративного ИИ, в результате чего было создано 15 миллионов объявлений за последний месяц. В среднем рекламные кампании с использованием генеративного ИИ Meta демонстрируют увеличение коэффициента кликов на 11% и рост коэффициента конверсии на 7,6%.

Для потребителей Meta AI получает «голос», включая голоса нескольких знаменитостей, таких как Дама Джуди Денч, Джон Сина, Киган-Майкл Ки, Кристен Белл и Оквофи́на.

«Я верю, что голос станет более естественным способом взаимодействия с ИИ, чем текст», — заявил Цукерберг. «Это просто намного лучше». Модель может реагировать на голосовые или текстовые команды в голосах знаменитостей на таких платформах, как WhatsApp, Messenger, Facebook и Instagram. Meta AI также будет реагировать на найденные изображения, с возможностью редактирования картинок путем добавления или изменения фонов. Кроме того, Meta экспериментирует с новыми инструментами перевода, дубляжа видео и синхронизации движений губ для Meta AI.

Цукерберг подчеркнул, что Meta AI нацелен стать наиболее широко используемым помощником в мире, утверждая: «Вероятно, он уже таким и является».

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles