Илон Маск запускает Grok 2 от xAI: изменит ли это ландшафт отрасли, как GPT-4?

Запуск Grok-2: Новое поколение ИИ-бота от xAI

14 августа стартап ИИ Илона Маска xAI официально запустил Grok-2, своего нового чат-бота, утверждая, что он соперничает с продуктами OpenAI, Google и Anthropic. Серия Grok-2 включает две версии: Grok-2, основной языковой модель с улучшенными аналитическими способностями, и Grok-2 mini, облегченную версию, разработанную для приложений, требующих быстрого отклика.

Возможности Grok-2

Grok-2 описывается как "модель уровня GPT-4", прекрасно справляющаяся с задачами анализа, программирования и ведения беседы, что подтверждается впечатляющими результатами внутреннего тестирования в xAI. Хотя Grok-2 mini может уступать в производительности, он выделяется своей скоростью. xAI сообщает о значительных успехах Grok-2 в решении сложных задач, особенно в точном выявлении недостающей информации и фильтрации нерелевантного контента.

По данным бенчмарков, Grok-2 демонстрирует выдающиеся результаты. Согласно данным от xAI, Grok-2 обошёл GPT-4 Turbo и Claude 3 Opus на таблице лидеров LMSYS, а в некоторых тестах даже сравнительно с GPT-4o и Llama 3-405B. Тем не менее, такие результаты вызвали скептицизм; аналитики отмечают возможные расхождения в времени сравнения xAI с GPT-4o, что может указывать на завышенные показатели.

Рыночная позиция Grok-2

Независимые оценки вывели Grok-2 в топ-5 ИИ-ботов, на одно место ниже Gemini от Google и ChatGPT от OpenAI. Этан Моллик, эксперт по ИИ из Wharton School, заявил: "Теперь есть пять моделей ИИ уровня GPT-4: GPT-4o, Claude 3.5, Gemini 1.5, Llama 3.1 и Grok-2." Он подчеркнул, что хотя все эти модели обладают значительным потенциалом, ни одна из них ещё не превзошла GPT-4.

xAI позиционирует Grok-2 как значительное улучшение в области моделирования ИИ, способное предоставлять более интуитивные, контролируемые и универсальные результаты для различных задач. По оценкам LMSYS, Grok-2 опережает лучшие модели от Meta и Anthropic. Кроме того, xAI делает акцент на том, чтобы система соблюдала указания пользователя и предоставляла точную информацию, что является ответом на критику, с которой сталкивался предшественник Grok-1.5 из-за "галлюцинаций ИИ".

Инновации в генерации изображений

Выдающейся особенностью Grok-2 является возможность прямой генерации изображений, разработанная на основе недавно популярной модели FLUX.1. Эта функция расширяет возможности Grok-2 на социальных платформах, значительно усиливая креативность пользователей. Маск отметил эту возможность, заявив, что она будет постепенно доступна пользователям Premium и Premium+. Однако у пользователей останутся некоторые ограничения, например, пользователи Premium смогут генерировать около 20-30 изображений в месяц, в то время как Premium+ смогут создать больше. Это ограничение вызвало обсуждения среди пользователей, которые считают, что оно может препятствовать их творческому опыту.

Будущие перспективы

С запуском Grok-2 Маск раскрыл планы xAI по разработке Grok-3, который ожидается к концу года. Grok-3 станет масштабным обновлением с использованием 100,000 чипов Nvidia H100, стремясь создать "самую мощную модель ИИ в мире по всем параметрам." Если это удастся, релиз Grok-3 может укрепить позицию xAI в конкурентной сфере ИИ. Тем не менее, чтобы преуспеть против таких гигантов, как OpenAI и Google, xAI необходимо добиться больших прорывов в технологиях и реализации продукции.

Most people like

Find AI tools in YBX