Google DeepMind представила новую платформу 'Self-Discover', предназначенную для улучшения моделей на основе больших языковых моделей (LLM) и повышения производительности GPT-4.

В стремлении улучшить возможности рассуждения крупных языковых моделей (LLM) исследователи из Google DeepMind и Университета Южной Калифорнии представили революционную методику «самооткрытия».

Опубликованная на arXiv и Hugging Face, эта инновационная методика превосходит существующие техники подсказок и показывает улучшения в работе различных моделей, включая GPT-4 от OpenAI и PaLM 2 от Google. «Метод самооткрытия значительно увеличивает эффективность GPT-4 и PaLM 2 на сложных тестах рассуждений, таких как BigBench-Hard и MATH, до 32% по сравнению с методами цепи размышлений (CoT)», — заявляют исследователи в своей статье.

Данная методология позволяет LLM самостоятельно определять структуры рассуждений, специфичные для задач, чтобы эффективнее решать проблемы. Анализируя множество атомарных модулей рассуждений — таких как критическое мышление и пошаговое рассуждение — модели могут создать явную структуру рассуждений для решения задач.

Одним из самых привлекательных аспектов этого подхода является его эффективность: он требует в 10-40 раз меньше вычислительных ресурсов, что делает его крайне выгодным для бизнеса.

Эволюция рассуждений LLM

LLM достигли значительных успехов в выполнении различных задач благодаря способности обрабатывать инструкции, рассуждать и генерировать последовательные ответы. Используя трансформаторную архитектуру, эти модели применяют разнообразные стратегии подсказок, основанные на когнитивных теориях человеческого мышления и решения проблем. Это включает в себя методики с немногими образцами и без образцов, разложение задач на подзадачи и рефлексивное обдумывание для вывода общих принципов.

Хотя эти методы, особенно цепь размышлений, эффективны, они часто основываются на неявных предположениях о подходах к задачам. Исследователи утверждают, что это может быть не оптимально, так как каждая задача имеет уникальную внутреннюю структуру, которая может выигрывать от адаптированного подхода.

В своем последнем исследовании команда DeepMind и USC предлагает всеобъемлющую методику подсказок, которая самостоятельно выявляет базовую структуру для выбора наиболее подходящей стратегии рассуждения и оптимизации эффективности. «Метод самооткрытия моделируется на том, как люди создают внутренние программы рассуждений для решения задач. Из набора атомарных модулей рассуждений, таких как «разложите на подзадачи» и «критическое мышление», LLM формирует последовательную структуру рассуждений, специфичную для задачи на первом этапе, затем применяет эту структуру во втором этапе для решения конкретных задач», — уточняют исследователи.

Замечательные приросты в производительности

Чтобы оценить эффективность новой методики, исследователи протестировали ее на нескольких моделях, включая GPT-4 и PaLM 2-L, по 25 задачам рассуждения, таким как BigBench-Hard и MATH. Метод самооткрытия превзошел метод цепи размышлений в 21 из 25 задач, достигнув приростов производительности до 32% и значительно увеличив эффективность, требуя в 10–40 раз меньше вычислений для вывода.

Согласно результатам, при тестировании с GPT-4 метод самооткрытия показал точности 81%, 85% и 73% на задачах Big-Bench Hard, Thinking for Doing и MATH соответственно. В то время как метод цепи размышлений показал более низкие точности: 75%, 52% и 71%. Аналогичный разрыв в производительности был замечен и при сравнении с подходом планирования и решения.

Для PaLM 2-L были достигнуты точности 67%, 69% и 50,5% по трем задачам, что превышает результаты цепи размышлений (60%, 40% и 42%) и планирования и решения (61%, 42% и 49%).

Продвижение возможностей рассуждения ИИ

Методика самооткрытия имеет потенциал революционизировать подход LLM к решению задач, приближая их к достижению общего интеллекта. Исследования по переносимости показывают, что составленные структуры рассуждений имеют широкие применения для различных моделей и схожи с человеческим рассуждением.

«Смотрим в будущее, мы стремимся продолжить исследование структурированного рассуждения в LLM, чтобы улучшить возможности решения задач и открыть новые направления для сотрудничества между человеком и ИИ», — заключила команда.

Most people like

Find AI tools in YBX