Google DeepMind представила новую платформу 'Self-Discover', предназначенную для улучшения моделей на основе больших языковых моделей (LLM) и повышения производительности GPT-4.

Home Новости ИИ Google DeepMind представила новую платформу 'Self-Discover', предназначенную для улучшения моделей на основе больших языковых моделей (LLM) и повышения производительности GPT-4.

Updated on февраль 7 2024

В стремлении улучшить возможности рассуждения крупных языковых моделей (LLM) исследователи из Google DeepMind и Университета Южной Калифорнии представили революционную методику «самооткрытия».

Опубликованная на arXiv и Hugging Face, эта инновационная методика превосходит существующие техники подсказок и показывает улучшения в работе различных моделей, включая GPT-4 от OpenAI и PaLM 2 от Google. «Метод самооткрытия значительно увеличивает эффективность GPT-4 и PaLM 2 на сложных тестах рассуждений, таких как BigBench-Hard и MATH, до 32% по сравнению с методами цепи размышлений (CoT)», — заявляют исследователи в своей статье.

Данная методология позволяет LLM самостоятельно определять структуры рассуждений, специфичные для задач, чтобы эффективнее решать проблемы. Анализируя множество атомарных модулей рассуждений — таких как критическое мышление и пошаговое рассуждение — модели могут создать явную структуру рассуждений для решения задач.

Одним из самых привлекательных аспектов этого подхода является его эффективность: он требует в 10-40 раз меньше вычислительных ресурсов, что делает его крайне выгодным для бизнеса.

Эволюция рассуждений LLM

LLM достигли значительных успехов в выполнении различных задач благодаря способности обрабатывать инструкции, рассуждать и генерировать последовательные ответы. Используя трансформаторную архитектуру, эти модели применяют разнообразные стратегии подсказок, основанные на когнитивных теориях человеческого мышления и решения проблем. Это включает в себя методики с немногими образцами и без образцов, разложение задач на подзадачи и рефлексивное обдумывание для вывода общих принципов.

Хотя эти методы, особенно цепь размышлений, эффективны, они часто основываются на неявных предположениях о подходах к задачам. Исследователи утверждают, что это может быть не оптимально, так как каждая задача имеет уникальную внутреннюю структуру, которая может выигрывать от адаптированного подхода.

В своем последнем исследовании команда DeepMind и USC предлагает всеобъемлющую методику подсказок, которая самостоятельно выявляет базовую структуру для выбора наиболее подходящей стратегии рассуждения и оптимизации эффективности. «Метод самооткрытия моделируется на том, как люди создают внутренние программы рассуждений для решения задач. Из набора атомарных модулей рассуждений, таких как «разложите на подзадачи» и «критическое мышление», LLM формирует последовательную структуру рассуждений, специфичную для задачи на первом этапе, затем применяет эту структуру во втором этапе для решения конкретных задач», — уточняют исследователи.

Замечательные приросты в производительности

Чтобы оценить эффективность новой методики, исследователи протестировали ее на нескольких моделях, включая GPT-4 и PaLM 2-L, по 25 задачам рассуждения, таким как BigBench-Hard и MATH. Метод самооткрытия превзошел метод цепи размышлений в 21 из 25 задач, достигнув приростов производительности до 32% и значительно увеличив эффективность, требуя в 10–40 раз меньше вычислений для вывода.

Согласно результатам, при тестировании с GPT-4 метод самооткрытия показал точности 81%, 85% и 73% на задачах Big-Bench Hard, Thinking for Doing и MATH соответственно. В то время как метод цепи размышлений показал более низкие точности: 75%, 52% и 71%. Аналогичный разрыв в производительности был замечен и при сравнении с подходом планирования и решения.

Для PaLM 2-L были достигнуты точности 67%, 69% и 50,5% по трем задачам, что превышает результаты цепи размышлений (60%, 40% и 42%) и планирования и решения (61%, 42% и 49%).

Продвижение возможностей рассуждения ИИ

Методика самооткрытия имеет потенциал революционизировать подход LLM к решению задач, приближая их к достижению общего интеллекта. Исследования по переносимости показывают, что составленные структуры рассуждений имеют широкие применения для различных моделей и схожи с человеческим рассуждением.

«Смотрим в будущее, мы стремимся продолжить исследование структурированного рассуждения в LLM, чтобы улучшить возможности решения задач и открыть новые направления для сотрудничества между человеком и ИИ», — заключила команда.

Рост нежелательных звонков в IV квартале, ожидается увеличение мошенничества с использованием ИИ в 2024 году

Байден назначил руководителей Института безопасности ИИ на фоне продолжающихся опасений по поводу финансирования NIST.

Most people like

Vidful.ai

9.3K

Преобразуйте свой текст и изображения в захватывающие видео с помощью бесплатного генератора видео Vidful.ai! Основанный на инновационных технологиях Kuaishou Kling AI и Luma AI Dream Machine, этот инструмент позволяет вам легко создавать потрясающий визуальный контент.

Другие Image to Video

SciSpace

5.4M

SciSpace — это инновационный AI-инструмент, созданный для помощи пользователям в лучшем понимании и оценке научных статей. Независимо от того, являетесь ли вы студентом, исследователем или специалистом, SciSpace преобразует сложную информацию в доступные insights, облегчая навигацию в мире академической литературы.

Инструмент на базе ИИ Papers

Diib

188.7K

Diib — это инновационный инструмент SEO, который создает персонализированный план роста, seamlessly анализируя данные вашего сайта вместе с Google Analytics. Всего за 60 секунд вы можете улучшить SEO, скорость сайта, безопасность и общий пользовательский опыт благодаря ясным, практическим рекомендациям, адаптированным под ваши нужды.

Инструмент SEO AI SEO Assistant

CodeSquire - AI code writing assistant

7.1K

CodeSquire — это инновационный ИИ-ассистент, специально разработанный для специалистов по данным, который без усилий генерирует кодовые функции для оптимизации рабочего процесса и повышения продуктивности.

ИИ AI Code Assistant

Find AI tools in YBX