Исследователи из Microsoft Research Asia, Пекинского университета и Сианьского политехнического университета представили инновационную технику, направленную на улучшение математических способностей больших языковых моделей (LLM). Этот подход имитирует человеческое обучение, побуждая LLM учиться на своих ошибках.
Новая стратегия, получившая название Learning from Mistakes (LeMa), сосредоточена на обучении ИИ распознавать и исправлять собственные ошибки, что ведет к улучшению логических навыков, как указано в недавней научной статье.
Вдохновение для LeMa
Опираясь на процесс человеческого обучения, исследователи подчеркивают, как студенты учатся на своих ошибках для повышения будущих результатов. Как отмечают авторы: "Студент, столкнувшийся с трудной математической задачей, учится на своих ошибках и понимает, как их исправить." Этот принцип был использован для LLM с помощью пар данных, созданных GPT-4 для тонкой настройки.
Как LeMa улучшает математическую логику
Изначально модели, такие как LLaMA-2, генерировали ошибочные логические цепочки при решении математических задач. Затем GPT-4 выявил эти ошибки, разъяснив их и предложив исправленные логические пути. Исследователи использовали эти уточненные данные для повторной тренировки исходных моделей.
Выдающиеся результаты LeMa
Результаты этой новаторской методологии впечатляют. "Во всех пяти основных LLM и двух задачах математического рассуждения LeMa постоянно превосходит дообучение, основанное исключительно на данных Chain of Thought (CoT)," сообщают исследователи. Специализированные модели, такие как WizardMath и MetaMath, также достигли успехов благодаря LeMa, добившись точности pass@1 в 85.4% на GSM8K и 27.1% на MATH, что превосходит предыдущие достижения моделей с открытым исходным кодом в этих сложных областях.
Широкие последствия и перспективы на будущее
Работа исследователей, включая их код, данные и модели, доступна на GitHub, что способствует сотрудничеству в сообществе ИИ и открывает путь для дальнейших инноваций в области машинного обучения.
Введение LeMa знаменует собой важный шаг вперед в развитии ИИ, свидетельствуя о том, что машинное обучение может более точно воспроизводить процессы человеческого обучения. Эта эволюция может революционизировать такие области, как здравоохранение, финансы и автономные транспортные средства, где исправление ошибок и непрерывное обучение имеют решающее значение.
По мере дальнейшего развития ИИ интеграция методов обучения, подобных человеческим, таких как обучение на ошибках, станет важной для создания более эффективных и значимых систем. Этот прорыв подчеркивает огромный потенциал искусственного интеллекта и приближает нас к будущему, в котором ИИ будет успешно решать сложные задачи, выходящие за рамки человеческих возможностей.