Система искусственного интеллекта, разработанная Google DeepMind, одним из ведущих AI-лабораторий в мире, способна решать сложные задачи по геометрии на уровне, сравнимом с уровнем золотых медалистов Международной математической олимпиады (IMO). Эта инновационная система, названная AlphaGeometry, сочетает два разных подхода: нейронную языковую модель, генерирующую интуитивные идеи, и символьный логический движок, проверяющий эти идеи с помощью формальной логики.
Языковая модель основана на той же технологии, что и известные поисковые и языковые системы Google. Символьный движок вдохновлён методом, разработанным китайским математиком Уэнь-Цюнем У в 1978 году. Исследователи протестировали AlphaGeometry на 30 сложных задачах по геометрии из IMO, которые считаются трудными даже для экспертов. Заметно, что система успешно решила 25 из этих задач за стандартное время в 4,5 часа, соответствуя среднему результату золотых медалистов. В отличие от неё, предыдущая ведущая система, основанная на методе У, решила только 10 задач.
Результаты, опубликованные в журнале Nature, показывают, что искусственный интеллект может не только логически рассуждать, но и открывать новые математические идеи. Математика, особенно геометрия, исторически представляла собой вызов для исследователей AI из-за необходимости сочетания креативности и точности. В отличие от текстовых моделей, которые могут использовать большие объёмы интернет-данных, математические данные более символичны и специализированы, что делает их более редкими. Более того, решение математических задач требует мощного логического мышления, в области которого большинство существующих моделей AI сталкиваются с трудностями.
Чтобы справиться с этими задачами, исследователи применили новый нейро-символьный подход, используя сильные стороны как нейронных сетей, так и символьных систем. Нейронные сети прекрасно справляются с распознаванием паттернов и предсказанием результатов, но часто не обладают объяснительной силой. В отличие от них, символьные системы опираются на строгую формальную логику, что позволяет им корректировать и обосновывать решения, принятые нейронной сетью.
Исследователи сравнили свой подход с концепцией "думать, быстро и медленно", популяризированной Нобелевским лауреатом Дэниелом Канеманом, где одна система предлагает быстрые, интуитивные идеи, а другая занимается более тщательным логическим рассуждением. Вместе эти системы сотрудничают для решения сложных математических задач.
Кроме того, AlphaGeometry продемонстрировала способность обобщать на новые задачи, доказывая теоремы, которые не были явно указаны в условиях. Например, она успешно доказала теорему о биссектрисе угла треугольника, которая не была заявлена ни как предпосылка, ни как цель.
Команда надеется, что сделав свою систему открытой, она вдохновит дальнейшие исследования и применение в математике, науке и AI. Они также признают текущие ограничения, такие как необходимость в более читабельных доказательствах и масштабируемость для более сложных задач, наряду с этическими аспектами использования AI в математике.
Хотя AlphaGeometry сейчас сосредоточена на геометрии, исследователи считают, что их методология синтетических данных может усилить способность AI рассуждать в математических и научных областях, где доступных данных, созданных человеком, мало. Автоматизируя открытие и проверку новых знаний, машинное обучение может значительно ускорить понимание людьми различных дисциплин.