Google DeepMind 開發的一款開創性人工智慧系統——AlphaGeometry,能夠解決複雜的幾何問題,其水平堪比在全球著名的國際數學奧林匹亞(IMO)中獲得金牌的人類數學家。這一創新系統結合了兩種獨特的技術:一種是生成直觀想法的神經語言模型,另一種是運用形式邏輯驗證這些想法的符號推理引擎。該語言模型基於支撐Google著名搜尋引擎和自然語言處理系統的技術,而推理引擎則受到了中國數學家吳文俊在1978年創建的方法的啟發。
研究人員對AlphaGeometry進行了測試,選擇了30個來自IMO的嚴格幾何問題,這些問題對於專業數學家來說仍然具有挑戰性。值得注意的是,該系統在4.5小時的標準時間內成功解決了25個問題,與人類金牌得獎者的平均得分相當。相較之下,之前的領先系統僅解決了10個問題。
根據《自然》雜誌發表的研究結果顯示,人工智慧不僅能進行邏輯推理,還能挖掘新的數學見解。數學,尤其是幾何,歷來對AI研究人員提出挑戰,因為它需要兼具創造力與精確性。與基於文本的模型不同,數學數據更加符號化且特定領域專用,因而更為稀缺。此外,解題也需要強大的邏輯推理能力,這是目前大多數AI模型所面臨的困難。
為了解決這些挑戰,研究人員採用了新穎的神經符號方法,結合了神經網絡和符號系統的優勢。神經網絡在模式識別和結果預測方面表現出色,但往往缺乏解釋能力。相對而言,符號系統運行於嚴格的形式邏輯之上,使其能夠修正和解釋神經網絡的決策。
研究團隊將其方法比作諾貝爾獎得主丹尼爾·卡尼曼所推廣的「快速與慢思考」的概念,其中一個系統提供快速直觀的想法,而另一個則進行更為深思熟慮的邏輯推理。這兩種系統協同合作,以應對複雜的數學挑戰。
此外,AlphaGeometry還展示了對新問題的泛化能力,成功證明了問題陳述中未明確提到的定理。例如,它成功證明了與三角形角平分線有關的定理,該定理既不是前提也不是目標。
研究團隊希望通過開源他們的系統,激發數學、科學和人工智慧領域的進一步研究和應用。他們也承認當前的限制,例如需要更多人類可讀的證明和擴展到更複雜問題的能力,以及與人工智慧在數學領域相關的倫理考量。
儘管AlphaGeometry目前專注於幾何問題,研究人員相信,他們的合成數據方法將有助於在數學和科學領域強化人工智慧的推理能力,尤其是在人工生成的訓練數據有限的情況下。通過自動化新知識的發現和驗證,機器學習有潛力在多樣化的學科中顯著加速人類的理解。