谷歌DeepMind开发了一种突破性人工智能系统,名为AlphaGeometry,能够解决与人类国际数学奥林匹克(IMO)金牌得主相媲美的复杂几何问题。
AlphaGeometry将两种不同的方法结合在一起:一个生成直观思维的神经语言模型和一个使用形式逻辑验证这些思维的符号推理引擎。该语言模型基于与谷歌知名搜索引擎和自然语言处理系统相同的技术,而推理引擎则借鉴了中国数学家吴文俊在1978年创建的方法。
研究人员对AlphaGeometry进行了测试,使用了IMO的30个严格几何问题,这些问题即使对于专家数学家也具有挑战性。值得注意的是,这个系统在标准时间限制4.5小时内成功解决了25个问题,达到了人类金牌得主的平均水平。相比之下,之前的领先系统仅解决了10个问题。
发表在《自然》杂志上的研究成果表明,人工智能不仅能够进行逻辑推理,还能发现新的数学见解。数学,尤其是几何 historically, 一直对人工智能研究者构成挑战,因为这需要创造性和精确度。与可访问大量网络数据的文本模型不同,数学数据更具象征性并特定于领域,使其更为稀缺。此外,解决数学问题需要强大的逻辑推理能力,而目前大多数人工智能模型在这一领域表现不够理想。
为应对这些挑战,研究人员应用了一种新颖的神经-符号方法,充分利用神经网络和符号系统的优势。神经网络擅长模式识别和结果预测,但通常缺乏解释能力。而符号系统则依赖严格的形式逻辑,使其能够校正并解释神经网络所做的决策。
研究团队将这一方法比作诺贝尔奖得主丹尼尔·卡尼曼所推广的“快与慢思维”理念,一种系统提供快速的直观想法,而另一种则进行更细致的逻辑推理。两者结合,共同应对复杂的数学挑战。
此外,AlphaGeometry还展示了对新问题的泛化能力,能够证明问题陈述中未明确给出的定理。例如,它成功证明了与三角形角平分线相关的定理,而这一前提和目标在题目中均未给出。
研究团队希望通过开源他们的系统,能够激励在数学、科学和人工智能领域的进一步研究与应用。他们也意识到当前的局限性,比如需要更人性化的证明和对更复杂问题的可扩展性,以及与数学中人工智能相关的伦理问题。
尽管AlphaGeometry目前专注于几何,但研究人员相信他们的合成数据方法可以增强在数学和科学领域的人工智能推理,尤其是在人工生成的训练数据有限的情况下。通过自动化新知识的发现和验证,机器学习有潜力显著加速人类在各个学科的理解。