微軟推出「LeMa」:一種突破性的人工智慧學習方法,模擬人類的問題解決能力

來自微軟亞洲研究院、北京大學和西安交通大學的研究者們提出了一種創新的技術,以提升大型語言模型(LLM)在數學問題解決方面的能力。這一方法模仿人類學習,鼓勵LLM從錯誤中學習。

這一新技術名為“從錯誤中學習”(LeMa),專注於訓練AI識別並修正自己的錯誤,從而提升推理能力,如最近一篇研究論文所述。

LeMa的靈感

研究者們借鑑了人類的學習過程,強調學生如何從錯誤中學習,以提高未來的表現。作者提到:“面對挑戰的數學問題,學生會從錯誤中學習,並理解如何加以修正。”這一原則應用於LLM,並利用GPT-4生成的錯誤修正數據對進行了微調。

LeMa如何提升數學推理

最初,像LLaMA-2這樣的模型在數學文字問題中產生了錯誤的推理路徑。隨後,GPT-4識別了這些錯誤,明確了缺陷並提供了正確的推理路徑。研究者們利用這些精煉的數據重新訓練原始模型。

LeMa的卓越成果

這一新方法的結果相當顯著。研究者們報告稱:“在五種基礎LLM和兩個數學推理任務中,LeMa始終優於僅基於思路鏈(CoT)數據的微調。”專業模型如WizardMath和MetaMath同樣從LeMa中受益,GSM8K的通過@1準確率達到85.4%,而在MATH上則為27.1%,超越了這些挑戰性領域中非執行開源模型的歷史最佳表現。

更廣泛的影響與未來展望

研究者們的工作,包括代碼、數據和模型,已在GitHub上公開,促進了AI社區的合作,為機器學習的進一步創新鋪平了道路。

LeMa的推出標誌著AI的一個重要進展,顯示出機器學習可以更接近於人類的學習過程。這一演變有望徹底改變依賴AI的領域,如醫療、金融和自主車輛等,在這些領域,錯誤修正和持續學習至關重要。

隨著AI技術的持續發展,整合人類般的學習方法,如從錯誤中學習,將對於開發更高效、更具影響力的AI系統至關重要。這一突破凸顯了人工智慧的巨大潛力,讓我們更接近一個AI能夠在超越人類能力的複雜問題解決任務中表現卓越的未來。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles