微軟推出「LeMa」：一種突破性的人工智慧學習方法，模擬人類的問題解決能力

Home AI新聞微軟推出「LeMa」：一種突破性的人工智慧學習方法，模擬人類的問題解決能力

Updated on 十一月 2 2023

來自微軟亞洲研究院、北京大學和西安交通大學的研究者們提出了一種創新的技術，以提升大型語言模型（LLM）在數學問題解決方面的能力。這一方法模仿人類學習，鼓勵LLM從錯誤中學習。

這一新技術名為“從錯誤中學習”（LeMa），專注於訓練AI識別並修正自己的錯誤，從而提升推理能力，如最近一篇研究論文所述。

LeMa的靈感

研究者們借鑑了人類的學習過程，強調學生如何從錯誤中學習，以提高未來的表現。作者提到：“面對挑戰的數學問題，學生會從錯誤中學習，並理解如何加以修正。”這一原則應用於LLM，並利用GPT-4生成的錯誤修正數據對進行了微調。

LeMa如何提升數學推理

最初，像LLaMA-2這樣的模型在數學文字問題中產生了錯誤的推理路徑。隨後，GPT-4識別了這些錯誤，明確了缺陷並提供了正確的推理路徑。研究者們利用這些精煉的數據重新訓練原始模型。

LeMa的卓越成果

這一新方法的結果相當顯著。研究者們報告稱：“在五種基礎LLM和兩個數學推理任務中，LeMa始終優於僅基於思路鏈（CoT）數據的微調。”專業模型如WizardMath和MetaMath同樣從LeMa中受益，GSM8K的通過@1準確率達到85.4%，而在MATH上則為27.1%，超越了這些挑戰性領域中非執行開源模型的歷史最佳表現。

更廣泛的影響與未來展望

研究者們的工作，包括代碼、數據和模型，已在GitHub上公開，促進了AI社區的合作，為機器學習的進一步創新鋪平了道路。

LeMa的推出標誌著AI的一個重要進展，顯示出機器學習可以更接近於人類的學習過程。這一演變有望徹底改變依賴AI的領域，如醫療、金融和自主車輛等，在這些領域，錯誤修正和持續學習至關重要。

隨著AI技術的持續發展，整合人類般的學習方法，如從錯誤中學習，將對於開發更高效、更具影響力的AI系統至關重要。這一突破凸顯了人工智慧的巨大潛力，讓我們更接近一個AI能夠在超越人類能力的複雜問題解決任務中表現卓越的未來。

SAP 提升生成式人工智慧，提升開發人員生產力，強化自訂應用程式創建

解鎖 Midjourney 的新風格調整器：一步步提升您的創作指南