透過 Quiet-STaR，語言模型學會在回應之前進行分析

Home AI新聞透過 Quiet-STaR，語言模型學會在回應之前進行分析

AI推理的新進展：推出Quiet-STaR

人類擁有獨特的推理能力，能夠思考「如果」和「為什麼」，並解讀隱含信息以解決複雜問題。然而，傳統AI模型在這一推理層次上表現不佳。來自史丹福大學和Notbad AI, Inc.的研究人員開發了Quiet-STaR，這是自學推理器（STaR）模型的一個創新擴展，旨在教會AI在回應之前進行思考，模仿人類的思考過程。

Quiet-STaR的增強功能

Quiet-STaR被實施在Mistral 7B模型上，顯著提高了其零樣本推理能力。在以下領域觀察到顯著進步：

- 常識問答準確率（從36.3%提升至47.2%）

- GSM8K小學數學問題解答（從5.9%提升至10.9%）

這些增強與模型內部思考的令牌數量密切相關。研究人員指出，「Quiet-STaR是邁向能夠以更通用和可擴展方式進行推理的語言模型的一步。」

AI推理的先前限制

早期的AI推理方法過於依賴於特定任務的訓練，導致其通用性有限。模型通常在針對狹窄任務的小心策劃數據集上進行訓練，限制了它們適應更廣泛場景的能力。例如，雖然針對人類推理調整的語言模型超越了直接回答型AI，但這些方法仍然局限於特定數據集。STaR模型顯示AI可以通過反復學習問答數據集來增強推理能力，但過於依賴策劃數據限制了其可擴展性。

研究人員強調，「來自這些數據集的訓練本質上只能涵蓋推理任務的一部分」，因此需要模型從多樣化文本輸入中提取推理基礎。

Quiet-STaR方法論

Quiet-STaR技術在每個令牌生成多個內部思考，並在回應之前參與「思考」過程，這使AI能夠以增強的上下文評估未來的文本。通過運用REINFORCE算法，模型優化其預測，剔除較不準確的輸出，並在訓練過程中反覆精煉推理能力。

為了促進通用推理，研究人員採用了零樣本提示（「讓我們一步一步思考」）並在多樣的網路文本數據集（如OpenWebMath和Colossal Clean Crawled Corpus）上訓練Quiet-STaR。「Quiet-STaR使模型能夠在每個令牌層級靜靜思考，促進了提升效用的分布」，他們指出。

駭客攻擊內部AI聊天機器人的威脅：安全團隊的噩夢

AI風險管理新創公司ValidMind獲得810萬美元資金，協助銀行滿足合規法規要求。

Most people like

Abacus.AI

1.3M

介紹一個創新的AI平台，旨在輕鬆創建先進的AI代理和強大系統。了解這個平台如何使用戶能夠駕馭人工智慧，簡化流程，並輕鬆提升生產力。今天就來解鎖自動化和機器學習的潛力！

人工智慧平台 Large Language Models (LLMs)

Haiper AI

4.3M

在迅速演變的內容創作領域，感知基礎模型正成為一項突破性的工具。這些先進的人工智慧驅動模型旨在提升用戶參與度並簡化創作過程，使內容創作者能夠更高效地產出高品質材料。在探討這些模型重要性的同時，我們將揭示它們如何徹底改變我們對數位內容的理解，為創新和創造力提供無與倫比的潛力。

內容創作 Large Language Models (LLMs)

HitPaw Edimakor

2.4M

介紹一款配備尖端功能的AI視頻編輯器，旨在提升您的視頻製作體驗。這款創新工具利用人工智能的強大能力，簡化編輯過程，讓您輕鬆創作出驚人的視頻。無論您是內容創作者、行銷專家還是導演，我們的先進視頻編輯器都能簡化複雜任務，增強您的編輯能力，讓您能專注於講述您的故事。探索視頻編輯的未來，將您的創意願景化為現實。

影片剪輯 AI Video Editor

Theneo

78.7K

Theneo 是一款創新的 AI 驅動工具，旨在簡化 API 文檔和整合流程，使開發人員更輕鬆地連接和有效協作。

API 文件說明 AI API Design

Find AI tools in YBX