Google DeepMind 推出生成評估器 GenRM 以增強 AI 推理能力
2023 年 8 月 27 日,Google DeepMind 團隊在 arXiv 發布了一篇論文,介紹他們創新的生成評估器 GenRM。這一新的獎勵模型旨在顯著提升生成式 AI 的推理能力。
目前,優化大型語言模型(LLMs)的主流方法是「最佳選擇法」(Best-of-N)。此方法生成 N 個候選解,然後由評估器排名以確定最佳選項。然而,傳統的 LLM 評估器通常僅作為判別型分類器,未能充分利用預訓練 LLM 的文本生成能力。
為了克服這一限制,DeepMind 團隊利用下一個標記的預測對評估器進行了訓練,將驗證和解決方案生成整合在一起。GenRM 相較於傳統評估器具有幾個明顯優勢:
- 無縫的指令調整整合
- 支援思考鏈推理
- 使用多數投票計算額外推理時間
在涉及算法和基礎數學推理的任務中,GenRM 在 Gemma 的評估實驗中超越了傳統的判別評估器和 LLM 代判評估器,解題成功率提升幅度達 16% 至 64%。
Google DeepMind 表示,GenRM 代表了 AI 獎勵系統的一次重要進步,特別增強了防止新模型訓練中潛在詐騙行為的能力。這一進展強調了精煉獎勵模型的必要性,以確保 AI 輸出符合社會責任標準。