구글 딥마인드, AI 추론 능력 향상을 위한 생성 평가기 GenRM 소개
2023년 8월 27일, 구글 딥마인드 팀은 arXiv에 혁신적인 생성 평가기 GenRM에 대한 논문을 발표했습니다. 이 새로운 보상 모델은 생성 AI의 추론 능력을 획기적으로 향상시키기 위해 설계되었습니다.
현재 대규모 언어 모델(LLM) 개선을 위한 주된 방법은 "최고의 N" 접근법입니다. 이 기술은 N개의 후보 솔루션을 생성하고, 평가자가 이를 평가하여 최상의 옵션을 결정하는 것입니다. 하지만 전통적인 LLM 평가자는 일반적으로 이분법적 분류기로 기능하며, 사전 훈련된 LLM의 텍스트 생성 능력을 완전히 활용하지 못합니다.
이러한 한계를 극복하기 위해 딥마인드 팀은 다음 토큰 예측을 사용하여 평가기를 훈련시켰으며, 검증과 솔루션 생성이 통합되었습니다. GenRM은 기존 평가기에 비해 여러 가지 뚜렷한 장점을 제공합니다:
- 지침 조정의 원활한 통합
- 사고의 연쇄를 지원하는 기능
- 다수결 투표를 통한 추가 추론 시간 계산
알고리즘 및 기초 수학 추론을 포함한 과제에서, GenRM은 Gemma 기반 평가기와 테스트했을 때 이분법적 평가자 및 LLM-재판관 평가자를 초 뛰어넘어 문제 해결 성공률이 16%에서 64% 향상되었습니다.
구글 딥마인드는 GenRM이 AI 보상 시스템의 중요한 진화를 나타내며, 특히 새로운 모델 훈련에서 잠재적인 사기 행위를 방지하는 능력을 강화한다고 주장합니다. 이 발전은 AI 출력이 사회적 책임 기준을 충족할 수 있도록 보상 모델을 정교화해야 할 필요성을 강조합니다.