提升生成性人工智能推理能力：谷歌DeepMind发布GenRM技术

Home AI News CN 提升生成性人工智能推理能力：谷歌DeepMind发布GenRM技术

谷歌DeepMind推出生成评估器GenRM，以增强AI推理能力

2023年8月27日，谷歌DeepMind团队在arXiv上发表了一篇论文，介绍了他们创新的生成评估器GenRM。这一新的奖励模型旨在显著提升生成AI的推理能力。

目前，改善大型语言模型（LLM）的主要方法是“最佳中的N”策略。该方法生成N个候选解决方案，随后由评估器对它们进行排名，以确定最佳选项。然而，传统的LLM评估器通常仅作为判别分类器，未能充分利用预训练LLM的文本生成能力。

为了解决这一限制，DeepMind团队训练了该评估器，使其能够预测下一个令牌，整合了验证和解决方案生成。GenRM相比于传统评估器具备以下几个显著优势：

- 无缝整合指令调整

- 支持链式推理

- 利用多数投票计算额外推理时间

在涉及算法和基础数学推理的任务中，GenRM在与Gemma基础的评估器测试时，其表现优于判别评估器和LLM作为评判者评估器，问题解决成功率提高了16%至64%。

谷歌DeepMind表示，GenRM标志着AI奖励系统的一次重要进化，特别是在新模型训练中提升预防潜在欺诈行为的能力。这一进展凸显了完善奖励模型的必要性，以确保AI输出符合社会责任标准。

OpenAI ChatGPT新增8种自然动物声音：体验更真实的犬吠与动物表达

克拉纳裁员一半：利用人工智能推动业务增长战略

Most people like

Avey App

15.5K

Avey App是一个基于人工智能的健康管理平台，旨在帮助用户更好地照顾自己的健康。它提供精准的自我诊断、便捷的医生沟通、快速的药品订购服务，以及一个安全的环境让用户分享心情。这些功能结合在一起，为用户的健康管理提供全面支持。

人工智能应用医疗健康工具

Wonderin AI简历构建器

37.9K

轻松打造专属个性化专业简历，让您的求职之路更加顺畅。

简历生成器简历制作工具

Mammouth AI

41.6K

顶级生成式人工智能（GenAI）模型的订阅服务正迅速成为行业的热点。这些模型具备强大的能力，能够为用户提供个性化的体验和智能化的解决方案。通过订阅顶级GenAI模型，用户可以轻松访问最新的技术进展，以满足他们在各个领域的需求，包括商业、创意和数据分析等。在这个瞬息万变的数字时代，了解并充分利用顶级GenAI模型的潜力，为个人和企业带来巨大优势。

生成式AI模型大型语言模型（LLMs）

NSQ Assessment

12.3K

免费评估您的神经系统调节能力。

自我评估其他

Find AI tools in YBX