NVIDIA推出开源Nemotron-70B模型,性能超越GPT-4o和Claude 3.5

NVIDIA 开源 Nemotron-70B 模型,推动 AI 发展

最近,NVIDIA 发布了其最新的强大模型 Nemotron-70B,并选择将其开源。自推出以来,该模型在 AI 社区引发了广泛讨论,其在多个基准测试中表现优异,超过了 140 个模型,包括 GPT-4、GPT-4 Turbo 和 Claude 3.5 Sonnet,仅次于 OpenAI 最新的 o1 模型。

Nemotron-70B 基于 Llama-3.1-70B 构建,采用人类反馈强化学习(RLHF)和一种新颖的混合训练方法,结合了 Bradley-Terry 模型和回归分析进行奖励建模。该模型使用的训练数据集和基于 Llama-3.1-Nemotron-70B-Reward 的奖励信号,使其能够利用 HelpSteer2-Preference 提示生成更符合人类偏好的响应。

在 LMSYS 大模型竞技场的 Hard 测试中,Nemotron-70B 获得了 85 分;在 AlpacaEval 2 LC 中得分 57.6,并在 GPT-4-Turbo MT-Bench 中达到了 8.98。这些成绩反映了其卓越的性能。

用户评估显示,Nemotron-70B 在解决复杂问题方面表现出色。例如,在计算香蕉数量时,模型准确分析并推导出正确答案。尽管在一位 89 岁名人的去世日期上出现了小失误,但整体表现依然令人印象深刻。

该模型在困难提示下的表现同样引人注目。尽管未能完全通过某些测试,但其初步输出引发了深思。例如,在讨论月球的距离和可行性时,模型从物理角度进行了详细讨论,得出了合理的结论。

行业专家表示,NVIDIA 一直坚持开源强大模型的策略,旨在促进芯片销售。随着模型复杂度的增加,公司被迫订购更多训练用芯片,这使得开源模型能够有效推动硬件销售。然而,这一策略也给初创企业带来了巨大压力,它们在商业化和可见性方面难以与科技巨头竞争。如果无法实现盈利,它们可能面临失去投资的风险。

尽管面临挑战,Nemotron-70B 的开源发布无疑为 AI 社区增添了重要价值。该模型推动了人工智能技术的发展,为研究人员和开发者提供了更丰富的选择和可能性。NVIDIA 的开源倡议不仅为该领域注入了新鲜活力,也为更多高质量开源模型的涌现奠定了基础,促进了 AI 产业的协同发展。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles