NVIDIA推出开源Nemotron-70B模型，性能超越GPT-4o和Claude 3.5

Home AI News CN NVIDIA推出开源Nemotron-70B模型，性能超越GPT-4o和Claude 3.5

NVIDIA 开源 Nemotron-70B 模型，推动 AI 发展

最近，NVIDIA 发布了其最新的强大模型 Nemotron-70B，并选择将其开源。自推出以来，该模型在 AI 社区引发了广泛讨论，其在多个基准测试中表现优异，超过了 140 个模型，包括 GPT-4、GPT-4 Turbo 和 Claude 3.5 Sonnet，仅次于 OpenAI 最新的 o1 模型。

Nemotron-70B 基于 Llama-3.1-70B 构建，采用人类反馈强化学习（RLHF）和一种新颖的混合训练方法，结合了 Bradley-Terry 模型和回归分析进行奖励建模。该模型使用的训练数据集和基于 Llama-3.1-Nemotron-70B-Reward 的奖励信号，使其能够利用 HelpSteer2-Preference 提示生成更符合人类偏好的响应。

在 LMSYS 大模型竞技场的 Hard 测试中，Nemotron-70B 获得了 85 分；在 AlpacaEval 2 LC 中得分 57.6，并在 GPT-4-Turbo MT-Bench 中达到了 8.98。这些成绩反映了其卓越的性能。

用户评估显示，Nemotron-70B 在解决复杂问题方面表现出色。例如，在计算香蕉数量时，模型准确分析并推导出正确答案。尽管在一位 89 岁名人的去世日期上出现了小失误，但整体表现依然令人印象深刻。

该模型在困难提示下的表现同样引人注目。尽管未能完全通过某些测试，但其初步输出引发了深思。例如，在讨论月球的距离和可行性时，模型从物理角度进行了详细讨论，得出了合理的结论。

行业专家表示，NVIDIA 一直坚持开源强大模型的策略，旨在促进芯片销售。随着模型复杂度的增加，公司被迫订购更多训练用芯片，这使得开源模型能够有效推动硬件销售。然而，这一策略也给初创企业带来了巨大压力，它们在商业化和可见性方面难以与科技巨头竞争。如果无法实现盈利，它们可能面临失去投资的风险。

尽管面临挑战，Nemotron-70B 的开源发布无疑为 AI 社区增添了重要价值。该模型推动了人工智能技术的发展，为研究人员和开发者提供了更丰富的选择和可能性。NVIDIA 的开源倡议不仅为该领域注入了新鲜活力，也为更多高质量开源模型的涌现奠定了基础，促进了 AI 产业的协同发展。

OpenAI推出Windows版ChatGPT客户端：尊享版用户优先体验新功能

Adobe 推出新款 AI 视频生成模型，力争在技术领域超越 OpenAI 和 Meta

Most people like

Quivr

24K

Quivr是一个高效的云平台，专为存储和检索各种数据类型而设计。无论您需要管理文本、图像还是视频，Quivr都能提供灵活而安全的解决方案。

云平台其他

Sembly AI

74.4K

Sembly AI是一款创新的智能助手，专门用于高效记录和总结会议内容。

AI团队助手 AI会议助手

Krater.ai

23.4K

Krater.ai是一款超级应用，结合了先进的人工智能技术，以提升创业项目的潜力和效率。

AI超级应用 AI广告创意助手

Live Portrait AI

395.2K

静态照片的AI动画技术正日益引起人们的关注。这种创新手段不仅能够将静态图像转变为生动的动画，还赋予了静态照片新的生命和表现形式。通过先进的人工智能算法，用户可以将怀旧的照片与现代动感结合，让每一张图像讲述自己的故事。这项技术不仅适用于个人的纪念照片，还在广告、影视制作等多个领域展现出巨大潜力。无论是商业还是个人项目，AI动画都为静态图像提供了前所未有的创意表达方式。

AI 动画图像转视频工具

Find AI tools in YBX