Groq的开源Llama AI模型在函数调用方面超越GPT-4o和Claude，夺得排行榜第一名

Home AI News CN Groq的开源Llama AI模型在函数调用方面超越GPT-4o和Claude，夺得排行榜第一名

Groq是一家创新的AI硬件初创公司，最近推出了两个开源语言模型，这些模型在专门工具使用能力方面超越了许多大型科技公司。Llama-3-Groq-70B-Tool-Use模型在伯克利函数调用排行榜(BFCL)中名列第一，表现超出OpenAI、Google和Anthropic的专有模型。

Groq项目负责人Rick Lamers在X.com上分享了这一成就：“我骄傲地宣布，Llama 3 Groq Tool Use 8B和70B模型已经发布。这款开源的工具使用全微调模型在BFCL中达到了第一的位置，超越了所有其他模型，包括Claude Sonnet 3.5、GPT-4 Turbo、GPT-4o和Gemini 1.5 Pro等专有模型。”

70B参数模型在BFCL中取得了90.76%的整体准确率，而较小的8B模型则得分89.06%，排名第三。这些结果表明，开源模型不仅能够与闭源模型竞争，还能在特定任务中超越它们的性能。

这些模型是在与AI研究公司Glaive的合作下开发的，采用了Meta的Llama-3基础模型进行全微调和直接偏好优化（DPO）。团队确保使用的所有训练数据都是通过伦理方式生成的，解决了数据隐私和过拟合的问题。

这一发展标志着AI领域的重要变革。Groq通过独家使用合成数据实现高性能，挑战了依赖大量真实世界数据来开发高级AI模型的传统观念。这一创新方法不仅能够减轻隐私问题，还能降低通常与大规模数据训练相关的环境影响。此外，这也为在真实世界数据有限或敏感的领域中创建专用AI模型开辟了新的可能性。

Groq通过Groq API和Hugging Face这一领先的机器学习模型平台，使这些模型变得易于接入。这一可用性预计将促进需要复杂工具使用和函数调用领域的创新，例如自动编码和数据分析。

为了更好地与社区互动，Groq在Hugging Face Spaces上推出了公共演示，让用户体验模型并评估其工具使用能力。该演示是在与Gradio的合作下开发的，Gradio于2021年12月被Hugging Face收购，获得了研究人员和开发者的广泛关注，大家乐于探索这些模型的潜力。

Groq的开源策略与大型科技公司使用的封闭系统形成鲜明对比，可能促使行业领袖采纳更大透明度，从而加速AI的发展。这些高性能开源模型的发布巩固了Groq在AI领域的重要地位。随着研究人员、企业和政策制定者关注这一技术的影响，AI在可及性和创新方面的潜力愈发明显。Groq的成功或许预示着AI开发和部署的新纪元，为先进能力的普及和更加多元化及创新的生态系统铺平道路。

苹果展示AI能力：新模型超越Mistral和Hugging Face表现

人工智能如何填补身份和端点之间的空白，防止攻击者的剥削