Anthropic发布Claude 3：在基准测试中超过GPT-4和Gemini Ultra

Home AI News CN Anthropic发布Claude 3：在基准测试中超过GPT-4和Gemini Ultra

Anthropic，一家领先的人工智能初创公司，推出了Claude 3系列AI模型，旨在满足企业客户的多样化需求，重点关注智能、速度和成本效益。该系列包括三种型号：Opus、Sonnet，以及即将发布的Haiku。

其中，Opus被称为超越所有其他公开可用AI系统的顶尖模型，连OpenAI和Google的领先模型也无法匹敌。Anthropic的联合创始人兼首席执行官达里奥·阿莫代（Dario Amodei）在采访中表示：“Opus在广泛的任务中表现卓越，其性能非同一般。”他指出，Opus在多项基准测试中优于顶尖模型，如GPT-4、GPT-3.5和Gemini Ultra，包括数学推理的GSM-8k和专家知识的MMLU。

“Opus似乎在多个任务中持续超越竞争对手，取得前所未有的高分。”阿莫代补充道。

尽管竞争对手的主要模型的完整参数仍未披露，但Anthropic报告的基准结果表明，Opus在核心能力上对标或超越了GPT-4和Gemini，为商业可用对话AI设定了新标准。作为面向复杂推理任务的模型，Opus在Anthropic的产品线中展现出卓越的表现。

对于寻求中型解决方案的企业，Sonnet提供了一种经济高效的数据分析和知识工作的解决方案，而不会妥协性能。相比之下，Haiku则专为速度和成本效益而设计，特别适合需要快速响应的客户应用，如聊天机器人。阿莫代预计Haiku将在“几周内而不是几个月”内公开发布。

Claude 3系列中的每个模型都具有图像输入功能，以满足日益增长的图像文本识别等应用需求。Anthropic总裁丹妮拉·阿莫代（Daniela Amodei）表示：“我们的焦点始终在企业最需要的功能上，”强调公司策略优先考虑相关功能。

Claude 3模型还展现了先进的计算机视觉能力，使企业能够高效提取图像、文档、图表和图示中的信息。丹妮拉指出：“许多客户数据是非结构化或视觉化的，手动提取非常繁琐，”并强调了在法律、金融、物流和质量保障等领域的潜在应用。

随着关于AI偏见的讨论愈演愈烈，Anthropic的公告恰逢Google的Gemini聊天机器人因产生不准确的种族多样性历史图像而受到批评而发布的。Google暂时关闭了Gemini的图像生成特性，并对此表示歉意，突显出科技公司在处理AI偏见时面临的持续挑战。

阿莫代承认了解决AI偏见的挑战：“这是一门不精确的科学。”他指出，Anthropic已经成立专门团队，专注于评估和降低其模型相关风险。

“我们的假设是，领先的AI开发将引导技术走向积极的社会结果，”阿莫代表示。然而，丹妮拉强调，实现完全无偏见的AI非常困难。“创造一个完全中立的生成AI工具几乎是不可能的，因为对中立性的定义各有所异。”她说。

Anthropic的策略涉及一种称为“宪法AI”的方法，旨在使模型与“宪法”中定义的原则保持一致。尽管意图明确，阿莫代承认实现偏见减轻的完美仍然遥不可及。“我们追求意识形态中立，但我们没有做到完美，”他说。“我们都没有。”

最终，阿莫代强调，Anthropic对广泛接受的价值观的承诺旨在防止模型倾向于某种特定的党派议程，与对Gemini的批评形成对比。“我们的目标是创造能够服务于不同受众的模型，而不推广任何特定的政治观点，”他总结道。

亚马逊将Claude 3整合进Bedrock平台，超越GPT-4

人工智能如何提升对针对DevOps团队的供应链攻击的安全防护：五大策略

Most people like

Mage

796.7K

Mage是一个创新的人工智能平台，旨在快速生成独特的图像，提升用户的创造力和效率。

人工智能 AI 动漫和卡通生成器

SpoiledChild™

1.8M

在当今追求美丽与健康的时代，智能护肤和头发产品正成为抗衰老的热门选择。这些创新产品利用先进的科技，帮助我们抵御衰老迹象，让肌肤和头发恢复活力。了解这些智能产品如何提升您的美容护理体验，并助您实现青春永驻的目标。

智能护肤 AI产品描述生成器

Carter Chat

122.3K

与人工智能角色互动、创作引人入胜的故事和享受多样的娱乐体验，正变得愈发普及。在这个充满创新的时代，AI不仅能激发我们的想象力，还能丰富我们的艺术与娱乐生活。

卡特聊天 AI角色生成器

Bagoodex

204.7K

AI网络搜索与聊天：在数字化时代，人工智能正在彻底改变我们获取信息和互动的方式。通过高效的网络搜索和智能聊天功能，AI帮助用户快速找到所需内容，并提供及时的智能对话体验。无论是在查找答案、解决问题，还是进行日常交流，AI都在不断提升我们的在线互动质量与便利性。这一技术的进步，不仅推动了信息获取的变革，也为企业与用户之间的沟通方式开辟了新的可能性。

AI 搜索引擎 AI搜索引擎

Find AI tools in YBX