Anthropic发布Claude 3:在基准测试中超过GPT-4和Gemini Ultra

Anthropic,一家领先的人工智能初创公司,推出了Claude 3系列AI模型,旨在满足企业客户的多样化需求,重点关注智能、速度和成本效益。该系列包括三种型号:Opus、Sonnet,以及即将发布的Haiku。

其中,Opus被称为超越所有其他公开可用AI系统的顶尖模型,连OpenAI和Google的领先模型也无法匹敌。Anthropic的联合创始人兼首席执行官达里奥·阿莫代(Dario Amodei)在采访中表示:“Opus在广泛的任务中表现卓越,其性能非同一般。”他指出,Opus在多项基准测试中优于顶尖模型,如GPT-4、GPT-3.5和Gemini Ultra,包括数学推理的GSM-8k和专家知识的MMLU。

“Opus似乎在多个任务中持续超越竞争对手,取得前所未有的高分。”阿莫代补充道。

尽管竞争对手的主要模型的完整参数仍未披露,但Anthropic报告的基准结果表明,Opus在核心能力上对标或超越了GPT-4和Gemini,为商业可用对话AI设定了新标准。作为面向复杂推理任务的模型,Opus在Anthropic的产品线中展现出卓越的表现。

对于寻求中型解决方案的企业,Sonnet提供了一种经济高效的数据分析和知识工作的解决方案,而不会妥协性能。相比之下,Haiku则专为速度和成本效益而设计,特别适合需要快速响应的客户应用,如聊天机器人。阿莫代预计Haiku将在“几周内而不是几个月”内公开发布。

Claude 3系列中的每个模型都具有图像输入功能,以满足日益增长的图像文本识别等应用需求。Anthropic总裁丹妮拉·阿莫代(Daniela Amodei)表示:“我们的焦点始终在企业最需要的功能上,”强调公司策略优先考虑相关功能。

Claude 3模型还展现了先进的计算机视觉能力,使企业能够高效提取图像、文档、图表和图示中的信息。丹妮拉指出:“许多客户数据是非结构化或视觉化的,手动提取非常繁琐,”并强调了在法律、金融、物流和质量保障等领域的潜在应用。

随着关于AI偏见的讨论愈演愈烈,Anthropic的公告恰逢Google的Gemini聊天机器人因产生不准确的种族多样性历史图像而受到批评而发布的。Google暂时关闭了Gemini的图像生成特性,并对此表示歉意,突显出科技公司在处理AI偏见时面临的持续挑战。

阿莫代承认了解决AI偏见的挑战:“这是一门不精确的科学。”他指出,Anthropic已经成立专门团队,专注于评估和降低其模型相关风险。

“我们的假设是,领先的AI开发将引导技术走向积极的社会结果,”阿莫代表示。然而,丹妮拉强调,实现完全无偏见的AI非常困难。“创造一个完全中立的生成AI工具几乎是不可能的,因为对中立性的定义各有所异。”她说。

Anthropic的策略涉及一种称为“宪法AI”的方法,旨在使模型与“宪法”中定义的原则保持一致。尽管意图明确,阿莫代承认实现偏见减轻的完美仍然遥不可及。“我们追求意识形态中立,但我们没有做到完美,”他说。“我们都没有。”

最终,阿莫代强调,Anthropic对广泛接受的价值观的承诺旨在防止模型倾向于某种特定的党派议程,与对Gemini的批评形成对比。“我们的目标是创造能够服务于不同受众的模型,而不推广任何特定的政治观点,”他总结道。

Most people like

Find AI tools in YBX