Anthropic最新的Claude聊天机器人在关键基准测试中超越OpenAI GPT-4o

Home AI News CN Anthropic最新的Claude聊天机器人在关键基准测试中超越OpenAI GPT-4o

Anthropic发布Claude 3.5 Sonnet：人工智能语言模型性能的飞跃

Anthropic于本周四推出了最新的AI语言模型Claude 3.5 Sonnet。相比于其前身Claude 3 Opus，这款升级版聊天机器人在性能和速度上均有显著提升，速度达到原来的两倍。从今天开始，所有Claude用户，包括免费账户用户，都可以体验其强大功能。

Claude 3.5 Sonnet是Claude 3.5系列的首个模型，旨在实现平衡与细腻的表达。Anthropic计划在今年稍晚推出Claude 3.5 Haiku——最快的模型，以及Claude 3.5 Opus——最强大的模型。这一迅速更新反映了人工智能技术的快速进步。

Claude 3.5 Sonnet以其卓越的理解能力而闻名，能够更好地识别细微差别、幽默和复杂提示，写作风格更加自然。基准测试显示，它在研究生水平的推理、大学生知识和编码技巧方面表现出色，常常在各项指标上超过OpenAI的GPT-4。然而，像ChatGPT、Gemini和Llama等许多领先模型在评估中得分相近，这也突显了激烈的竞争局面。

此外，Claude 3.5 Sonnet在解读视觉数据方面的能力相比Claude 3.0 Opus有了显著提升。它能够“准确转录来自不完美图像的文本”，这对于需要从图表和图形中提取信息的零售、物流和金融服务行业尤为重要。

一项显著的新功能是Artifacts工作区。当用户请求Claude创建内容如代码或文本文件时，聊天窗口旁会出现一个专用窗口，便于实时修改和更新产生的内容。

Anthropic将Artifacts视为增强Claude团队协作的第一步。公司表示：“不久的将来，团队——甚至整个组织——将能够在一个共享空间中安全集中他们的知识、文档和项目，而Claude将作为按需助手支持他们。”

Claude 3.5 Sonnet现已在Anthropic官网和Claude iOS应用上提供，Claude Pro和Team订阅用户可享受更高的token配额。用户还可以通过AnthropicAPI、Amazon Bedrock和Google Cloud的Vertex AI进行访问，定价与之前的模型相同，为每百万个输入token收取3美元，每百万个输出token收取15美元。

苹果因监管合规推迟在欧洲推出新AI功能

Picsart与Getty联合推出专为授权内容训练的AI图像生成器