Anthropic最新的Claude聊天机器人在关键基准测试中超越OpenAI GPT-4o

Anthropic发布Claude 3.5 Sonnet:人工智能语言模型性能的飞跃

Anthropic于本周四推出了最新的AI语言模型Claude 3.5 Sonnet。相比于其前身Claude 3 Opus,这款升级版聊天机器人在性能和速度上均有显著提升,速度达到原来的两倍。从今天开始,所有Claude用户,包括免费账户用户,都可以体验其强大功能。

Claude 3.5 Sonnet是Claude 3.5系列的首个模型,旨在实现平衡与细腻的表达。Anthropic计划在今年稍晚推出Claude 3.5 Haiku——最快的模型,以及Claude 3.5 Opus——最强大的模型。这一迅速更新反映了人工智能技术的快速进步。

Claude 3.5 Sonnet以其卓越的理解能力而闻名,能够更好地识别细微差别、幽默和复杂提示,写作风格更加自然。基准测试显示,它在研究生水平的推理、大学生知识和编码技巧方面表现出色,常常在各项指标上超过OpenAI的GPT-4。然而,像ChatGPT、Gemini和Llama等许多领先模型在评估中得分相近,这也突显了激烈的竞争局面。

此外,Claude 3.5 Sonnet在解读视觉数据方面的能力相比Claude 3.0 Opus有了显著提升。它能够“准确转录来自不完美图像的文本”,这对于需要从图表和图形中提取信息的零售、物流和金融服务行业尤为重要。

一项显著的新功能是Artifacts工作区。当用户请求Claude创建内容如代码或文本文件时,聊天窗口旁会出现一个专用窗口,便于实时修改和更新产生的内容。

Anthropic将Artifacts视为增强Claude团队协作的第一步。公司表示:“不久的将来,团队——甚至整个组织——将能够在一个共享空间中安全集中他们的知识、文档和项目,而Claude将作为按需助手支持他们。”

Claude 3.5 Sonnet现已在Anthropic官网和Claude iOS应用上提供,Claude Pro和Team订阅用户可享受更高的token配额。用户还可以通过AnthropicAPI、Amazon Bedrock和Google Cloud的Vertex AI进行访问,定价与之前的模型相同,为每百万个输入token收取3美元,每百万个输出token收取15美元。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles