解锁Anthropic的Claude 3.5：AI爱好者狂喊“太疯狂了！”

Home AI News CN 解锁Anthropic的Claude 3.5：AI爱好者狂喊“太疯狂了！”

一种新的大型语言模型（LLM）在发布仅一个月后便显得超越了OpenAI的GPT-4。由Anthropic开发的Claude 3.5 Sonnet聊天机器人声称，在关键的第三方基准测试中领先业界，同时比之前的Claude模型更快且更具成本效益。

然而，推出新模型并声称其优越性，与用户真正体验到的性能提升是两回事。虽然Google的Gemini系列被认为在某些指标上超过了OpenAI的旧旗舰GPT-4，但现实的使用反馈却可能有所不同。

与此对比，Claude 3.5 Sonnet自发布以来引起了广泛关注，许多AI影响者和资深用户在网上分享了他们的正面体验，展示了这一被称为“当今最智能”的LLM的卓越能力。

提升编码技能与产品创造

企业AI影响者Allie K. Miller在X平台上强调，Claude 3.5 Sonnet仅凭一张截图便为她创建了一款可玩游戏，完成这一壮举的时间不到三十秒。此外，信息账号@TestingCatalog News也展示了与Claude 3.5 Sonnet一起推出的“Artifacts”平台，展示了该模型执行真实代码以创建由聊天机器人设计的完整网页表单的能力。

该模型甚至重现了1995年电影《黑客帝国》中灵感的图像。EverArt创始人Pietro Schirano在X上表示，Claude 3.5 Sonnet与工具Maestro结合展现出了“通用人工智能的火花”。

Anthropic员工对Claude 3.5 Sonnet的支持

虽然Anthropic的开发者关系负责人Alex Albert在推特上提到Claude 3.5 Sonnet在编码和自主修复代码请求方面日益精进，他预测LLMs在一年内可能生成大量代码。与此同时，Anthropic的技术人员Maggie Vo在X上表示，Claude 3.5 Sonnet现在可以处理“我一半的工作……我对此感到非常满意。”

OpenAI面临压力

随着Claude 3.5 Sonnet的强势表现以及具有竞争力的价格，OpenAI面临着越来越大的压力，需要证明其模型的价值。沃顿商学院的教授Ethan Mollick将Artifacts功能比作OpenAI的GPT-4代码解释器的简化版。一位用户@kimmonismus甚至进一步指出，OpenAI有“错失AGI的发展机会”的风险，暗示该公司在宣布尚未实现的新GPT-4功能，比如新的语音模式，时过于乐观。

依然存在局限性

尽管Claude 3.5 Sonnet引发了热议，批评者指出它在一些基本认知任务上依然表现不佳，比如玩井字游戏。科技记者Timothy B. Lee（@binarybits）指出，该模型有时会犯下搞笑的错误，他分享了一张截图，显示其错误地认为三角形的价值高于100个便士。

总体来看，Claude 3.5 Sonnet代表了Anthropic及其大型语言模型领域的一次重要进步。尽管仍存在一些问题，但该模型展现了人工智能技术的持续加速发展，这一切都得益于当前的计算资源。

SoundHound收购Allset，提升驾驶区AI语音点餐体验

探索OpenAI在2024年VB Transform大会上的商业转型洞察

Most people like

AI Anime Avatars

19.8K

体验一款桌面应用程序，专为创建AI Anime Avatars而设计，为您的沉浸式游戏体验带来更多乐趣和个性化。

人工智能其他

MailMaestro

22K

探索Gmail和Outlook中的AI电子邮件助手，这些智能工具正在彻底改变我们的工作方式。通过自动化繁琐的任务和提供个性化的写作建议，这些AI助手不仅提高了工作效率，还使沟通变得更加流畅和高效。无论是自动回复、日程安排还是内容推荐，Gmail和Outlook的AI电子邮件助手为现代职场提供了强大的支持。

AI邮件助手写作助手

Chai

563.4K

使用Chai AI，这款卓越的聊天机器人应用程序，您可以轻松创建、分享和探索多样化的聊天机器人。

聊天机器人应用 AI聊天机器人

Marketer

22.7K

数字新建销售的全方位解决方案，助力企业提升销售效率与客户体验。通过整合先进技术和优化流程，我们为您提供一个全面、灵活的销售工具，以应对市场变化和客户需求。

数字销售解决方案销售助手

Find AI tools in YBX