解锁Anthropic的Claude 3.5:AI爱好者狂喊“太疯狂了!”

一种新的大型语言模型(LLM)在发布仅一个月后便显得超越了OpenAI的GPT-4。由Anthropic开发的Claude 3.5 Sonnet聊天机器人声称,在关键的第三方基准测试中领先业界,同时比之前的Claude模型更快且更具成本效益。

然而,推出新模型并声称其优越性,与用户真正体验到的性能提升是两回事。虽然Google的Gemini系列被认为在某些指标上超过了OpenAI的旧旗舰GPT-4,但现实的使用反馈却可能有所不同。

与此对比,Claude 3.5 Sonnet自发布以来引起了广泛关注,许多AI影响者和资深用户在网上分享了他们的正面体验,展示了这一被称为“当今最智能”的LLM的卓越能力。

提升编码技能与产品创造

企业AI影响者Allie K. Miller在X平台上强调,Claude 3.5 Sonnet仅凭一张截图便为她创建了一款可玩游戏,完成这一壮举的时间不到三十秒。此外,信息账号@TestingCatalog News也展示了与Claude 3.5 Sonnet一起推出的“Artifacts”平台,展示了该模型执行真实代码以创建由聊天机器人设计的完整网页表单的能力。

该模型甚至重现了1995年电影《黑客帝国》中灵感的图像。EverArt创始人Pietro Schirano在X上表示,Claude 3.5 Sonnet与工具Maestro结合展现出了“通用人工智能的火花”。

Anthropic员工对Claude 3.5 Sonnet的支持

虽然Anthropic的开发者关系负责人Alex Albert在推特上提到Claude 3.5 Sonnet在编码和自主修复代码请求方面日益精进,他预测LLMs在一年内可能生成大量代码。与此同时,Anthropic的技术人员Maggie Vo在X上表示,Claude 3.5 Sonnet现在可以处理“我一半的工作……我对此感到非常满意。”

OpenAI面临压力

随着Claude 3.5 Sonnet的强势表现以及具有竞争力的价格,OpenAI面临着越来越大的压力,需要证明其模型的价值。沃顿商学院的教授Ethan Mollick将Artifacts功能比作OpenAI的GPT-4代码解释器的简化版。一位用户@kimmonismus甚至进一步指出,OpenAI有“错失AGI的发展机会”的风险,暗示该公司在宣布尚未实现的新GPT-4功能,比如新的语音模式,时过于乐观。

依然存在局限性

尽管Claude 3.5 Sonnet引发了热议,批评者指出它在一些基本认知任务上依然表现不佳,比如玩井字游戏。科技记者Timothy B. Lee(@binarybits)指出,该模型有时会犯下搞笑的错误,他分享了一张截图,显示其错误地认为三角形的价值高于100个便士。

总体来看,Claude 3.5 Sonnet代表了Anthropic及其大型语言模型领域的一次重要进步。尽管仍存在一些问题,但该模型展现了人工智能技术的持续加速发展,这一切都得益于当前的计算资源。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles