解鎖 Anthropic 的 Claude 3.5 Sonnet:AI 愛好者驚呼「這真是太狂了!」

一個全新的大型語言模型(LLM)似乎在發表僅一個月後已經超越了OpenAI的GPT-4。由Anthropic開發的Claude 3.5 Sonnet聊天機器人聲稱在關鍵的第三方基準測試中領先於行業,同時在速度和成本效益上也優於早期的Claude模型。

然而,推出新模型並聲稱其優越性,與用戶真實感受到其性能提升之間存在差距。(Google Gemini系列,請注意:雖然據說在某些指標上超過了OpenAI之前的旗艦GPT-4,但真實使用卻告訴我們不同的故事。)

自推出以來,Claude 3.5 Sonnet獲得了廣泛關注,AI影響者和高需求用戶在線上分享他們的積極體驗,展現了這款所謂“最智能” LLM的卓越能力。

提升編程技能與產品創造

企業AI影響者Allie K. Miller在X上指出,Claude 3.5 Sonnet僅基於截圖便創造出一款可玩的遊戲,並在三十秒內完成這一成就。此外,X帳戶@TestingCatalog News展示了與Claude 3.5 Sonnet一同推出的“Artifacts”實驗場,展示了其執行真實代碼,生成由聊天機器人設計的完整網頁表單的能力。

該模型甚至重現了1995年電影《駭客》的靈感畫面。企業AI圖像生成初創公司EverArt創始人Pietro Schirano在X上評論,將Claude 3.5 Sonnet與工具Maestro結合顯示了“AGI的火花”。

Anthropic員工對Claude 3.5 Sonnet的肯定

尽管該模型的支持者、Anthropic開發者關係領袖Alex Albert在推文中提到Claude 3.5 Sonnet在編程和自主修復拉取請求方面的日益熟練,他認為在一年內很大一部分代碼可以由LLM生成。同樣,Anthropic技術員Maggie Vo在X上分享道,Claude 3.5 Sonnet現在處理了“我一半的工作……我感到無比高興”。

OpenAI承受壓力

隨著Claude 3.5 Sonnet超越GPT-4並具競爭力的定價,OpenAI面臨著日益增長的壓力來證明其模型的價值。賓夕法尼亞大學沃頓商學院教授Ethan Mollick將Artifacts功能比擬為OpenAI GPT-4代碼解釋器的簡化版本。用戶@kimmonismus甚至進一步指出,OpenAI可能面臨“錯過AGI”的風險,這是發展一種在經濟價值任務中超越人類的AI的目標。他們批評公司宣布的GPT-4新功能尚未實現,如新的語音模式。

局限性仍然存在

儘管Claude 3.5 Sonnet受到了熱烈關注,但批評者指出它在一些基本的認知任務上仍然表現不佳,例如玩井字棋。科技記者Timothy B. Lee在X上指出,該模型有時會出現幽默的錯誤,他分享了一張截圖,上面錯誤地聲稱三分之一的價值超過100個便士。

總的來說,Claude 3.5 Sonnet對於Anthropic及大型語言模型的發展代表了重要的進步。儘管仍存在一些問題,但該模型顯示出AI技術的進步仍在加速,這得益於當前的計算資源。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles