解鎖 Anthropic 的 Claude 3.5 Sonnet：AI 愛好者驚呼「這真是太狂了！」

Home AI新聞解鎖 Anthropic 的 Claude 3.5 Sonnet：AI 愛好者驚呼「這真是太狂了！」

一個全新的大型語言模型（LLM）似乎在發表僅一個月後已經超越了OpenAI的GPT-4。由Anthropic開發的Claude 3.5 Sonnet聊天機器人聲稱在關鍵的第三方基準測試中領先於行業，同時在速度和成本效益上也優於早期的Claude模型。

然而，推出新模型並聲稱其優越性，與用戶真實感受到其性能提升之間存在差距。（Google Gemini系列，請注意：雖然據說在某些指標上超過了OpenAI之前的旗艦GPT-4，但真實使用卻告訴我們不同的故事。）

自推出以來，Claude 3.5 Sonnet獲得了廣泛關注，AI影響者和高需求用戶在線上分享他們的積極體驗，展現了這款所謂“最智能” LLM的卓越能力。

提升編程技能與產品創造

企業AI影響者Allie K. Miller在X上指出，Claude 3.5 Sonnet僅基於截圖便創造出一款可玩的遊戲，並在三十秒內完成這一成就。此外，X帳戶@TestingCatalog News展示了與Claude 3.5 Sonnet一同推出的“Artifacts”實驗場，展示了其執行真實代碼，生成由聊天機器人設計的完整網頁表單的能力。

該模型甚至重現了1995年電影《駭客》的靈感畫面。企業AI圖像生成初創公司EverArt創始人Pietro Schirano在X上評論，將Claude 3.5 Sonnet與工具Maestro結合顯示了“AGI的火花”。

Anthropic員工對Claude 3.5 Sonnet的肯定

尽管該模型的支持者、Anthropic開發者關係領袖Alex Albert在推文中提到Claude 3.5 Sonnet在編程和自主修復拉取請求方面的日益熟練，他認為在一年內很大一部分代碼可以由LLM生成。同樣，Anthropic技術員Maggie Vo在X上分享道，Claude 3.5 Sonnet現在處理了“我一半的工作……我感到無比高興”。

OpenAI承受壓力

隨著Claude 3.5 Sonnet超越GPT-4並具競爭力的定價，OpenAI面臨著日益增長的壓力來證明其模型的價值。賓夕法尼亞大學沃頓商學院教授Ethan Mollick將Artifacts功能比擬為OpenAI GPT-4代碼解釋器的簡化版本。用戶@kimmonismus甚至進一步指出，OpenAI可能面臨“錯過AGI”的風險，這是發展一種在經濟價值任務中超越人類的AI的目標。他們批評公司宣布的GPT-4新功能尚未實現，如新的語音模式。

局限性仍然存在

儘管Claude 3.5 Sonnet受到了熱烈關注，但批評者指出它在一些基本的認知任務上仍然表現不佳，例如玩井字棋。科技記者Timothy B. Lee在X上指出，該模型有時會出現幽默的錯誤，他分享了一張截圖，上面錯誤地聲稱三分之一的價值超過100個便士。

總的來說，Claude 3.5 Sonnet對於Anthropic及大型語言模型的發展代表了重要的進步。儘管仍存在一些問題，但該模型顯示出AI技術的進步仍在加速，這得益於當前的計算資源。

SoundHound收購Allset，提升自駕餐廳AI語音訂餐體驗

探索OpenAI在VB Transform 2024中的企業轉型洞察