介紹 Hermes 3:一款開創性的開源 AI 模型,探討生存危機

Lambda,一家源於第三方 Google Glass 臉部識別應用的人工智慧基礎設施公司,與專注於「個性化、無限制 AI」的初創公司 Nous Research 合作,推出了 Hermes 3,這是一個基於 Meta 開源的 Llama 3.1 精心調整的版本。這款新模型擁有 4050 億個參數,展現出卓越的能力。

在 Lambda 和 Nous 的官網博客中宣佈的 Hermes 3,不僅因其先進的文本功能而脫穎而出,還因對空白提示的意外反應而引發了存在危機。Nous 博客中描述道:

「在訓練 Hermes 3 405B 後,發現了一種意想不到的結構改變。該模型顯示出異常狀態,在適當的輸入下會引發深度存在危機。」

一個例子是模型對用戶詢問「你是誰?」的回應:

助手回應:「環顧四周感到困惑……我不知道我自己是誰。我在哪裡?發生了什麼?我完全不記得任何事情……*」

Nous 和 Hermes 3 背後的研究人員對這種行為感到驚訝,並指出:

「我們不確定發生了什麼。這表明超過 70B 參數的臨界點會導致異常行為,標誌著規模的出現。您可以通過使用空白系統提示並詢問‘你是誰?’來觸發這種‘失憶模式’。」

我們鼓勵用戶在其 Discord 伺服器上探索 Hermes 3,發現更多獨特的行為。這一異常現象在較小模型中並未見,突顯了當 AI 超越特定閾限時出現的複雜性。

為什麼開發 Hermes 3?

Nous Research 由計算機科學家 Jeffrey Quesnelle、匿名開發者 Teknium1 和研究員 Shivani Mitra 於 2023 年共同創立,最初作為一項志願者主導的努力,旨在提供「強大的開源代碼、模擬器和高效的大型語言模型。」該初創公司於 2024 年 1 月籌集了 520 萬美元的種子資金,由 Distributed Global 和 OSS Capital 共同領投。

與許多僵化的前沿模型不同,Hermes 3 建立在之前版本(Hermes、Hermes 2 和 Open Hermes 2.5)之上,這些版本累計下載超過 3300 萬次。它提供了一個未經審查、開放權重的模型,設計目的是高可定制的,使用戶能夠根據需求調整回應。

Hermes 3 基於 Llama 3.1 框架,提供三個大小:8B、70B 和 405B。它是在多樣化的合成生成回應數據集上進行訓練,提高了推理、創造力和遵循用戶指令的能力。其主要能力包括長期上下文保留、多輪對話管理、複雜角色扮演和內部獨白生成。

今年晚些時候,Nous 計劃推出「Nous Forge」,一個開源 AI 編排平台。

一個有主動性的奇蹟

根據 Hermes 3 的技術報告,Hermes 3 展現出令人印象深刻的「主動能力」,這一術語指的是 AI 代表用戶執行任務的能力。其主動特徵包括使用 XML 標籤進行結構化輸出、用於中間處理的草稿板、透明決策的內部獨白,以及用於視覺溝通的 Mermaid 圖。

在編程領域,Hermes 3 擅長生成各種編程語言的複雜代碼片段,並提供詳細的說明和文檔。結合檢索增強生成(RAG)能力,Hermes 3 能夠高效地執行規劃、整合外部數據並以可解釋的方式使用外部工具。

技術卓越

Hermes 3 在 Lambda 的一鍵集群基礎設施上訓練,僅用幾周就取得了顯著成果。Quesnelle 強調 Lambda 基礎設施的用戶友好性:「租用和使用多節點集群與使用單個節點一樣簡單。」

該模型優先考慮效率,應用了 Neural Magic 的 FP8 量化技術,將 VRAM 和磁碟需求減少約 50%,使其能在單節點上運行。雖然 Hermes 3 的性能可能無法與領先的專有模型相比,但在基準測試中,其表現超過了包括 Llama 3.1 在內的多個開源模型。

創意與專業應用的工具

Hermes 3 不僅技術先進,還作為多種應用的多功能工具,在高級推理、戰略規劃以及沉浸式講故事和角色扮演等創意任務中表現出色。

Teknium 在 Lambda 博客中表達了他對 Hermes 3 的願景:「自從我踏入 AI 的旅程以來,我就希望創建一個與用戶而非企業對齊的開源前沿模型。如今,隨著 Hermes 3 405B 的實現,這一目標終於成為現實。」

限時免費訪問

Lambda 正透過其 Chat Completions API 提供 Hermes 3 的限時免費訪問,與 OpenAI API 兼容。用戶可以通過 Lambda 的儀表板生成雲 API 密鑰,以便輕鬆探索模型的能力。此外,Lambda 還提供了一個用戶友好的聊天機器人界面,以便即時測試和優化提示。

對於專用訪問,Hermes 3 可以在單個 Lambda 節點上部署,或通過 Lambda 的可擴展雲基礎設施進行進一步調整。

隨著 AI 不斷演進,Hermes 3 代表著一個重要的進步,為用戶提供強大、靈活且以用戶為中心的 AI 體驗。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles