Not Diamond：無縫連接您的查詢至最佳語言模型

Home AI新聞 Not Diamond：無縫連接您的查詢至最佳語言模型

在大型語言模型（LLMs）的時代，各公司急於為其獨特應用實施最有效的模型。雖然這個任務似乎簡單，但許多組織卻面臨一個重大挑戰：在快速變化的環境中，如何辨識最適合其特定使用案例的解決方案。

Not Diamond 是一個突破性的初創公司，最近從隱藏模式中亮相，認為關鍵在於智能路由。該公司總部位於舊金山，開發了一款創新的 LLM 路由器，使企業能夠同時使用多個模型，將查詢引導至最合適的模型。這種方法不僅提升了輸出品質，還優化了延遲和成本等關鍵因素。

Not Diamond 的聯合創始人及首席執行官 Tomás Hernando Kofman 表示：「我們的核心信念是，未來不會只有一個主導模型或公司，而是會有無數基礎模型、無數專門變體，和許多運行在它們之上的自定義推斷引擎。我們創立 Not Diamond 是為了促進這種多模型的未來，提供全球最先進的模型路由基礎設施。」

儘管尚處於初期階段，Not Diamond 已獲得了顯著關注，並從 defy.vc 和 AI 界的重要人物，包括 Google DeepMind 的 Jeff Dean、Hugging Face 的 Julien Chaumond、OpenAI 的 Zack Kass 等人那裡籌集了 230 萬美元的資金。

LLM成本與任務特定性能的挑戰

當前的大型語言模型生態複雜多變，無論是開源模型還是專有模型，各自都有優缺點。選擇一個具備廣泛上下文長度和高性能的模型往往成本高昂，而更實惠的選項可能缺乏關鍵能力或延遲過高。隨著新模型每日湧現，現有模型也不斷更新，展現出開源技術的潛力，如 Llama 3.1。

Not Diamond 如何賦能企業

Kofman 過去曾開發無需編碼的 AI 產品，親身體會到 LLM 的困境。他構思出一個解決方案：提供一個界面，讓企業能夠接入一個專門模型網絡，而不是依賴單一選項。這一願景促使他與機器學習專家 Tze-Yang Tung 和 Jeffrey Akiki 合作成立 Not Diamond，專注於建立智能查詢路由基礎設施。

Kofman 解釋道：「有效的路由基礎設施對於最大化 AI 系統性能至關重要。較小的專門模型在特定領域的表現優於大型模型，而路由則為這些模型提供了通用模型的韌性。這種方法不僅計算高效，還提升了解讀性和安全性。」

Not Diamond 的創新技術

Not Diamond 解決方案的核心是「元模型」和 LLM 排名算法。該路由器全面分析進來的查詢，自動將其引導至最能提供準確回應的模型，同時最大程度地提高成本效益，最小化延遲。因此，團隊可以避免對簡單查詢調用大型模型的需求。

基準測試結果顯示，Not Diamond 的路由器使用多個 LLM，其表現超越了 Llama 3.1 和 GPT-4 等單一模型，提供更優質的結果。為了開發這一能力，Not Diamond 創建了龐大的評估數據集，衡量 LLM 在各種任務中的性能，從回答問題到編碼和推理，並訓練了一個排名算法，以識別與每個查詢最兼容的 LLM，驅動路由過程。

2023 年 12 月，Not Diamond 發布了其路由器的開源預覽，允許企業之間無縫管理 GPT-3.5 和 GPT-4 的查詢，並計劃擴展至其他模型。此外，團隊如希望將路由器整合到其內部工作流程中，亦可提供內部評估數據集來訓練自定義路由器，優化模型選擇。該路由器還提供數據哈希和提示翻譯功能，以提升性能。

加速開發者採用

儘管還處於初步發展階段，Not Diamond 已經引起了早期公司和獨立開發者的大量關注。雖然具體用戶數尚未披露，但一位企業客戶 Samwell AI 報告表示，通過使用 Not Diamond 的技術，其 LLM 輸出品質提高了 10%，同時推斷成本和延遲減少了 10%。

在行業領導者的支持下，該公司旨在建立其進展，加速產品開發並提高採用率。Kofman 強調，Not Diamond 正在開發「一系列額外產品功能」，雖然具體內容仍然保密。

在智能查詢路由領域，Not Diamond 面對來自一些值得注意的初創公司如 Martian 和 Unify 的競爭。然而，Kofman 斷言，Not Diamond 在路由速度、提示優化和隱私功能上具有卓越的競爭力。

Canva收購Leonardo AI 以增強其生成圖片解決方案

iOS 強化 AI 功能：探索 Apple 全新「智慧」系統更新