在OpenAI相對平靜的時期,競爭對手Anthropic卻以其Claude 3系列大型語言模型(LLM)引起熱議。另一個值得關注的創生成AI領域的參與者是以色列創業公司Deci,最近宣布了其產品的重大更新。
早在2023年秋季,有報導稱Deci推出了DeciDiffusion和DeciLM 6B開源模型——這是基於Stability的Stable Diffusion 1.5和Meta的LLaMA 2 7B的精細調整版本——此後,Deci還推出了代碼完成功能的LLM——DeciCoder,以及升級版DeciDiffusion 2.0。現在,公司推出了Deci-Nano,這是一款更小、更高效的閉源LLM,當前僅通過Deci生成人工智慧開發平台供企業和開發者使用。
轉向商業模式?
Deci似乎正在向更商業化的策略過渡,類似於Mistral與微軟的合作。這引發了對開源AI未來的疑問。Deci的市場副總裁Rachel Salkin在電子郵件中表示:
「我們仍然致力於支持開源社區,但也認識到提高準確性和速度的閉源模型對我們客戶的價值。」
Salkin強調,最近釋出的幾個開源模型,包括DeciLM-6B、DeciLM-7B和DeciCoder,儘管其展示空間暫時停止,仍持續獲得大量下載。
具競爭力的性能與價格
如果Deci真選擇商業路徑,Deci-Nano就是一個具有指標性的第一步。這一模型在語言理解和推理方面表現卓越,使用NVIDIA A100 GPU在僅4.56秒內達到了256個令牌的處理速度。
Deci的博客強調,Deci-Nano在性能上超越了Mistral的7B-Instruct和Google的Gemma 7B,同時價格實惠,每百萬個輸入令牌僅需0.10美元,而OpenAI的GPT-3.5 Turbo需0.50美元,Claude 3 Haiku則為0.25美元。
Deci的聯合創始人兼CEO Yonatan Geifman表示:「Deci-Nano體現了我們以生產為導向的方法,專注於質量和成本效益。」這款8K上下文視窗模型是利用Deci的AutoNAC技術開發的,旨在通過生成小型模型來優化模型效率,這些小型模型能夠緊密仿真大型模型的功能。
從財務分析到內容創建,Deci-Nano旨在幫助企業在有效管理成本的同時推動創新。Deci還提供靈活的部署選項,企業可以選擇無伺服器實例以擴展或專用實例以增強隱私和定製化。這種多樣性使企業能根據不斷變化的需求調整其AI解決方案,而不影響性能。
推出全面平台
儘管最近的消息大多集中在Deci-Nano上,但全新的生成AI平台的推出代表了一項重大進展。該平台被描述為針對企業效率和隱私需求量身定做的「綜合解決方案」。
該平台包含什麼?根據Deci的說法,用戶將獲得可微調的LLM、推理引擎以及AI推理叢集管理解決方案。Deci-Nano是通過此平台提供的首個專有模型,還有計劃推出更多模型——部分為開源,部分為閉源。
推理引擎使得用戶可以根據需求部署Deci-Nano,無論是通過Deci的API、在其虛擬私人雲,還是本地部署。對於管理自有虛擬私人雲的客戶,Deci將提供容器化模型,以及在其Kubernetes叢集中的托管推理服務。
此外,生成AI平台還提供本地部署選項,滿足希望將數據留在內部的企業需求。客戶將獲得一個虛擬容器,裡面包括Deci-Nano以及Deci的Infery軟體開發工具包,便於整合進他們的應用程序中。
有關Deci生成人工智慧平台及其各種產品的定價細節尚未披露,但會隨著信息更新而提供更多資訊。