DeepInfra 從靜默模式中正式推出,獲得800萬美元資金,旨在降低人工智慧推理的成本。

解鎖生成式 AI:企業領導者指南

作為企業領導者或 IT 決策者,您可能經常接觸到有關生成式 AI 的討論。如果您準備為員工或客戶實施大型語言模型(LLM)聊天機器人,您面臨的關鍵問題是:如何啟動它,以及預期的成本是多少?

介紹 DeepInfra

DeepInfra 成立於前 IMO Messenger 工程師,旨在簡化這一過程。該公司提供在私有伺服器上部署模型的服務,價格僅為每百萬個標記 1 美元,遠低於 OpenAI 的 GPT-4 Turbo 10 美元和 Anthropic 的 Claude 2 11.02 美元。

DeepInfra 最近從隱密發展中推出,宣布完成由 A.Capital 和 Felicis 領投的 800 萬美元種子輪融資。他們專注於提供一系列開源模型推論,包括 Meta 的 Llama 2 和 CodeLlama,以及這些模型的定製版本。

DeepInfra 的價值主張

雖然 LLM 所需的 GPU 資源受到廣泛關注,但足夠的計算能力以確保可靠性能(稱為推論)的重要性不容忽視。根據首席執行官 Nikola Borisov 的說法,真正的挑戰在於有效地在相同硬體上服務多個並發用戶。

Borisov 解釋道:“關鍵是管理多個用戶同時訪問伺服器。這些模型所生成的每個標記都需要大量的計算和記憶體帶寬。” 為確保最佳性能,企業必須專注於最大化效率,以防伺服器因冗餘計算任務而過載。

DeepInfra 的創始人利用他們在全球管理龐大伺服器陣列的豐富經驗,有效地應對這些挑戰。

來自頂尖投資者的背書

Borisov 和他的共同創始人在編程專業知識方面獲得了認可。知名企業家和 Felicis 管理合夥人 Aydin Senkut 讚揚他們的能力,表示:“他們擁有驚人的經驗,或許僅次於 WhatsApp 團隊,能建立服務數億用戶的高效基礎設施。”

這種基礎設施的高效性使 DeepInfra 能以較低成本提供服務,使其在企業面臨不斷上升的 AI 開支時格外具吸引力。Senkut 指出:“如果一家公司能在 AI 上實現 10 倍的成本優勢,將可能大大擾亂市場。”

針對中小企業的開源 AI

DeepInfra 的初步重點是中小企業(SMBs),旨在為其提供負擔得起的尖端開源語言和機器學習模型。“我們的目標客戶希望在不過度支出的情況下可靠地獲取頂級模型,”Borisov 表示。

該公司密切關注開源 AI 社區的進展,隨時準備採用新出現的專門用於文本生成、計算機視覺和編程等各種任務的模型。

Borisov 表達了對開源解決方案持續增長和多樣性的信心:“隨著 Llama 等模型的發布,許多人將創造其變種,並需最小的計算需求,進一步推動協作生態系統。”

隱私與安全

DeepInfra 的推論托管服務對於重視數據隱私的企業尤其有吸引力。Borisov 保證:“我們不會存儲或使用任何提交的提示;用戶會話結束後,這些提示會被丟棄,”強調他們對隱私的承諾。

利用 DeepInfra 的服務,企業可以有效且具成本效益地應對採用生成式 AI 解決方案的複雜性,確保在快速變化的市場中保持競爭力。

Most people like

Find AI tools in YBX