Kimi平台的「月之暗面」:上下文快取的公開測試版啟動,助力長文本模型降低成本

Kimi開放平台推出AI開發的上下文快取功能

Kimi開放平台全新推出的上下文快取功能現已開始公開測試。這項創新技術能幫助開發者將成本降低高達90%,同時顯著提升AI模型的反應速度,為人工智慧服務帶來效率與成本控制的重大突破。

上下文快取是一種尖端數據管理技術,預先存儲常被請求的數據,以減少對原始數據源的重複計算。當用戶再次要求相同的信息時,系統能迅速從快取中檢索,這樣不僅縮短了處理時間,還降低了開支。此技術對依賴長文本模型和高頻查詢需求的應用特別有效。

Kimi開放平台指出,上下文快取適用於多種商業場景,包括:

- 問答機器人(如Kimi API助理)

- 固定文檔集的查詢工具(如公司信息披露系統)

- 靜態代碼庫的定期分析

此功能特別適合高流量AI應用,如對話模擬器和LLM謎題。啟用上下文快取後,初始標記延遲可減少83%,大幅提升用戶體驗。

在定價方面,Kimi開放平台提供靈活透明的收費結構,包括快取創建、存儲和使用的費用。快取創建費用根據實際標記數量收取,收費標準為每百萬標記24元。快取存儲按每分鐘收費,每百萬標記10元,快取檢索則另行收費,包括增量標記費(按標準模型費率)和每次調用的使用費0.02元。

公開測試將持續三個月,根據用戶反饋可能會進行價格調整。Tier 5用戶將優先獲得訪問權限,其他用戶的詳細信息將稍後公布。

隨著人工智慧技術的持續發展,如何在保持服務質量的同時有效控制成本,已成為開發者和企業的核心關注。Kimi開放平台推出的上下文快取功能為這一挑戰提供了強有力的解決方案,有望提升AI服務的採用率和應用效果。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles