透過 Braintrust 數據加速 LLM 評估:企業更快速的解決方案

位於加州的Braintrust Data已籌集510萬美元的種子資金,此輪由Greylock Partners領投。該公司由安庫爾·戈雅爾創立,他之前將AI創業公司Impira出售給Figma。Braintrust的目的是幫助企業在AI模型投入生產之前,高效地評估和提升其性能。

儘管是一家年輕的創業公司,Braintrust迅速吸引了眾多客戶和投資者,包括業界知名人士如Elad Gil、Clem Delangue和Greg Brockman。公司計劃擴大團隊,持續提供創新解決方案,協助開發者在快速變化的AI領域中保持競爭力。

在生產過程中克服AI挑戰

雖然AI是現代應用程序的核心,但整合和維護這些系統可能具有挑戰性。小的代碼修改雖旨在改善應用,卻可能無意中干擾整個工作流程,迫使後端團隊緊急尋找解決方案。這種反應式策略可能會對客戶體驗產生負面影響,因此在開發過程中評估AI性能至關重要。團隊在試驗不同模型和技術時,會評估上下文特定的數據和指標,以優化結果。

簡化時間和精力的投入

雖然傳統的評估方法有效,但往往消耗大量時間和資源,導致功能發布延遲——這是戈雅爾在Impira遇到的問題。為此,戈雅爾創立Braintrust Data,以加速評估和代碼變更的實際測試。

戈雅爾向媒體解釋道:“我們的產品使您能在一小時內為評估參數化代碼。您可以在變更後快速重新運行評估,並即時獲得模型性能的回饋,從而在最終部署前調試具體案例,包括從預備環境和生產環境記錄示例,以辨識新的用戶邊緣案例。”

快速的客戶採用

自2023年8月推出以來,Braintrust已獲得數百家企業和創業公司的客戶,包括Airtable、Zapier、Coda和Instacart。客戶報告稱,他們的AI產品準確性在僅僅幾週內提高了超過30%,這導致了更快的發布周期和加強的團隊協作。

戈雅爾補充道:“我們的產品可以在您的雲環境內運行,確保企業級的安全性,這在充滿個人識別資訊(PII)和專有信息的AI環境中至關重要。這一特性使我們的客戶能夠在關鍵工作負載上使用Braintrust。”

提高AI團隊的工作效率

除了評估工具,Braintrust還提供幫助AI團隊更快迭代的功能,如用於比較提示的提示遊樂場、基準的輸入輸出對、數據集管理,及提供來自OpenAI、Anthropic、LLaMa 2和Mistral等熱門模型訪問的AI代理。

日益重視AI質量

隨著企業日益採用AI解決方案,對於評估模型性能和填補空白工具的需求越來越強。自ChatGPT推出以來,很多公司陸續出現,提供各種產品以衡量模型性能和改善可觀察性。

戈雅爾強調了Braintrust的獨特做法:“雖然許多產品專注於可觀察性,僅提供部署後的見解,但我們的評估使工程團隊能以高達十倍的速度進行創新,這不僅僅依賴於發布後的修復。”

在最近獲得的Greylock資金支持下,Braintrust的總資金已達830萬美元。戈雅爾計劃擴大團隊,推進產品路線圖,增強Braintrust在評估和AI工具方面的能力,包括提示遊樂場功能、生成日誌、多模態模型支持等。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles