Activeloop 籌集 1,100 萬美元 以增強 AI 數據庫解決方案
總部位於加州的初創公司 Activeloop 成功從 Streamlined Ventures、Y Combinator 和 Samsung Next 等投資者手中獲得 1,100 萬美元的 A 輪融資。該公司由普林斯頓大學退學生 Davit Buniatyan 聯合創立,專注於一種專用數據庫,旨在加速 AI 項目的開發。
Activeloop 在競爭激烈的數據平台市場中脫穎而出,因為它解決了企業面臨的一個重大挑戰:如何利用非結構化的多模態數據來訓練 AI 模型。他們的創新技術「Deep Lake」使團隊能以高達 75% 的成本優勢開發 AI 應用,同時提高工程生產力達五倍。
釋放 Deep Lake 的 AI 潛力
隨著企業探索如何利用複雜數據集來應對各類 AI 應用,麥肯錫的研究指出生成式 AI 有著豐富的潛力,可能為全球企業年創造 2.6 至 4.4 萬億美元的利潤。這一影響遍及客戶互動、行銷內容創作以及從自然語言提示生成軟件代碼等多個領域。
Deep Lake 的運作方式
訓練高效能的 AI 基礎模型通常涉及管理以字串、音頻和視頻形式存在的 PB 級非結構化數據。傳統方法要求團隊篩選無序數據,並需要大量繁瑣的編碼和集成工作,進而推高項目成本。
Activeloop 通過 Deep Lake 的標準化來解決這一效率低下的問題。這一系統將圖像和視頻等複雜數據存儲為適合機器學習的數學表示(張量),並通過類似 SQL 的張量查詢語言實現無縫檢索,提供即時可視化功能或與深度學習框架(如 PyTorch 和 TensorFlow)的整合。
透過 Deep Lake,開發人員能高效地篩選和搜索多模態數據,追踪版本,並針對具體應用流式傳輸數據以訓練 AI 模型。
轉變 AI 數據管理
Buniatyan 強調,Deep Lake 結合了普通數據湖的優勢,並將所有數據轉換為深度學習算法所需的張量格式。張量可存儲在 AWS S3 等雲端或本地解決方案中,並流式傳輸至 GPU 進行高效訓練,消除過去因批量複製造成的 GPU 閒置問題。
自 2018 年成立以來,Activeloop 基於 Buniatyan 在普林斯頓神經科學實驗室的挑戰,開發了完整的數據庫功能,包括開源和專有元素。開源方面包括數據集格式、版本控制及各種 API 以簡化數據處理;而專有功能則提供先進的可視化工具及強大的流媒體引擎。
儘管具體客戶數量尚未披露,但該開源項目已被下載超過一百萬次,增強了 Activeloop 在企業市場的立足點。企業解決方案採用基於使用量的定價模式,已在生物製藥、生命科學、醫療科技、汽車及法律等受監管行業的《財富》500 強公司中得到應用。例如,Bayer Radiology 使用 Deep Lake 將多種數據模態合併為單一解決方案,顯著減少了數據預處理時間,並引入了與 X 光片對話的功能,讓數據科學家能用自然語言查詢掃描數據。
未來增長計畫
Activeloop 目標在於提升其企業解決方案,吸引更多客戶使用其 AI 數據庫,專注於簡化複雜非結構化數據的組織和檢索。公司計劃擴大工程團隊,以支持此次融資後的增長。
Buniatyan 也期待即將推出的 Deep Lake v4,這將引入更快的並行 I/O、高級流式數據加載器以進行模型訓練,以及全面的數據沿襲功能,並與外部數據源整合。他強調,儘管該市場存在許多客戶,但尚未出現直接的競爭對手。
最終,Activeloop 希望幫助企業顯著減少與內部數據組織和檢索相關的成本,使工程師能專注於提升生產力,而非重複的編碼任務。