數據是人工智慧創新之基石。從敏捷創業公司到跨國企業,組織正投入數十億資金以利用數據集開發高效能的人工智慧應用程式。然而,儘管有這些龐大的投資,從各種來源和媒介(如文本、視頻和音頻)訪問和利用數據的挑戰依然複雜。團隊面臨諸多整合問題,導致延誤和商機的喪失。
加州的初創公司ApertureData旨在通過其統一數據層ApertureDB來解決這一挑戰。這一創新的解決方案結合了圖數據庫和向量數據庫的優勢以及多模態數據管理,使人工智慧和數據團隊能夠加速其應用程式的部署。最近,ApertureData宣布獲得825萬美元的種子資金,並推出其雲原生版的圖-向量數據庫。
“ApertureDB能夠將數據基礎設施和數據集準備時間縮短6到12個月,為首席技術官和首席數據官在快速變化且數據需求相互矛盾的環境中制定有效的人工智慧策略提供了巨大價值。”ApertureData創始人兼CEO Vishakha Gupta表示。她強調,這一產品可以使數據科學和機器學習團隊在多模態人工智慧開發中的生產力平均提升十倍。
ApertureData的獨特之處在哪裡?
許多組織在管理日益增加的多模態數據(包括數TB的文本、圖像、音頻和視頻)方面面臨困難,這妨礙了他們有效地利用人工智慧。挑戰不在於數據稀缺,而在於為先進人工智慧應用處理數據所需的碎片化工具生態系統。
目前,團隊必須從各種來源收集數據,將其存儲在雲端存儲庫中,並處理不斷變化的文件或數據庫元數據。這一過程通常需要編寫自定義腳本進行數據檢索和預處理。一旦初始任務完成,團隊還必須整合圖數據庫和向量搜索功能來實現所需的人工智慧體驗,導致顯著的延遲。
“企業希望他們的數據層能夠促進多樣數據媒介的管理,簡化機器學習的準備,並支持數據集管理、標註、模型跟蹤以及先進的數據搜索和可視化。不幸的是,他們經常不得不依賴手動整合不同雲存儲系統、數據庫和處理庫的解決方案,這使得工作流程複雜且延誤了項目時間表。”Gupta解釋道。她在英特爾工作時認識到了這一問題。
為了解決這一問題,Gupta與英特爾實驗室的研究科學家Luis Remis合作,共同打造了一個全面的數據層,能在一個平台上處理所有多模態人工智慧數據任務。
ApertureDB現在使企業能夠集中管理數據集(如大型圖像、視頻、文件、嵌入及其元數據),以便高效檢索和查詢。它提供統一的架構視圖,並包括知識圖和向量搜索功能,以支持從聊天機器人到搜索系統的各類人工智慧應用。
“通過廣泛的交流,我們意識到需要一個全面理解多模態數據管理和人工智慧需求的數據庫,使得採用和生產部署變得輕而易舉。這正是我們在ApertureDB中所實現的。”Gupta表示。
ApertureDB與現有解決方案的比較
儘管市場上有許多專注於人工智慧的數據庫,ApertureData旨在通過提供一個原生支持多模態數據的統一產品,搭配快速的多模態向量搜索來吸引市場。用戶可以輕鬆探索數據集之間的關係,並為特定應用選擇所需的人工智慧框架。
“我們的主要競爭對手是依賴各種工具混合的內部數據平台,例如關係或圖數據庫、雲存儲和內部腳本。通常,我們取代的是Postgres、Weaviate、Qdrant、Milvus、Pinecone、MongoDB或Neo4j等解決方案,特別是在多模態和生成式人工智慧的上下文中,”Gupta強調。
ApertureData聲稱其數據庫可使數據科學和人工智慧團隊的生產力平均提升10倍。據報導,它能以比傳統解決方案快35倍的速度調取多模態數據集,並提供2到4倍於現有開源向量數據庫的向量搜索和分類性能。
雖然Gupta未透露具體客戶資訊,但她提到公司已與幾家財富100強企業建立了部署關係,包括一家領先的家居零售商、一家大型製造商以及若干生物科技和新興生成式人工智慧初創公司。
“在我們的部署中,客戶的反饋突顯了在生產力、可擴展性和性能方面的顯著增長,”她補充道,並指出公司為一位客戶節省了200萬美元。
展望未來,ApertureData計劃擴展其雲平台,以支持新的人工智慧應用類別,增強生態系統整合,以實現無縫的用戶體驗,並擴大夥伴關係以推進更廣泛的部署。