在利用人工智慧建立企業知識庫的過程中,關鍵資訊經常被忽視。儘管將影像、影片、文件和電子表格上傳以訓練模型相對簡單,但像發票、電子郵件和PDF這類非結構化資料,則帶來挑戰。將這些文件手動轉換為可搜尋格式是個勞動密集的過程,通常超出了缺乏機器學習專業知識的工程團隊的能力範圍。
然而,Bem公司由Antonio Bustamante和Upal Saha創立,旨在填補這一空白。Bem提供一個API,使開發人員能夠將任何類型的輸入(結構化或非結構化)轉換為所需的資料格式。這家初創企業成功籌集了370萬美元的種子資金,由Uncork Capital領投,並有Lookout創始人Kevin Mahaffey、Roar Ventures及Y Combinator的Garry Tan等知名天使投資者參與。
“工程團隊大約44%的時間用於構建、監控和維護資料管道。”Bustamante解釋道。“Bem致力於重新定義互操作性和整合,使團隊能專注於真正重要的事情──他們的產品。我們的目標是減輕工程師在整合和資料獲取管道上的負擔,讓他們能專注於為用戶創造價值。”
結構化資料即服務
針對工程師,Bem以用戶友好的方式自豪,無需繁瑣的訓練或配置。開發人員可以輕鬆使用API定義所需的資料結構,然後提交其資訊。Bustamante將其比作Stripe通過易於使用的API簡化支付處理的方式。
Bem提供的不僅僅是一項一次性的服務;它建立了一個持續的資料管道,將資訊在組織與Bem之間傳輸。“客戶每分鐘向我們發送數以千計的資料,形成穩定的資料流。”他解釋道。
該平台有效地充當結構化資料即服務(SDaaS)。Bustamante指出:“許多來自公司的輸入都是雜亂的。我們的用戶只需要一個符合其內部資料格式和結構的結構化版本。我們提供轉換和結構化服務。”
Bem對其產品潛力充滿信心。許多企業因忙碌無法自行開發解決方案,而Bustamante形容這是一個迫切的“火燒眉毛”問題。該初創公司主要協助物流、供應鏈、醫療和保險等行業的軟體公司,這些行業在處理非結構化資料時面臨最大挑戰。
目前可用的解決方案主要針對文件審核流程,而Bem則提供面向最終用戶應用的產品整合基礎構件,這與更適合後台流程的競爭對手有所區別。
創新的資料管理
Bem使用基礎模型和開源模型的結合開發其平台,持續通過客戶互動來改善智能。值得注意的是,該平台確保資料隔離,模型僅在各自客戶的資料上進行訓練。
目前,Bem處於私有測試階段,已有十位早期客戶,並目標於C輪及以後的企業。Bustamante強調,隨著增長,對有效資料管理的需求越發明顯,尤其是在物流、供應鏈、醫療和保險行業。
最近的370萬美元資金將用於提升Bem平台,尤其是在工程、研究和開發方面。
“企業常常面臨雜亂的資料獲取問題,”Uncork Capital的管理合夥人Andy McLoughlin表示。“Bem的解決方案自動化並簡化了這一過程,提供了一項重要服務。這一問題在各行各業都普遍存在,但在保險和物流等行業尤為突出。”
McLoughlin強調,Bem使資料管理民主化,並賦予企業有效管理資料的能力。歷來,只有大型科技公司才能利用這樣的資料轉換能力。隨著企業越來越渴求更高效的工具,那些成功商業化此類解決方案的公司將獲得可觀的增長。
在競爭方面,Bem的CEO指出Unstructured是一個值得注意的競爭者,儘管他注意到他們的目標市場不同,Unstructured專注於文件處理。然而,Bem的主要競爭對手依然是那些試圖在內部建立相似能力的公司。Bustamante指出,許多客戶很快意識到內部開發的高成本。
Bem的服務價格目前根據所管理的資料逐案確定。未來幾個月,該公司計劃標準化定價結構,以確保透明度並提供顯著的投資回報,目標回報率為25到30倍,考慮到非結構化資料所帶來的重大挑戰。
估值細節尚未披露。