Snorkel AI宣布Snorkel Flow平台重大更新
來自斯坦福AI實驗室的初創公司Snorkel AI,對其旗艦產品Snorkel Flow進行了重要升級。這個數據標註、篩選、策劃和AI微調的平台現在可與Google的Gemini AI模型系列和Meta的新Llama 3直接整合。
自2022年3月推出以來,Snorkel Flow旨在簡化企業定制AI解決方案的開發和部署。該平台幫助組織自動標註、註解和整理結構化及非結構化文件,將其轉化為可靠的信息來源,應用於各類AI項目。
Snorkel AI的聯合創始人兼CEO Alex Ratner在一次媒體訪問中表示:「企業目前面臨由於網絡上的通用數據訓練的現成LLM模型帶來的挑戰。這些模型無法滿足組織的特定需求。Snorkel Flow填補了這一空白,促進高效的數據標註和開發。」
例如,如果一家公司希望建立一個提供內部政策信息的員工聊天機器人,Snorkel Flow可確保相關文件正確標註,以便於檢索。同樣,為客服聊天機器人建立的企業可微調模型以識別特定產品名稱。
Ratner解釋說,Snorkel AI專注於「AI數據開發」,涉及標註、數據策劃和數據集的精煉。他補充道:「雖然雲服務商提供模型調整的API,但他們不支持為這些API準備數據的關鍵任務,這通常是最具挑戰性的部分。」
在推出時,Snorkel Flow具備程序化數據標註和協作AI開發等功能,為包括紀念斯隆凱特林癌症中心和Chubb等企業帶來好處。這些組織報告稱AI模型的準確性和效率提高了10到100倍。此外,Snorkel協助主要銀行自動化合規數據標註,將手動工作時間從六個月縮減至24小時。
根據Ratner的說法,隨著基礎LLM的普及,包括強大的開源模型如Llama 3,數據標註和策劃的速度與準確性對AI模型的微調變得至關重要。
Snorkel Flow的新功能
更新後的Snorkel Flow平台允許用戶將經Snorkel AI組織和標註的企業數據用作與Google Gemini和Llama 3兼容的可靠信息來源。與Databricks Unity Catalog、Vertex AI和Microsoft Azure Machine Learning的新整合進一步提升了企業的數據管理和訪問控制。
此外,Snorkel Flow現已支持多模式數據(包括圖像)的程序化標註,提供全面的AI洞察解決方案。Wayfair已利用這一圖像數據標註能力,旨在將標註時間從數月縮短至數日。
增強的安全功能
Snorkel為帳戶管理員引入了基於角色的訪問控制(RBAC),使其能夠更細緻地控制AI項目的數據訪問和利用。管理員現在可以管理誰可以上傳數據並訪問連接的服務,這與OpenAI的新Projects功能相似,但在控制來自不同供應商的多個模型的訪問方面增強了靈活性。
此外,Snorkel Flow支持本地和空氣隔離的基礎模型訪問,增強了合規性和數據安全性。
此次更新與Snorkel近期推出的企業AI加速器Snorkel Custom相一致,該工具協助組織進行AI模型評估、調試和優化的各個階段。
從演示到實際價值
總體而言,Snorkel致力於幫助企業有效利用生成式AI,通過優化數據來微調模型,並開發AI驅動的應用程序。Ratner表示:「市場上對從視覺吸引的AI演示過渡到提供實際生產價值存在巨大的壓力。」
Snorkel Flow和Snorkel Custom現已全面上線,定價根據具體用例而定。