在人工智能时代,传统的表格数据库面临挑战,尤其是在处理复杂数据类型(如向量、图像、视频和音频)时,尤其是在大规模应用中。尽管存储这些多样格式已十分困难,但检索和管理这些数据则使问题更加复杂,尤其是涉及多个文件类型时。
这时,LanceDB应运而生,专为AI领域量身打造。该公司获得了Y Combinator的支持,并最近宣布完成了800万美元的种子轮融资,总融资额达1100万美元。LanceDB开发了一种专门针对多模态数据设计的数据库,利用开源的Lance列式格式,优化了机器学习任务。该平台实现了本地对象存储集成,确保AI数据的高性能、可扩展和云原生管理与检索。
开发者可以通过三种方式使用LanceDB:将其嵌入现有后端、通过Jupyter Notebook等客户端应用程序运行,或作为远程无服务器数据库进行部署。与传统系统将客户端与服务器视为独立进程不同,LanceDB有效地将存储与计算分离,实现了在应用程序中的直接嵌入。
目前,Midjourney、Character.ai、Airtable、Tubi、Hex及WeRide等知名机构已经在使用LanceDB。此次融资旨在增强公司的产品,促进AI项目从实验向生产的转变。种子轮融资由风险投资公司CRV主导,Y Combinator、Essence VC和Swift Ventures也给予了支持。
“多模态模型是新的前沿。前瞻性的AI从业者需要创新的数据基础设施,以训练和更新AI应用程序,跟上下一代AI的发展,”CRV的合伙人Murat Bicer表示。
LanceDB目前提供全面功能的开源数据库,支持Rust、Python和JavaScript的SDK,还有一个托管的无服务器解决方案,以及为管理大数据集并需要强大安全特性的团队设计的企业产品。