位于旧金山的SuperDuperDB是英特尔Ignite投资组合中的一员,近期推出了其开源框架版本0.1,旨在简化人工智能(AI)应用的开发与部署。这个Python程序包使用户能够将AI(从机器学习(ML)模型到优选的AI应用编程接口(API))与现有数据库中的向量搜索功能无缝集成,从而直接在这些平台上构建AI应用。
SuperDuperDB在来自Hetz.vc、Session.vc和MongoDB风险投资部门的175万美元早期融资支持下,展现出在AI领域的重大潜力。SuperDuperDB首席执行官Timo Hagenow表示:“MongoDB的支持体现了SuperDuperDB的转型潜力。我们的目标是弥合数据存储和AI之间的鸿沟,使企业能够更轻松地构建和管理AI应用,促进数据与AI之间的共生关系。”
该框架现已在Product Hunt上提供。
解决AI挑战
随着AI成为现代企业运营的核心,开发利用强大ML模型和专有数据的应用变得愈加复杂。尽管市场上有众多ML模型和API,开发者在将这些技术投入生产时常面临重大挑战。将主要数据库中的数据融入专用的向量数据库通常涉及复杂且脆弱的管道,导致冗长的流程,延迟项目上线。
Hagenow解释道:“公司通常只关注简化算法在计算资源上的部署,或通过复杂的管道集成数据与算法,这通常被称为MLOps。”为了简化这一过程,Hagenow及其团队开发了SuperDuperDB,将AI模型(包括流推理和可扩展模型训练)直接引入企业数据库。
他补充道:“SuperDuperDB可以作为Python包轻松安装,允许开发者建立一个可扩展的AI模型及API的部署,与数据库直接沟通。这将数据库转变为一个强大的AI开发与部署环境,可以在实验模式下、单一客户上,或通过Kubernetes在云端或本地扩展。它为开发者提供了对算法、数据、计算和基础设施的完全开源控制。”
通过该框架,开发者可以利用多种机器学习模型进行分类、回归和推荐应用,此外还可以使用先进的生成性AI模型进行基于大语言模型的聊天和向量搜索。向量搜索功能可以使用供应商的内数据库功能或SuperDuperDB自有的向量索引能力。
强大的合作生态系统
尽管产品依然处于早期阶段,SuperDuperDB已吸引了生态系统内的关键参与者,为企业团队提供对流行数据库和模型的全面支持。该框架支持多种数据平台,包括MongoDB、PostgreSQL、MySQL、SQLite和Snowflake等。在AI方面,它兼容Python生态系统中的模型、PyTorch、Sklearn以及来自OpenAI和Anthropic等供应商的热门API。
Hagenow表示:“MongoDB已成为我们的官方技术合作伙伴,我们与主要客户如思科进行过网络研讨会和现场编码会话,同时还与英特尔及其他中小企业探索多个POC。”
扩展生态系统
Hagenow强调,SuperDuperDB正积极寻求与主要数据库公司合作,以实现更深层次的集成。最终目标是与企业数据平台如Databricks和Snowflake实现无缝集成。值得注意的是,该公司正在计划为Snowflake开发原生应用,该应用将在其市场上提供。
潜在应用
如果得到广泛采用,SuperDuperDB将简化各个行业的AI应用开发。MongoDB工业解决方案领域首席技术官Boris Bialek指出:“将SuperDuperDB的技术与MongoDB Atlas Vector Search相结合,将显著加速AI开发者的进程。这一创新使从金融领域的欺诈检测到医疗领域的药物发现等行业能够快速构建和部署现代应用。”
尽管市面上已有像MindsDB这样的内数据库AI解决方案,但通常要求开发者适应SQL方言,而SuperDuperDB则是以Python为主,符合AI研发中广泛使用的编程语言。Bialek总结道:“SuperDuperDB提供熟悉的Python接口,同时允许专家访问详细的实现要素,如模型权重和训练细节。用户可以直接处理各种数据类型,包括在Python中以字节编码的图像、视频和音频。这一独特的方法使SuperDuperDB在AI开源领域中脱颖而出。”