ApertureData为企业提供10倍速度提升,助力多模态数据应用

数据是人工智能创新的基石。从灵活的初创公司到跨国企业,组织都在投入数十亿美元以利用数据集来开发高性能的人工智能应用程序。然而,尽管这些投资可观,获取和使用来自多种来源和模态的数据——如文本、视频和音频——仍然是一项复杂的挑战。团队面临诸多整合障碍,导致项目延误和商业机会的流失。

位于加利福尼亚的初创公司ApertureData旨在通过其统一数据层ApertureDB来应对这一挑战。这一创新解决方案结合了图数据库和向量数据库的优势,并兼顾多模态数据管理,使人工智能和数据团队能够加速应用部署。最近,ApertureData宣布获得825万美元的种子资金,并推出其云原生的图向量数据库版本。

“ApertureDB能够将数据基础设施和数据集准备时间缩短6到12个月,为首席技术官(CTO)和首席数据官(CDO)在快速变化且数据要求矛盾的环境中制定有效人工智能战略提供巨大的价值,”ApertureData创始人兼首席执行官Vishakha Gupta表示。她强调,这一解决方案可以将数据科学和机器学习团队的生产力在多模态人工智能开发中提升十倍。

ApertureData的独特之处

许多组织在管理日益增长的多模态数据(例如大量的文本、图像、音频和视频)方面面临困难,进而阻碍了有效利用人工智能的能力。这里的挑战并不是数据稀缺,而是为处理这些数据所需的工具生态系统分散。

目前,团队必须从不同的来源收集数据,存储在云端存储库中,并处理不断变化的文件或数据库中的元数据。这个过程通常需要编写自定义脚本进行数据检索和预处理。在初步任务完成后,团队必须整合图数据库和向量搜索功能以实现所需的人工智能体验,这导致了显著的延误。

“企业期望他们的数据层能够支持多种数据模态的管理,简化机器学习准备,并支持数据集管理、标注、模型追踪及高级数据搜索与可视化。然而,他们往往不得不依靠手动集成的方案,涉及多个云存储系统、数据库和处理库,这使得工作流程复杂化并延误项目的时间表,”Gupta解释说,她在英特尔与视觉数据合作时意识到了这个问题。

为了解决这一问题,Gupta与英特尔实验室的研究科学家Luis Remis合作,创建了一个全面的数据层,能够在一个平台上处理所有多模态人工智能数据任务。

ApertureDB现在使企业能够集中管理数据集——如大尺寸图像、视频、文档、嵌入以及它们的元数据——以实现高效检索和查询。该平台提供了统一的模式视图,并包含知识图谱和向量搜索能力,适用于从聊天机器人到搜索系统的各种人工智能应用。

“通过广泛的交流,我们了解到市场需要一个能够全面理解多模态数据管理和人工智能需求的数据库,使得采用和生产部署变得轻松。这正是我们在ApertureDB中所实现的目标,”Gupta说道。

ApertureDB的优势

尽管市场上已有许多专注于人工智能的数据库,但ApertureData希望通过提供一种原生支持多模态数据的统一产品来开辟一片蓝海,能够无缝集成知识图谱与快速的多模态向量搜索。用户可以轻松探索数据集之间的关系,并为特定应用选择优先的人工智能框架。

“我们主要的竞争对手是依赖不同工具组合的内部数据平台,例如关系型数据库或图数据库、云存储和内部脚本。通常情况下,我们能够替代如Postgres、Weaviate、Qdrant、Milvus、Pinecone、MongoDB或Neo4j等解决方案,尤其是在多模态和生成式人工智能背景下,”Gupta强调。

ApertureData声称其数据库可以将数据科学和人工智能团队的生产力平均提升10倍。报告显示,其在调动多模态数据集的速度上比传统解决方案快35倍,同时在向量搜索和分类性能方面比现有的开源向量数据库快2到4倍。

尽管Gupta未透露具体客户名称,但她提到,他们已与一些财富100强企业建立了部署关系,包括一家领先的家居零售商、一家大型制造商以及多家生物科技和新兴生成式人工智能初创企业。

“在我们的部署中,客户反馈突显出生产力、可扩展性和性能的显著提升,”她补充道,并指出该公司为某客户节省了200万美元。

展望未来,ApertureData计划扩展其云平台,以适应新类人工智能应用,增强生态系统集成,以实现无缝用户体验,并拓展伙伴关系以实现更广泛的部署。

Most people like

Find AI tools in YBX