데이터는 AI 혁신의 초석입니다. 민첩한 스타트업부터 다국적 기업까지 다양한 조직들이 고성능 AI 애플리케이션을 위해 데이터셋을 활용하기 위해 수십억 달러를 투자하고 있습니다. 하지만 이러한 막대한 투자에도 불구하고, 텍스트, 비디오, 오디오 등 다양한 출처와 양식의 데이터를 접근하고 활용하는 것은 여전히 복잡한 도전 과제로 남아 있습니다. 팀은 여러 통합 장애물에 직면하여 지연과 비즈니스 기회 손실을 초래하고 있습니다.
캘리포니아 기반 스타트업인 ApertureData는 이러한 문제를 해결하기 위해 통합 데이터 레이어인 ApertureDB를 선보였습니다. 이 혁신적인 솔루션은 그래프 및 벡터 데이터베이스의 강점을 결합하며, 다중 모드 데이터 관리 기능을 통해 AI와 데이터 팀이 애플리케이션 배포 속도를 높일 수 있도록 지원합니다. 최근 ApertureData는 825만 달러의 초기 자금을 확보하고 클라우드 네이티브 그래프-벡터 데이터베이스 버전을 출시했습니다.
“ApertureDB는 데이터 인프라 및 데이터셋 준비 시간을 6개월에서 12개월까지 단축시킬 수 있어, 빠르게 변화하는 환경에서 효과적인 AI 전략을 개발해야 하는 CTO와 CDO에게 큰 가치를 제공합니다.”라고 ApertureData의 창립자이자 CEO인 비샤카 구pta가 말했습니다. 그녀는 이 솔루션이 다중 모드 AI 개발에서 데이터 과학 및 머신 러닝 팀의 생산성을 평균 10배 향상시킬 수 있다고 강조했습니다.
ApertureData의 차별점은 무엇인가요? 많은 조직들이 테라바이트 규모의 텍스트, 이미지, 오디오 및 비디오와 같은 다중 모드 데이터의 유입 증가를 효과적으로 관리하지 못하고 있어 AI 활용에 어려움을 겪고 있습니다. 문제는 데이터 부족이 아닌, 고급 AI 애플리케이션을 처리하기 위해 필요한 조각난 도구 생태계에 있습니다.
현재 팀은 다양한 출처에서 데이터를 수집하고 이를 클라우드 저장소에 저장하며, 파일이나 데이터베이스의 지속적으로 변화하는 메타데이터를 처리해야 합니다. 이 과정에서 데이터 검색 및 전처리를 위한 사용자 정의 스크립트를 작성해야 하는 경우가 많습니다. 초기 작업이 완료된 후에는 원하는 AI 경험을 구현하기 위해 그래프 데이터베이스와 벡터 검색 기능을 통합해야 하므로 상당한 지연이 발생합니다.
“기업들은 데이터 레이어가 다양한 데이터 양식을 관리하고, ML 준비를 간소화하며, 데이터셋 관리, 주석, 모델 추적 및 고급 데이터 검색과 시각화를 지원해주기를 바랍니다. 하지만 그들이 자주 의존하는 것은 다양한 클라우드 스토리지 시스템, 데이터베이스 및 처리 라이브러리를 포함한 수동 통합 솔루션으로, 이는 워크플로우를 복잡하게 만들고 프로젝트 일정을 지연시킵니다.”라고 구pta는 인텔에서 비전 데이터 작업 중 이 문제를 인식했다고 설명했습니다.
이에 구pta는 인텔 연구소의 연구 과학자인 루이스 레미스와 협력하여 모든 다중 모드 AI 데이터 작업을 단일 플랫폼에서 처리할 수 있는 포괄적인 데이터 레이어를 만들었습니다. ApertureDB는 이제 기업이 대형 이미지, 비디오, 문서, 임베딩 및 메타데이터를 중앙 집중화하여 효율적으로 검색하고 쿼리할 수 있도록 지원합니다. 이는 스키마에 대한 통합 뷰를 제공하며, 다양한 AI 애플리케이션에서 사용될 수 있는 지식 그래프 및 벡터 검색 기능을 포함하고 있습니다.
“폭넓은 대화를 통해 우리는 다중 모드 데이터 관리와 AI 요구 사항을 모두 이해하는 데이터베이스의 필요성을 깨달았고, 이를 통해 도입과 프로덕션 배포를 쉽게 할 수 있도록 했습니다. 이것이 바로 ApertureDB가 달성한 목표입니다.”라고 구pta는 밝혔습니다.
ApertureDB는 기존 솔루션들과 어떻게 비교될까요? 많은 AI 중심의 데이터베이스가 존재하지만, ApertureData는 다중 모드 데이터를 네이티브로 처리하고, AI 애플리케이션을 위한 신속한 다중 모드 벡터 검색과 지식 그래프 통합을 원활하게 지원하는 통합 제품을 제공하여 틈새 시장을 공략하고자 합니다. 사용자는 데이터셋 간의 관계를 쉽게 탐색하고 특정 애플리케이션에 대해 선호하는 AI 프레임워크를 사용할 수 있습니다.
“우리의 주요 경쟁자는 관계형 또는 그래프 데이터베이스, 클라우드 스토리지 및 내부 스크립트를 혼합하여 사용하는 사내 데이터 플랫폼입니다. 일반적으로 우리는 포스트그레스, 위비에이트, 크에드란트, 밀버스, 파인콘, 몽고DB 또는 네오4j와 같은 솔루션을 대체합니다.”라고 구pta는 강조했습니다.
ApertureData는 자사의 데이터베이스가 데이터 과학 및 AI 팀의 생산성을 평균 10배 향상시킬 수 있다고 주장합니다. 전통적인 솔루션보다 다중 모드 데이터셋을 최대 35배 빠르게 mobilize할 수 있으며, 벡터 검색 및 분류 성능도 기존 오픈 소스 벡터 데이터베이스보다 2배에서 4배 더 빠른 것으로 보고되었습니다. 구pta는 특정 고객 신원을 공개하지는 않았지만, Fortune 100 기업과의 배포를 설정했으며, 주요 가정용 가구 소매업체와 대규모 제조사 및 여러 생명 과학 및 새로운 생성 AI 스타트업들이 포함되어 있다고 언급했습니다.
“방문된 모든 고객들로부터 우리는 생산성, 확장성, 성능 면에서 상당한 향상을 경험했습니다.”라는 그녀는 덧붙이며, 한 고객이 200만 달러를 절감했다고 전했습니다.
앞으로 ApertureData는 클라우드 플랫폼을 확장하여 새로운 AI 애플리케이션 클래스를 수용하고, 매끄러운 사용자 경험을 위한 생태계 통합을 강화하며, 더 넓은 배포를 위한 파트너십을 확대할 계획입니다.