파리, 프랑스에 본사를 둔 AI 기반 트랜스크립션 및 오디오 인텔리전스 제공업체 Gladia가 1,600만 달러의 자금을 성공적으로 조달했습니다. Gladia는 이 투자를 통해 오디오 인프라를 개선하고, 혁신적인 실시간 오디오 트랜스크립션 및 분석 엔진을 개발할 계획입니다. 이 기술은 음성 중심 플랫폼에 고급 AI 기능을 제공하여 다양한 지역에서 사용자 경험을 향상시키는 것을 목표로 합니다.
CEO 장-루이 케기너는 인터뷰에서 Gladia 설립의 동기를 설명하며, 자신이 영어를 구사할 때 겪었던 기존 트랜스크립션 서비스의 문제점을 강조했습니다. 그는 "제 아름다운 프랑스 억양을 들어보시면 아시겠지만, 이러한 서비스들이 일관되게 정확하지 않아서 매우 좌절했습니다."라고 밝혔습니다.
케기너는 Gladia의 실시간 트랜스크립션 기능을 시연하며, 무거운 억양에도 불구하고 인상적인 정확도를 자랑하는 시스템을 소개했습니다. 데모 중 시스템은 언어를 원활하게 전환하며 다국어에 대한 능숙함을 보여주었습니다.
이번 자금 조달은 XAnge가 주도했으며, Illuminate Financial, XTX Ventures, Athletico Ventures, Gaingels, Mana Ventures, Motier Ventures, Roosh Ventures, Soma Capital 등 저명한 투자자들이 참여했습니다. 이번 라운드로 Gladia의 누적 자금은 2,030만 달러에 이르며, 이전에는 New Wave, Sequoia Capital, Cocoa, GFC 등으로부터 초기 투자를 받았습니다. 이 회사는 AWS 생성 AI 액셀러레이터 프로그램에 선정되기도 했습니다.
XAnge의 파트너 알렉시 뒤 펠루는 "Gladia는 우리가 지지하는 품질을 구현하고 있습니다. AI 혁신의 최전선에 있는 대담하고 글로벌한 기술 팀과, 산업 전반에 걸쳐 새로운 기회를 여는 입증된 비즈니스 모델을 갖추고 있습니다."라고 말하며, 빠르게 변화하는 AI 환경에서 케기너와 그의 팀의 효과적인 실행을 칭찬했습니다.
Gladia는 진정한 다국어 제품 개발을 우선시하여, 주로 영어 데이터로 훈련된 대부분의 음성 인식 모델에서 발견되는 편향 문제를 해결합니다. 새로운 엔진은 100개 이상의 언어에서 실시간 트랜스크립션을 제공하며, 억양을 효과적으로 지원하고, 즉시 언어 전환이 가능합니다.
Gladia의 혁신적인 점은 통화에서 감정 분석, 핵심 정보, 요약 등 유용한 인사이트를 1초 이내에 생성할 수 있는 능력입니다. 낮은 지연시간의 실시간 다국어 엔진 구축은 방대한 언어 이해와 데이터 처리 기술이 요구되는 복잡한 작업입니다. 그러나 Gladia의 제품은 이러한 어려움을 해소하며, 언어 및 기술 환경에 관계없이 300밀리초 이하의 업계 최고의 지연시간을 기록하면서 높은 정확도를 유지합니다.
Gladia의 CTO 조너선 소토는 "많은 기업들이 기존 플랫폼에 다양한 AI 기능을 통합하는 데 상당한 시간과 자원을 투자하고 있습니다. 우리의 단일 API는 SIP, VoIP, FreeSwitch, Asterisk 등 모든 기술 스택과 호환되어 클라이언트의 AI 플랫폼에 실시간 트랜스크립션을 쉽게 통합할 수 있습니다."라고 말했습니다.
2023년 6월, 초기 비동기 트랜스크립션 및 오디오 인텔리전스 API를 출시한 이후 Gladia는 주로 회의 녹음 및 메모 작성 솔루션 분야에서 기업 부문에서 큰 성과를 거두고 있습니다. 이 API는 Attention, Circleback, Method Financial, Recall, Sana, VEED.IO 등 600개 이상의 글로벌 고객을 유치했으며, 70,000명 이상의 사용자를 보유하고 있습니다.
케기너는 "Gladia의 기술은 고급 실시간 트랜스크립션을 요구하는 분야의 기업들이 수동적인 후처리에서 적극적이고 낮은 지연시간의 워크플로로 전환할 수 있도록 지원합니다."라고 말하며, "우리의 솔루션은 CRM 자동화와 지원 직원들을 위한 실시간 도움을 제공하여, 광범위한 내부 AI 전문 지식 없이도 운영 효율성을 향상시킵니다."라고 강조했습니다.
이번 자금을 통해 Gladia는 오디오를 위한 포괄적인 AI 툴킷 개발을 가속화할 계획이며, 대형 언어 모델(LLM) 및 검색 보강 생성(RAG)과 같은 추가 모델을 도입할 예정입니다. 현재 Gladia는 CCaaS 부문에서 에이전트 지원 솔루션을 파일럿 운영 중이며, 국제 성장을 대비해 인재 풀을 확대할 계획입니다.
케기너는 Gladia의 독특한 "코드 스위칭" 기능을 강조하며, 사용자가 한 언어로 트랜스크립션을 시작한 후 통화 중에 원활하게 다른 언어로 전환할 수 있는 점을 설명했습니다. 그는 실시간 처리와 사용자 정의 어휘 통합의 중요성을 강조하며, "우리 모델은 경쟁사와 차별화되는 실시간 인사이트를 제공합니다."라고 말했습니다.
시장 기회에 대해 케기너는 Gladia의 회의 기록기 및 콜센터와의 협력에 집중하고 있으며, 이는 정확도를 개선하여 통화 완료 속도를 최대 30% 향상시킵니다. Gladia는 일반적으로 시간 사용량에 기반한 단일 요금 체계를 운영할 예정입니다.
전반적으로 Gladia는 AI 혁신과 실시간 트랜스크립션의 교차점에 위치하여, 다양한 환경에서 기업들이 오디오 인텔리전스를 활용하는 방식을 혁신할 준비가 되어 있습니다.