창립 2년 만에, Google과 Palantir 출신의 직원들이 설립한 AI 음성 스타트업 ElevenLabs는 유니콘 지위를 달성했습니다. 최근 이 회사는 8천만 달러 규모의 시리즈 B 펀딩 라운드를 발표하며 가치를 10배로 증가시켜 11억 달러에 도달했습니다.
이번 투자는 기존 투자자인 Andreessen Horowitz (a16z), 전 GitHub CEO Nat Friedman, 전 Apple AI 리더 Daniel Gross와 Sequoia Capital, SV Angel의 도움으로 이루어졌습니다. 이 라운드는 6개월 전 1,900만 달러 규모의 시리즈 A 라운드에 이어 진행되어, ElevenLabs의 가치는 약 1억 달러로 평가되었습니다.
AI 음성 기술 혁신
ElevenLabs는 다국어 음성 클로닝 및 합성을 위한 기계 학습 전문 회사입니다. 새로 확보한 자본은 연구 및 제품 개발을 강화하는 데 사용될 것입니다. 이 회사는 영화 더빙 도구와 사용자들이 클론된 목소리를 판매할 수 있는 마켓플레이스 등 여러 가지 새로운 기능을 도입했습니다.
콘텐츠의 보편적 접근성 향상
방언과 언어의 다양성으로 인해, 지역화된 콘텐츠 제작은 전통적으로 주류 언어에 집중되어 있으며, 수동 더빙의 경우 원본 콘텐츠에 대한 충실도가 떨어집니다. 폴란드 출신의 창립자 Piotr Dabkowski와 Mati Staniszewski는 불량 더빙의 문제를 목격하고 ElevenLabs를 만들게 되었습니다. 그들의 목표는 AI를 활용하여 콘텐츠에 대한 접근성을 민주화하는 것입니다.
2022년 출시 이후, ElevenLabs는 주요 이정표를 달성했습니다. 처음에는 영어로 자연스러운 AI 텍스트-음성 모델로 인정받았고, 이제는 다국어 지원을 위한 Eleven Multilingual 버전 1과 2를 출시하여 폴란드어, 독일어, 스페인어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어를 지원합니다. Voice Lab 기능을 통해 사용자들은 자신의 목소리를 클론하거나 합성 음성을 생성하여 텍스트를 오디오 콘텐츠로 변환할 수 있습니다.
“ElevenLabs의 기술은 상황 인식과 고압축을 활용하여 초현실적인 음성을 제공합니다. 우리의 독점 모델은 단어 간의 관계를 이해하고 맥락에 따라 전달 방식을 조정하여 수천 가지 음성 특성을 동적으로 예측합니다.”라고 Staniszewski는 설명했습니다.
사용자 기반의 확대
불과 몇 개월 만에, ElevenLabs는 100만 이상의 사용자를 유치했습니다. 음성을 음성으로 변환하는 AI 더빙 도구의 출시로 콘텐츠 제작자들은 원본 화자의 목소리와 감정을 유지하면서 오디오와 비디오를 29개 언어로 번역할 수 있게 되었습니다. 특히 Fortune 500 기업 중 41%가 사용 고객으로, Storytel, The Washington Post, TheSoul Publishing과 같은 저명한 출판사를 포함하고 있습니다.
“현재 우리는 100개 이상의 B2B 파트너십을 체결했습니다. AI 음성은 관객 경험 향상부터 교육 접근 확대까지 광범위한 응용이 가능합니다.”라고 Staniszewski는 언급했습니다.
더빙 스튜디오 소개
제품 라인업을 더욱 발전시키기 위해 ElevenLabs는 AI 더빙 도구를 향상시킨 더빙 스튜디오 워크플로우를 출시합니다. 이 새로운 워크플로우는 전문가들이 다양한 언어로 전체 영화를 더빙하고, 전사본, 번역, 타임코드를 생성 및 편집할 수 있는 강력한 도구를 제공합니다. 그러나 현재로서는 립싱크 기능이 포함되어 있지 않아 원본 비디오의 입모양은 변하지 않습니다.
새로운 마켓플레이스 및 접근성 기능
또한, ElevenLabs는 텍스트나 URL을 오디오로 변환하는 접근성 앱과 사용자가 AI 클론 음성으로 수익을 창출할 수 있는 Voice Library를 도입합니다. 사용자들은 사용 가능 여부 및 보상을 설정할 수 있으며, 공유에는 인증을 보장하기 위한 다단계 검증 과정이 필요합니다.
“음성 검증 과정은 음성이 훈련 샘플과 일치하는지 확인하는 캡챠 프로세스를 포함하며, 이는 우리의 모더레이션 팀이 지원합니다.”라며 CEO는 말했습니다.
이런 기능들이 앞으로 몇 주 안에 제공될 예정인 ElevenLabs는 다양한 분야의 사용자를 유치할 계획입니다. 이번 펀딩을 통해 총액 1억 1백만 달러로 증가한 이 회사는 AI 음성 기술에 대한 연구를 강화하고, 인프라를 개선하며, 목표로 하는 제품을 개발할 계획이며, AI 오디오 분류기와 같은 강력한 안전 관리를 구현할 것입니다.
“앞으로 몇 년 안에 우리는 음성 AI 연구 및 제품 배포의 글로벌 리더로 자리 매김할 것입니다.”라고 Staniszewski는 말했습니다.
AI 음성 생성 시장의 경쟁자로는 MURF.AI, Play.ht, WellSaid Labs가 있습니다. Market US에 따르면, 이러한 도구의 글로벌 시장은 2022년 12억 달러로 평가되었고, 2032년까지 약 50억 달러에 이를 것으로 예상되며, 이는 연평균 성장률(CAGR) 약 15.4%에 해당합니다.