"클릭하여 이 기사를 듣기" 기능은 시각 장애인 및 독서 어려움을 겪는 개인, 그리고 시간이 부족한 이들에게 매우 귀중합니다. 이 주에, 음성 AI 스타트업 ElevenLabs가 웹 페이지 콘텐츠를 자동으로 읽어주는 혁신적인 오디오 플레이어인 Audio Native를 선보였습니다. 이 기술은 회사의 고급 텍스트-음성 변환 기술을 활용합니다.
추가적으로 ElevenLabs는 웹 페이지와 문서에 대해 11개 음성을 제공하는 ElevenLabs Reader를 출시했습니다. 이 음성 모델은 29개 언어를 지원하며, 전체 영화 더빙 및 프롬프트를 노래 가사로 변환하는 기능도 포함되어 있습니다. Audio Native는 월 $11의 "creator" 요금제로 이용 가능하며, 내장된 메트릭과 청중 참여를 모니터링할 수 있는 대시보드를 포함합니다. ElevenLabs는 X 페이지(구 트위터)에서 블로그, bensbites.com의 SEO 가이드를 비롯한 자사 기술을 활용하는 웹사이트들을 선보였습니다. 또한, 2023년 11월에 발표된 "미국의 모든 국가 안보 위협이 해외에 있는 것은 아니다"라는 제목의 뉴요커 기사도 포함됩니다. The Atlantic와 The New York Times와 같은 주요 미디어도 ElevenLabs 기술을 도입했습니다. ElevenLabs의 Sam Sklar는 블로그 게시글에서 “사용자 맞춤 설정이 가능하고, 간편하게 설정할 수 있으며, 독자 참여를 높여 콘텐츠의 전 세계적 접근성을 향상시킵니다”라고 말했습니다.
웹사이트용 오디오 임베딩
Audio Native를 사용하면 사용자가 웹사이트에 쉽게 오디오를 임베드하거나 기존 프로젝트에서 오디오를 통합할 수 있습니다. 이를 위해 짧은 HTML 코드 스니펫을 제공해야 하며, 도메인을 "허용" 목록에 추가하고, 회사의 옵션에서 음성을 선택한 후, 플레이어의 배경색과 텍스트 색상을 맞춤 설정하여 제공된 코드를 복사하여 붙여넣기 하면 됩니다. 브랜드 고유의 특정 구문을 위한 발음 사전을 선택적으로 사용할 수 있습니다. 기본적으로 모델은 페이지의 모든 텍스트 콘텐츠에 대해 음성을 생성하지만, CSS 선택기를 통해 사용자 맞춤이 가능합니다. 이 도구는 현재 React, Squarespace, WordPress, Ghost, Webflow 및 Framer와 같은 플랫폼을 지원합니다. 초기 리뷰에서는 이 도구가 "대단하다"며 접근성을 강화할 수 있는 큰 잠재력을 강조했습니다.
미래 혁신 예고
소셜 미디어 반응에 따르면, ElevenLabs는 기능 확대에 전념하고 있는 것으로 보입니다. 사용자가 작성한 콘텐츠를 팟캐스트로 공유할 수 있는 RSS 피드 기능 추가를 제안하자, ElevenLabs의 성장 부문 책임자인 Luke Harries는 “멋진 아이디어입니다, 팀과 공유하겠습니다”라고 답변했습니다.
2022년 전 구글 엔지니어인 Piotr Dabkowski와 Palantir 전략가인 Mati Staniszewski에 의해 설립된 ElevenLabs는 빠르게 11억 달러의 가치를 기록하고 있습니다. 이 회사는 1월에 최근 자금 유치 라운드에서 8천만 달러를 확보했습니다. Speechify, Deepgram, Voicemod와 같은 경쟁자들이 있는 시장에서 ElevenLabs는 2032년까지 162억 달러에 이를 것으로 예상되는 글로벌 AI 음성 복제 시장에서 독특한 위치를 차지하고 있습니다. 이 시장은 2023년부터 연평균 28% 성장률(CAGR)을 기록할 전망입니다.
ElevenLabs는 HarperCollins Publishers와 협력하여 AI 생성 오디오북을 제작하고, 사용자들이 복제한 목소리를 수익화할 수 있는 마켓플레이스를 시작했습니다. 그러나 이 회사는 음악 생성 기능과 모델 훈련 시 저작권 자료 사용에 대한 우려와 같은 논란에 직면해 있으며, 이 주제는 최근 점점 더 많은 주목을 받고 있습니다.