Startup de Voz AI ElevenLabs Ganha US$ 80 Milhões em Financiamento e Lança Novo Mercado de Vozes Clonadas

Em apenas dois anos desde sua fundação por ex-funcionários do Google e Palantir, a ElevenLabs, uma startup de voz com IA, alcançou o status de unicórnio. A empresa anunciou recentemente uma rodada de financiamento da Série B de $80 milhões, aumentando sua avaliação dez vezes, para $1,1 bilhão.

Esse investimento é liderado por apoiadores já existentes, como Andreessen Horowitz (a16z), o ex-CEO do GitHub, Nat Friedman, e o ex-líder de IA da Apple, Daniel Gross, além de contribuições da Sequoia Capital e SV Angel. Esta rodada segue uma rodada de $19 milhões da Série A, ocorrida seis meses antes, que avaliou a ElevenLabs em aproximadamente $100 milhões.

Pioneirismo em Tecnologia de Voz com IA

A ElevenLabs se especializa em utilizar aprendizado de máquina para clonagem e síntese de voz em vários idiomas. O capital adquirido será usado para aprimorar suas pesquisas e ofertas de produtos. A empresa também lançou várias novas funcionalidades, incluindo uma ferramenta de dublagem para filmes longos e um marketplace onde os usuários podem vender suas vozes clonadas.

Tornando o Conteúdo Universalmente Acessível

Com a variação de dialetos e idiomas, a produção de conteúdo localizado sempre se concentrou nas línguas mais faladas, frequentemente dependendo de dublagens manuais que não preservam a fidelidade ao conteúdo original. Os fundadores Piotr Dabkowski e Mati Staniszewski, ambos da Polônia, testemunharam as dificuldades de dublagens ruins, o que os motivou a criar a ElevenLabs. A missão deles é democratizar o acesso ao conteúdo por meio da IA.

Desde seu lançamento em 2022, a ElevenLabs alcançou marcos significativos. Inicialmente reconhecida por seu modelo de texto para fala em inglês com som natural, a empresa expandiu suas capacidades com as versões multilíngues Eleven 1 e 2, agora suportando diversos idiomas, incluindo polonês, alemão, espanhol, francês, italiano, português e hindi. O recurso Voice Lab permite que os usuários clone suas vozes ou gerem vozes sintéticas, transformando texto em conteúdo de áudio.

“A tecnologia da ElevenLabs utiliza consciência de contexto e alta compressão para entregar fala ultra-realista. Nosso modelo proprietário entende relações de palavras e ajusta a entrega com base no contexto, prevendo dinamicamente milhares de características vocais,” explicou Staniszewski.

Uma Base de Usuários em Crescimento

Em poucos meses, a ElevenLabs atraiu mais de um milhão de usuários. O lançamento do AI Dubbing, uma ferramenta de conversão de fala para fala, permite que criadores de conteúdo traduzam áudio e vídeo para 29 idiomas, mantendo a voz e as emoções do orador original. Notavelmente, 41% das empresas da Fortune 500 estão entre seus clientes, incluindo editores de destaque como Storytel, The Washington Post e TheSoul Publishing.

“Atualmente, estabelecemos mais de 100 parcerias B2B. As vozes com IA têm aplicações extensas, desde a melhoria da experiência do público até a ampliação do acesso educacional,” observou Staniszewski.

Introduzindo o Estúdio de Dublagem

Para inovar ainda mais sua gama de produtos, a ElevenLabs está lançando o fluxo de trabalho do Dubbing Studio, que aprimora a ferramenta AI Dubbing. Este novo fluxo oferece aos profissionais ferramentas robustas para dublar filmes longos em vários idiomas, além de gerar e editar transcrições, traduções e códigos de tempo. No entanto, atualmente não inclui sincronia labial, o que significa que os movimentos labiais no vídeo original permanecem inalterados.

Novos Marketplaces e Recursos de Acessibilidade

Além disso, a ElevenLabs está introduzindo um aplicativo de acessibilidade que transforma texto ou URLs em áudio e uma Biblioteca de Voz que permite aos usuários monetizar suas vozes clonadas por IA. Os usuários podem definir termos de disponibilidade e compensação, embora o compartilhamento exija um processo de verificação em várias etapas para garantir autenticidade.

“A verificação de voz envolve um processo de captcha para confirmar que a voz corresponde às amostras de treinamento, apoiado pela nossa equipe de moderação,” destacou o CEO.

À medida que esses recursos se tornem disponíveis nas próximas semanas, a ElevenLabs pretende atrair usuários de vários setores. Com este financiamento, que totaliza $101 milhões, a empresa planeja fortalecer sua pesquisa em tecnologia de voz com IA, aprimorar a infraestrutura e desenvolver produtos direcionados, tudo isso implementando controles de segurança robustos, incluindo um classificador de áudio de IA.

“Nos próximos anos, nosso objetivo é nos estabelecer como líderes globais em pesquisa e implementação de produtos de voz com IA,” afirmou Staniszewski.

Os concorrentes no espaço de geração de voz com IA incluem MURF.AI, Play.ht e WellSaid Labs. De acordo com a Market US, o mercado global para essas ferramentas foi avaliado em $1,2 bilhões em 2022 e deve se aproximar de $5 bilhões até 2032, refletindo uma taxa de crescimento anual composta (CAGR) de aproximadamente 15,4%.

Most people like

Find AI tools in YBX