A OpenAI continua a divulgar clipes de Sora, seu avançado modelo de vídeo gerado por IA fotorealista, que permanece estritamente interno por enquanto. No dinâmico cenário da IA de vídeo, concorrentes como a Pika estão aproveitando este momento.
Recentemente, a Pika lançou um novo recurso que permite aos usuários gerar automaticamente efeitos sonoros para seus vídeos gerados por IA na plataforma pika.art. Essa melhoria adiciona uma dimensão crucial aos vídeos de IA, que muitas vezes carecem de áudio e anteriormente exigiam que os usuários buscassem arquivos sonoros por meio de diferentes softwares de edição. Agora, os usuários da Pika podem gerar arquivos de som diretamente no aplicativo, agilizando o processo criativo.
Essa atualização segue o lançamento das capacidades de sincronização labial da Pika, que aprimoram ainda mais o conteúdo gerado por IA para criadores individuais e empresas. Com recursos como sincronização labial, efeitos sonoros, narrações e visuais integrados, a Pika se posiciona como uma plataforma completa de criação de vídeos gerados por IA. Isso permite que os usuários criem projetos inteiros sem a necessidade de cinegrafistas ou designers de som separados.
As significativas capacidades oferecidas pela Pika podem atrair cineastas, permitindo eliminar a necessidade de buscar diferentes ativos. Em vez de pesquisar em bancos de imagens, os usuários podem simplesmente descrever sua visão e gerar rapidamente todos os elementos necessários a partir de sua imaginação.
Atualmente, o novo recurso de efeitos sonoros da Pika está disponível apenas para membros do programa super-colaboradores ou para usuários com uma assinatura Pro de $58/mês. No entanto, planos estão em andamento para expandir a disponibilidade além dos testes beta.
Como os Vídeos de IA da Pika Incorporarão Efeitos Sonoros?
A Pika confirmou que os usuários podem obter efeitos sonoros de duas maneiras principais:
1. Geração Contextual: Os modelos de IA selecionarão automaticamente o áudio que melhor complementa o vídeo gerado com base no prompt de texto. Os usuários ativam o alternador de “efeitos sonoros” ao inserir seu prompt, e o modelo da Pika entrega uma saída audiovisual completa em segundos.
2. Abordagem de Follow-Up: Os usuários podem adicionar sons gerados por IA após a criação. Após gerar ou fazer upload de um clipe sem áudio, eles podem clicar em ‘Editar’ e selecionar ‘Efeitos Sonoros’ para descrever os sons desejados. O modelo gerará então várias opções para escolha dos usuários.
A introdução de áudio gerado deve aprimorar significativamente o processo criativo, abordando as ineficiências anteriores de busca por áudio externo. A Pika afirma ser a primeira plataforma de vídeo de IA a integrar áudio gerado como parte da saída de vídeo.
Outras empresas também estão explorando a geração de som, com a ElevenLabs recentemente anunciando inscrições antecipadas para um recurso de IA de texto para som, enquanto a Meta oferece uma tecnologia similar chamada AudioGen. No entanto, nenhuma delas oferece um modelo de vídeo gerativo integrado como a Pika.
Lançamento Gradual Esperado
O novo recurso de efeitos sonoros será lançado gradualmente, começando com os participantes do programa de super-colaboradores e assinantes Pro da Pika. O feedback desses primeiros usuários ajudará a refinar a funcionalidade, permitindo futuras melhorias acessíveis a todos os usuários da plataforma.
Desde seu lançamento em dezembro de 2023, a Pika tem fortalecido suas ofertas de forma agressiva para competir com jogadores como Sora, da OpenAI. Colaborações recentes, como a funcionalidade de sincronização labial desenvolvida com a ElevenLabs, permitem que os usuários adicionem vozes de IA e animações sincronizadas aos seus vídeos. Os efeitos sonoros adicionais enriquecerão ainda mais essas experiências imersivas.
À medida que a Pika evolui, ela planeja introduzir mais recursos, tendo levantado $55 milhões em financiamento, com uma avaliação de quase $200 milhões. A empresa está se posicionando para desafiar não apenas a OpenAI, mas também outros grandes players no espaço da IA criativa, incluindo Adobe, Runway, Stability AI e a recém-lançada Haiper.