Pika Lança Recurso de Sincronização Labial com Inteligência Artificial, Acendendo a Competição na Indústria de Vídeo

A OpenAI continua a cativar o público com seu modelo de geração de vídeo em IA, Sora, apresentando novos exemplos de demonstração impressionantes. No entanto, o acesso ao público ainda é limitado. Enquanto isso, o concorrente Pika introduziu um recurso empolgante para seus assinantes: o Lip Sync.

Esse recurso inovador permite que os usuários adicionem diálogos falados aos seus vídeos utilizando vozes geradas por IA da ElevenLabs, uma startup separada de áudio generativo. Além disso, ele sincroniza os movimentos labiais com o diálogo, aumentando o realismo dos personagens.

A funcionalidade Lip Sync do Pika oferece conversão de texto para áudio e a opção de fazer o upload de faixas de áudio. Os usuários podem digitar ou gravar diálogos para seus personagens gerados pela IA do Pika, permitindo a personalização dos estilos de voz. Atualmente, o Lip Sync está em "acesso antecipado", disponível exclusivamente para usuários Pro do Pika ($58 mensais, cobrados anualmente a $696) e membros do programa "Super Collaborators", por convite apenas, via Discord.

Quebrando Barreiras para IA no Cinema

Embora os vídeos gerados pela IA do Pika ainda não alcancem o mesmo realismo que os de Sora da OpenAI ou os da concorrente Runway, o recurso Lip Sync representa um avanço significativo. Ele oferece uma solução para um dos desafios restantes na utilização de IA para longas-metragens, uma vez que a maioria dos principais geradores de vídeo em IA carecem de um recurso nativo similar.

Tradicionalmente, os usuários têm dependido de ferramentas de terceiros complicadas e métodos de pós-produção trabalhosos para adicionar diálogos e sincronizar movimentos labiais, resultando em uma aparência de baixo orçamento.

Em notícias relacionadas, a Runway atualizou sua ferramenta Multi Motion Brush, lançada no mês passado. Essa ferramenta permite que os usuários apliquem até cinco direções de movimento independentes a diferentes objetos em vídeos, como um cachorro pulando para pegar um frisbee. A atualização inclui a detecção de regiões, facilitando a seleção automática de objetos para aplicação de movimento, enquanto opções de "pintura" manual continuam disponíveis. O Pika também permite que os usuários editem componentes de vídeo e ampliem a tela, embora atualmente falte uma ferramenta de pincel, resultando em controles de movimento menos precisos em comparação à Runway.

Preocupações Contínuas Sobre os Dados de Treinamento da IA

Apesar da empolgação em torno do novo recurso do Pika, questões persistem sobre os dados de treinamento utilizados para seu modelo de vídeo. Ed Newton-Rex, CEO da Fairly Trained, uma organização sem fins lucrativos de certificação em IA, levantou essas preocupações nas redes sociais, enfatizando a necessidade de consentimento dos criadores e proprietários de dados durante o treinamento da IA.

À medida que as empresas geradoras de vídeo em IA continuam a inovar e aprimorar suas ofertas, a competição se intensifica, beneficiando os usuários, mas preocupando alguns profissionais da indústria cinematográfica. Notavelmente, o cineasta Tyler Perry enfrentou críticas por interromper uma expansão de estúdio de $800 milhões após ver vídeos gerados pelo Sora, expressando preocupações sobre potenciais perdas de emprego devido a essa tecnologia.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles