À medida que o conteúdo gerado por IA se torna cada vez mais comum, as startups do setor estão aprimorando suas ofertas. Recentemente, a RunwayML lançou um modelo mais realista para a geração de vídeos. Agora, a Haiper, com sede em Londres e fundada por ex-pesquisadores do Google DeepMind, Yishu Miao e Ziyu Wang, apresenta seu modelo de base visual: o Haiper 1.5.
Disponível nas plataformas web e mobile da Haiper, o Haiper 1.5 é uma atualização incremental que permite aos usuários criar clipes de 8 segundos a partir de textos, imagens e vídeos, dobrando o comprimento da saída do modelo original. Além disso, a Haiper introduziu uma função de upscale que melhora a qualidade do conteúdo e planeja adicionar capacidades de geração de imagens.
Apenas quatro meses após emergir do modo secreto, a Haiper já atraiu mais de 1,5 milhão de usuários, apesar de ter menos financiamento do que seus concorrentes. Com este novo modelo, a empresa pretende expandir sua base de usuários e competir com players estabelecidos como a Runway.
Miao, CEO da Haiper, afirmou: “A corrida na IA generativa de vídeo não se trata apenas do poder do modelo, mas também da complexidade do que esses modelos podem recriar. Nosso processamento de dados distribuído e treinamento escalado nos permitem aprimorar continuamente nosso modelo de base. Esta atualização simboliza nosso compromisso em produzir não apenas vídeos bonitos, mas também imagens realistas.”
O que a Haiper AI oferece aos usuários?
Lançada em março, a Haiper se posiciona ao lado da Runway e Pika, oferecendo uma plataforma simplificada para a geração de vídeos. Os usuários inserem um texto, e o modelo gera conteúdo correspondente, permitindo ajustes em personagens, objetos, fundos e estilos artísticos.
Anteriormente, a Haiper gerava clipes de 2 a 4 segundos; o novo modelo aumenta esse tempo para 8 segundos em resposta ao feedback dos usuários. Os usuários também podem estender clipes existentes de 2 e 4 segundos para 8 segundos, refletindo funcionalidades de outras ferramentas de IA como a Dream Machine da Luma.
Miao comentou: “A resposta entusiástica aos nossos modelos nos motivou a estender a geração de vídeos para oito segundos, ultrapassando os limites dessa tecnologia.”
Novos recursos e melhorias
A atualização mais recente também permite que os usuários gerem clipes de qualquer comprimento em definição padrão ou alta definição. O upscaler integrado melhora a qualidade do vídeo para 1080p com um único clique, sendo compatível com conteúdo novo e já existente.
Além disso, a Haiper adicionará um novo modelo de imagem, permitindo que os usuários criem imagens a partir de textos e as integrem ao processo de geração de vídeo para resultados mais consistentes. Isso possibilitará uma melhor testagem e refinamento do conteúdo antes da animação.
“Na Haiper, priorizamos o feedback dos usuários e a inovação. O lançamento do nosso upscaler e as próximas ferramentas Text2Image ilustram nosso compromisso com a comunidade,” destacou Miao.
Avançando em direção à AGI
Enquanto as atualizações da Haiper parecem promissoras, elas estão pendentes de testes mais amplos na comunidade. Alguns recursos, como vídeos de oito segundos e o upscaler, são atualmente exclusivos para usuários do plano Pro, que custa $24/mês quando faturado anualmente. Miao indicou planos de ampliar o acesso a esses recursos, incluindo um sistema de créditos para geração de vídeos mais longos e um lançamento gratuito do modelo de imagem em breve.
O feedback inicial de qualidade sugere que, embora os vídeos de dois segundos sejam confiáveis, vídeos mais longos ainda apresentam inconsistências. No entanto, com as atualizações em andamento, a Haiper visa melhorar significativamente a qualidade de suas produções. O objetivo é aprimorar a compreensão do mundo pelos modelos, avançando em direção à inteligência artificial geral (AGI) capaz de gerar conteúdo realista ao retratar com precisão luz, movimento, textura e interações de objetos.
Miao concluiu: “Cada quadro carrega informações visuais complexas. Para criar conteúdo que reflita verdadeiramente a realidade, a IA deve entender as complexidades do mundo físico. Esses avanços têm o potencial de revolucionar não apenas a criação de conteúdo, mas também setores como robótica e transporte.”
À medida que a Haiper continua a evoluir, será interessante observar como ela competirá com rivais estabelecidos como Runway, Pika e OpenAI no campo em rápida evolução da geração de vídeo por IA.