Recentemente, o avançado modelo de IA do Google, Gemini 1.5, realizou uma avaliação detalhada da nova ferramenta de geração de vídeo da OpenAI, Sora. Embora Sora produza vídeos visualmente impressionantes, o Gemini 1.5 destacou várias inconsistências lógicas.
Por exemplo, um vídeo que retrata uma cena de rua no Japão criada por Sora apresenta uma combinação surreal de intensa queda de neve e flores de cerejeira em flor. Na realidade, as flores de cerejeira desabrocham em clima quente de primavera, tornando essa situação impossível. Além disso, a neve parece artificialmente uniforme, distante dos padrões naturais de queda de neve. Para tornar a falta de realismo ainda mais evidente, os personagens do vídeo estão vestidos com roupas de verão, apesar das condições invernais.
Os analistas do Gemini 1.5 comentaram: "Embora os vídeos da Sora sejam visualmente atraentes, as inconsistências óbvias indicam que essas cenas não derivam da realidade." Essa avaliação destaca os desafios atuais enfrentados pela tecnologia de geração de IA em termos de autenticidade e coerência lógica.
Além disso, o modelo Gemini 1.5 demonstra um poder de processamento excepcional, com uma janela de contexto de um milhão de tokens, superando amplamente seus concorrentes. Essa capacidade permite que ele processe enormes quantidades de informação simultaneamente, incluindo vídeos de até uma hora de duração e mais de 30.000 linhas de código.
À medida que a tecnologia de IA continua a evoluir, aguardamos ansiosamente a geração de vídeos mais realistas e vibrantes no futuro.