Google Presenta Veo: Un Impresionante Nuevo Modelo de Video Generativo de IA para Competir con Sora de OpenAI

Home Noticias de IA Google Presenta Veo: Un Impresionante Nuevo Modelo de Video Generativo de IA para Competir con Sora de OpenAI

Desde que OpenAI presentó su modelo de creación de video generativo Sora a principios de este año, pocos competidores han igualado su realismo y calidad—hasta ahora.

Durante su conferencia anual para desarrolladores I/O, Google anunció Veo, un nuevo modelo de video generativo desarrollado por su renombrada división DeepMind. Google describe a Veo como capaz de generar “clips en alta calidad, 1080p y de más de 60 segundos.” Según una publicación en la cuenta X de DeepMind, el modelo maneja una variedad de estilos cinematográficos, desde el fotorealismo y el surrealismo hasta la animación.

En su página de producto, Google afirma que Veo tiene como objetivo “hacer que la producción de video sea accesible para todos,” ya sean cineastas experimentados, creadores en busca de inspiración o educadores. Veo admite transformaciones de texto a video, de video a video y de imagen a video.

En colaboración con el polifacético artista Donald Glover, conocido como Childish Gambino, Google probó las nuevas características de Veo a través de su estudio creativo, Gilga.

Para demostrar las impresionantes capacidades de Veo, DeepMind mostró varios videos generados en sus cuentas de YouTube y X, con escenas como una ciudad de neón, medusas realistas, vaqueros montando caballos, naves espaciales explorando el cosmos y la interacción humana. Los resultados imitan de cerca las acciones en vivo y animaciones hábilmente elaboradas, todo a partir de simples indicaciones de texto.

En una publicación del blog del vicepresidente de Google, Eli Collins, y el director de investigación senior, Douglas Eck, se destaca que Veo ofrece un “nivel de control creativo sin precedentes,” con una sólida comprensión de términos cinematográficos como “time-lapse” y “tomadas aéreas.”

Además, Veo facilita ediciones rápidas y de alta calidad tanto en videos generados por IA como en aquellos subidos por los usuarios, incluyendo metraje pregrabado. Por ejemplo, los usuarios pueden ingresar un comando de edición, como añadir kayaks a una toma costera aérea, y Veo puede implementarlo sin esfuerzo en el video original.

Veo también se destaca por mantener la coherencia entre los fotogramas del video, abordando algunas inconsistencias típicamente encontradas en otros modelos, incluido Sora. Esto se logra mediante transformadores avanzados de difusión latente, asegurando que los personajes y objetos se mantengan cohesivos y realistas.

Para mejorar su rendimiento, Google perfeccionó las descripciones de los datos de entrenamiento y utilizó representaciones de video comprimidas de alta calidad. Esta optimización eleva la calidad general del video y reduce el tiempo de generación.

Todos los videos generados por Veo están etiquetados con SynthID, la marca de agua de acreditación de contenido de Google, que confirma su estado de generados por IA.

Veo representa años de investigación de DeepMind, construyendo sobre innovaciones anteriores como Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet y Lumiere.

Actualmente, Veo no está disponible públicamente. Siguiendo el modelo de OpenAI con Sora, está accesible para creadores selectos a través de una vista previa privada en VideoFX. Google planea, eventualmente, integrar algunas de las características de Veo en YouTube Shorts y otros productos.

Cómo la descarga de atención reduce los costos de inferencia de LLM a gran escala

Google presenta Imagen 3: El modelo definitivo de texto a imagen, ahora en vista previa privada.

Most people like

Nooks

62.2K

En el acelerado entorno empresarial actual, maximizar la productividad de ventas es esencial para el éxito. Una plataforma de productividad de ventas impulsada por inteligencia artificial aprovecha la tecnología avanzada para optimizar los procesos de ventas, mejorar el rendimiento del equipo y fomentar el crecimiento de ingresos. Al automatizar tareas repetitivas, ofrecer valiosos insights y facilitar un mejor compromiso con los clientes, esta solución innovadora permite a los equipos de ventas concentrarse en lo que mejor saben hacer: cerrar negocios. Acompáñanos a explorar cómo integrar la IA en tu estrategia de ventas puede transformar tu enfoque hacia la productividad y aportar resultados medibles.

Marcador paralelo impulsado por IA Sales Assistant

Chainlit

60.9K

En el vertiginoso panorama digital actual, la inteligencia artificial conversacional está a la vanguardia de la innovación tecnológica. Esta rama de la inteligencia artificial se centra en crear sistemas capaces de mantener diálogos similares a los humanos, mejorando la experiencia del usuario en diversas plataformas. Desde chatbots hasta asistentes virtuales, el desarrollo y análisis de la IA conversacional desempeñan un papel crucial en la transformación de nuestra interacción con la tecnología. Acompáñanos mientras exploramos los últimos avances y conocimientos en este emocionante campo, descubriendo el potencial que la IA conversacional tiene para negocios y usuarios por igual.

IA conversacional AI Analytics Assistant

Stem Distribution

8.6K

Presentamos una plataforma de primer nivel para la obtención de licencias de sincronización musical, muestreo, remasterización, remezcla y reinterpretación innovadora. Explora infinitas posibilidades creativas y eleva tus proyectos musicales con nuestras herramientas integrales diseñadas para artistas, productores y creadores de contenido.

licencia de sincronización AI Audio Enhancer

Prankify AI

154.3K

Descubre la plataforma de bromas telefónicas impulsada por inteligencia artificial, diseñada para risas inolvidables y experiencias entretenidas.

Llamadas de broma con IA AI Celebrity Voice Generator

Find AI tools in YBX