Google Dévoile de Nouveaux Modèles d'Création de Contenu par IA : Insights sur Veo et Imagen 3

Lors de la conférence Google I/O de cette année, Google a dévoilé ses derniers moteurs de création de médias basés sur l'IA : Veo et Imagen 3. Veo est capable de produire des vidéos de haute qualité en 1080p, tandis qu'Imagen 3 représente le cadre le plus récent pour générer des images à partir de texte. Bien que ces produits ne révolutionnent peut-être pas l'industrie, ils aident Google à conserver un avantage concurrentiel face au modèle vidéo Sora d'OpenAI et à DALL-E 3.

Google affirme que Veo possède une "compréhension approfondie du langage naturel et des sémantiques visuelles", lui permettant de générer des vidéos de plus d'une minute à partir de descriptions fournies par les utilisateurs. Veo intègre également des concepts liés à la réalisation cinématographique et aux technologies visuelles, tels que la photographie en timelapse, qui sont devenus des fonctionnalités essentielles pour les modèles de génération de vidéos IA.

Pour démontrer les capacités de Veo, Google a collaboré avec Donald Glover et son studio créatif, Gilga, pour produire une vidéo promotionnelle illustrant des scènes d'un road trip en décapotable et de navigation, toutes générées à partir de descriptions textuelles. Selon Google, Veo surpasse les modèles précédents en matière de simulation de phénomènes physiques réels et de rendu de visuels en haute définition. Glover a déclaré dans la vidéo : "Tout le monde devrait être réalisateur ; raconter les histoires des autres enrichira notre compréhension."

Bien qu'il reste incertain si les audiences adopteront les vidéos générées par l'IA, principalement par curiosité pour la façon dont les machines recréent l'art humain, cela n'a pas découragé Google et OpenAI de promouvoir leurs outils. Veo est désormais accessible dans l'outil VideoFX de Google pour certains créateurs et prévoit d'être lancé sur des plateformes comme YouTube Shorts. Une fois intégré à YouTube Shorts, cela pourrait renforcer considérablement la position concurrentielle de Google face à TikTok.

Concernant Imagen 3, Google affirme qu'il s'agit du modèle "de la plus haute qualité" pour générer des images à partir de texte, créant des images "réalistes et vivantes" tout en minimisant les artefacts. Son véritable défi réside dans la comparaison avec DALL-E 3, Google affirmant qu'Imagen 3 est plus performant dans la gestion de textes et de longues instructions.

De plus, Google a collaboré avec des artistes musicaux comme Wyclef Jean et Bjorn pour tester son outil de création musicale basé sur l'IA, conçu pour aider à la création de chansons et de beats. Bien que le contenu présenté jusqu'à présent ait été bref, il a montré des exemples intéressants.

Des levers de soleil au vieillissement humain, l'IA devient de plus en plus intelligente. Les derniers outils de création de médias de Google s'orientent dans cette direction. Avec des milliards investis dans l'IA, Google vise à mener la prochaine avancée dans la technologie informatique. Le potentiel futur de ces technologies pour améliorer la vie ou créer de l'art inspiré reste un sujet important à suivre.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles