Google dévoile son modèle Genie de 11 milliards de paramètres : Transformer des images en mondes virtuels jouables.

L'équipe de Google DeepMind a récemment lancé Genie, un modèle fondamental doté de 11 milliards de paramètres, capable de transformer une seule image en un monde virtuel interactif. Cette technologie révolutionnaire suscite un intérêt considérable, marquant un tournant décisif alors que l'intelligence artificielle pénètre le domaine des jeux vidéo.

Contrairement aux modèles précédents, Google Genie apprend à partir de 200 000 heures de vidéos non étiquetées sur internet sans nécessiter d'entraînement supervisé, ce qui lui permet de générer des scènes variées et riches. Il est également capable d'identifier les personnages principaux d'une scène sans étiquettes d'action, facilitant ainsi l'interaction utilisateur et démontrant son immense potentiel pour la création d'environnements virtuels.

Les capacités de Genie reposent sur trois composants essentiels : le modèle d'action latent, le tokeniseur vidéo et le modèle dynamique autoregressif. Ces éléments fonctionnent ensemble pour développer un espace d'action latent qui enrichit l'interaction utilisateur tout en permettant aux agents d'imiter des comportements invisibles issus des vidéos.

De plus, Genie permet de manière innovante l'intégration de croquis conçus par des humains ou d'images réelles. Grâce à des modèles avancés de génération de texte en image, Genie peut transformer une image initiale en un univers virtuel interactif, élargissant considérablement son champ d'application.

Tim Rocktäschel, responsable de l'équipe Genie, souligne que Genie représente une étape cruciale dans le développement de l'intelligence générale artificielle (AGI), prête à redéfinir le paysage des environnements génératifs interactifs et à préparer le terrain pour les avancées futures de l'IA.

En résumé, Google DeepMind a introduit le modèle Genie, annonçant un changement révolutionnaire dans l'industrie du jeu vidéo. Sa capacité à générer des mondes virtuels jouables à partir d'une seule image préfigure une intégration généralisée de l'IA dans le secteur du jeu.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles