Stable Diffusion présente de nouvelles fonctionnalités captivantes pour la génération de vidéos.

Stability AI, le développeur derrière le célèbre système de génération d'images à partir de texte Stable Diffusion, a lancé son premier modèle innovant de génération vidéo, appelé Stable Video Diffusion. Ce modèle d'IA générative de pointe transforme les prompts textuels en vidéos dynamiques. Les utilisateurs peuvent simplement saisir des phrases comme "une fusée décollant dans le désert" ou "des vagues s'écrasant contre le rivage", et voir Stable Video Diffusion donner vie à ces descriptions.

En plus des prompts textuels, ce modèle peut également créer des vidéos à partir d'images fixes. L'équipe de recherche a conçu Stable Video Diffusion spécifiquement pour la synthèse image-à-vidéo en haute résolution. Une de ses caractéristiques clés est la synthèse multi-vues, permettant aux animateurs de générer plusieurs angles de caméra à partir d'un seul objet. Cette fonctionnalité est précieuse pour les développeurs créant des environnements 3D immersifs pour les applications de réalité virtuelle (VR) et de réalité augmentée (AR).

Comment Accéder à Stable Video Diffusion

Actuellement, Stable Video Diffusion est disponible uniquement à des fins de recherche. Les développeurs ont précisé que le modèle "n'est pas destiné aux applications réelles ou commerciales à ce stade." Ils se concentrent plutôt sur la collecte de retours concernant la sécurité et les performances afin de peaufiner le modèle pour une utilisation future.

Les chercheurs intéressés par Stable Video Diffusion peuvent trouver le code source sur GitHub, tandis que les poids nécessaires à l'exécution locale du modèle sont hébergés sur Hugging Face. Le modèle propose deux options distinctes de génération image-à-vidéo capables de créer 14 et 25 images par seconde, avec des taux de rafraîchissement personnalisables allant de trois à 30 images par seconde.

Des études préliminaires comparant les préférences des utilisateurs indiquent que Stable Video Diffusion a reçu des avis favorables par rapport aux modèles concurrents de Pika Labs et Runway, soulignant son potentiel dans le domaine concurrentiel de la génération vidéo.

Les utilisateurs peuvent également s'inscrire sur une liste d'attente pour accéder à une future interface web qui présentera les applications pratiques de Stable Video Diffusion dans des secteurs tels que l'éducation, le marketing et le divertissement. Pour exprimer leur intérêt pour cette expérience innovante, les utilisateurs doivent sélectionner 'Stable Video – Waitlist' dans le menu déroulant du formulaire de contact.

Stability AI continue de repousser les limites de la technologie générative, ouvrant la voie à de nouvelles possibilités en matière de génération vidéo et de création de contenus créatifs. À mesure que le modèle évolue, son potentiel prometteur se dessine dans divers domaines utilisant la narration visuelle riche.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles