Il n'y a pas longtemps, la génération d'images 3D était une tâche complexe et chronophage, nécessitant des maquettes détaillées, des logiciels spécialisés et un matériel puissant. Aujourd'hui, la situation a radicalement changé.
Stability AI a lancé une technologie révolutionnaire d'IA générative appelée Stable Fast 3D, permettant la création rapide d'images 3D à partir d'une seule photo en seulement une demi-seconde. Cela représente une avancée considérable en matière de temps de traitement, offrant des résultats 1200 fois plus rapides que les modèles précédents, comme Stable Video 3D (SV3D), qui pouvaient nécessiter jusqu'à 10 minutes pour des rendus similaires.
Les implications de Stable Fast 3D sont vastes, avec des applications potentielles dans le design, l'architecture, le commerce, la réalité virtuelle et le développement de jeux. Ce modèle est accessible via le chatbot Stable Assistant de Stability AI, l'API Stability AI, ainsi qu'à travers une licence communautaire sur Hugging Face.
La technologie derrière Stable Fast 3D
Stable Fast 3D évolue des travaux antérieurs de Stability AI avec le modèle TripoSR. En mars, l'entreprise s'est associée à Trip AI pour développer une technologie de génération rapide d'actifs 3D.
Dans leur article de recherche, les chercheurs de Stability AI décrivent les méthodes innovantes utilisées pour reconstruire rapidement des maillages 3D de haute qualité à partir d'images uniques. En combinant plusieurs techniques novatrices, ils abordent les défis courants de la reconstruction 3D rapide tout en améliorant la vitesse et la qualité des résultats.
Au cœur de Stable Fast 3D se trouve un réseau de transformateurs avancé qui génère des triplans haute résolution—des représentations volumétriques 3D—directement à partir de l'image d'entrée. Ce réseau gère efficacement des résolutions plus élevées sans augmenter significativement les exigences computationnelles, capturant des détails fins et minimisant les artefacts d'aliasing.
En outre, le modèle adopte une approche unique pour estimer les matériaux et l'éclairage. Grâce à une méthode probabiliste novatrice, le réseau d'estimation des matériaux prédit les valeurs globales de métal et de rugosité, améliorant ainsi la qualité et la cohérence de l'image. Notamment, Stable Fast 3D intègre également des composants essentiels pour une image 3D complète—maillage, textures et propriétés des matériaux—dans un actif prêt à l'emploi.
Les innovations continues de Stability AI
Stability AI est largement reconnue pour sa technologie de génération d'images à partir de texte, Stable Diffusion. Alors que Stable Diffusion se concentre sur les images 2D, l'entreprise améliore ses capacités 3D depuis novembre 2023, en commençant par Stable 3D. La sortie subséquente de Stable Video 3D en mars a amélioré la qualité de génération d'images 3D et a introduit un panoramique de caméra de base pour la visualisation des images.
L'entreprise ne s'arrête pas à la 3D ; elle a récemment dévoilé Stable Video 4D, qui intègre le temps dans la génération de courtes vidéos 3D, repoussant encore les limites de l'IA générative.