Nvidia a lancé Latte3D, un modèle innovant d'IA générative capable de créer instantanément des formes 3D de haute qualité à partir de textes. Développé par le laboratoire d'IA de Nvidia à Toronto, Latte3D représente un bond significatif dans le domaine de l'intelligence artificielle, permettant la création quasi en temps réel d'objets et de créatures 3D à partir de simples descriptions textuelles.
Sanja Fidler, vice-présidente de la recherche en IA chez Nvidia, décrit Latte3D comme un outil transformateur pour les créateurs de divers secteurs. "Nous pouvons désormais produire des résultats d'un ordre de grandeur plus rapide, rendant la génération de modèles 3D à partir de texte accessible à tous," a-t-elle déclaré.
Au cœur de Latte3D, le modèle fonctionne comme une imprimante 3D virtuelle, convertissant des invites textuelles en modèles 3D complexes. Grâce à une seule unité de traitement graphique (GPU), telle que le Nvidia RTX A6000, le modèle génère des formes détaillées instantanément, sans les longs processus de rendu typiques du design 3D traditionnel.
Les créateurs peuvent rapidement donner vie à leurs idées avec Latte3D, éliminant ainsi le besoin de concevoir des objets de manière fastidieuse ou de rechercher longuement dans des bibliothèques d’actifs 3D. Le modèle propose plusieurs options de design selon chaque prompt, permettant aux utilisateurs de choisir la forme la plus adaptée à leurs besoins.
Cependant, les experts avertissent que générer des concepts est facile, mais affiner ces images générées pour répondre à des attentes spécifiques peut être un défi. L'écart entre la création initiale et la personnalisation finale demeure un obstacle complexe.
La polyvalence de Latte3D se révèle dans ses jeux de données d'entraînement, qui intègrent des animaux et des objets du quotidien. Les développeurs peuvent également adapter le modèle à différentes typologies de données, élargissant son utilisation dans des domaines tels que la conception paysagère et la robotique.
Par exemple, les designers de paysage peuvent rapidement peupler des rendus de jardins avec des plantes réalistes, tandis que les développeurs en robotique pourraient utiliser Latte3D pour simuler des environnements domestiques pour former des robots assistants personnels.
Propulsé par les GPU Nvidia A100 Tensor Core et entraîné avec divers prompts textuels générés par ChatGPT, Latte3D illustre l'engagement de Nvidia à faire progresser la création de contenu pilotée par l'IA. Sa capacité à répondre avec précision à une gamme de descriptions textuelles garantit une génération de formes adaptée aux utilisateurs.
Dans le cadre de la mission de Nvidia Research d'innover dans le domaine de l'IA et des graphiques informatiques, Latte3D incarne le dévouement de l'entreprise à repousser les limites technologiques. Avec une équipe mondiale de centaines de scientifiques et d'ingénieurs, Nvidia continue de mener les avancées en matière d'IA, de vision par ordinateur, de technologies de conduite autonome et de robotique.