Nvidia ha presentado Latte3D, un innovador modelo de IA generativa capaz de generar instantáneamente formas 3D de alta calidad a partir de descripciones en texto. Desarrollado por el laboratorio de IA de Nvidia en Toronto, Latte3D representa un avance significativo en la inteligencia artificial, permitiendo la creación casi en tiempo real de objetos y criaturas 3D a partir de simples indicaciones textuales.
Sanja Fidler, vicepresidenta de investigación de IA en Nvidia, describe a Latte3D como una herramienta transformadora para creadores en diversas industrias. “Ahora podemos producir resultados en un orden de magnitud más rápido, haciendo accesible la generación de texto a 3D en casi tiempo real para todos”, afirmó.
En esencia, Latte3D funciona como una impresora 3D virtual, convirtiendo prompts de texto en modelos 3D intrincados. Utilizando solo una unidad de procesamiento gráfico (GPU), como la Nvidia RTX A6000, el modelo genera formas detalladas de inmediato, evitando los prolongados procesos de renderizado típicos en el diseño 3D tradicional.
Los creadores pueden dar vida a sus ideas rápidamente con Latte3D, eliminando la necesidad de un diseño tedioso de objetos o de búsquedas extensas en bibliotecas de activos 3D. El modelo ofrece múltiples opciones de diseño basadas en cada prompt de texto, permitiendo a los usuarios seleccionar la forma más adecuada para sus necesidades.
Sin embargo, los expertos advierten que, aunque generar conceptos es fácil, refinar estas imágenes generadas para cumplir con expectativas específicas puede ser un desafío. La brecha entre la creación inicial y la personalización final sigue siendo un obstáculo complejo.
La versatilidad de Latte3D se evidencia en sus conjuntos de datos de entrenamiento, que incorporan animales y objetos cotidianos. Los desarrolladores también pueden adaptar el modelo con diferentes tipos de datos, ampliando su aplicación a campos como el diseño de paisajes y la robótica.
Por ejemplo, los diseñadores de paisajes pueden poblar de manera eficiente sus renderizados de jardines con plantas realistas, mientras que los desarrolladores de robótica podrían utilizar Latte3D para simular entornos domésticos destinados al entrenamiento de robots asistenciales.
Impulsado por las GPUs Nvidia A100 Tensor Core y entrenado con diversas descripciones textuales generadas por ChatGPT, Latte3D refleja el compromiso de Nvidia con el avance de la creación de contenido impulsada por IA. Su capacidad para responder con precisión a una variedad de descripciones textuales asegura la generación de formas personalizadas para los usuarios.
Como parte de la misión de Nvidia Research de innovar en IA y gráficos por computadora, Latte3D ejemplifica la dedicación de la compañía a superar los límites tecnológicos. Con un equipo global de cientos de científicos e ingenieros, Nvidia continúa liderando los avances en IA, visión por computadora, tecnología de conducción autónoma y robótica.