No hace mucho, generar imágenes 3D era una tarea complicada y que requería mucho tiempo, con frameworks complejos, software especializado y hardware potente. Hoy en día, esto ha cambiado drásticamente.
Stability AI ha presentado una tecnología innovadora de inteligencia artificial generativa llamada Stable Fast 3D, que permite la creación rápida de imágenes 3D a partir de una sola imagen en solo medio segundo. Esto representa un avance significativo en el tiempo de procesamiento, ofreciendo resultados 1200 veces más rápidos que los modelos anteriores, como Stable Video 3D (SV3D), que podían tardar hasta 10 minutos en generar resultados similares.
Las implicaciones de Stable Fast 3D son vastas, con aplicaciones potenciales en diseño, arquitectura, comercio minorista, realidad virtual y desarrollo de videojuegos. Puedes acceder a este modelo a través del chatbot Stable Assistant de Stability AI y la API de Stability AI, así como mediante una licencia comunitaria en Hugging Face.
La Tecnología Detrás de Stable Fast 3D
Stable Fast 3D evoluciona del trabajo previo de Stability AI con el modelo TripoSR. En marzo, la empresa se asoció con Trip AI para desarrollar tecnología de generación de activos 3D rápida.
En su artículo de investigación, los científicos de Stability AI describen los métodos innovadores utilizados para reconstruir rápidamente mallas 3D de alta calidad a partir de imágenes únicas. Al integrar varias técnicas novedosas, abordan desafíos comunes en la reconstrucción rápida de 3D mientras mejoran tanto la velocidad como la calidad de salida.
En su núcleo, Stable Fast 3D utiliza una red transformadora avanzada que genera triplanos de alta resolución—representaciones volumétricas 3D—directamente de la imagen de entrada. Esta red gestiona eficientemente resoluciones más grandes sin aumentar significativamente las demandas computacionales, capturando detalles más finos y minimizando artefactos de aliasing.
Además, el modelo presenta un enfoque único para estimar materiales e iluminación. A través de un nuevo método probabilístico, la red de estimación de materiales predice valores globales de metalicidad y rugosidad, lo que lleva a una mejora en la calidad y consistencia de las imágenes. Notablemente, Stable Fast 3D también integra componentes esenciales para una imagen 3D completa—malla, texturas y propiedades del material—en un activo listo para usar.
Innovaciones Continuas de Stability AI
Stability AI es ampliamente reconocida por su tecnología de generación de imágenes a partir de texto Stable Diffusion. Si bien Stable Diffusion se centra en imágenes 2D, la compañía ha estado avanzando en sus capacidades 3D desde noviembre de 2023, comenzando con Stable 3D. El lanzamiento posterior de Stable Video 3D en marzo mejoró la calidad de generación de imágenes 3D e introdujo panorámicas básicas para visualizar imágenes.
La empresa no se detiene en 3D; recientemente han presentado Stable Video 4D, que incorpora el tiempo en la generación de videos cortos en 3D, llevando los límites de la inteligencia artificial generativa aún más lejos.