Nvidia está revolucionando la robótica con el lanzamiento del Proyecto GR00T, una inteligencia artificial multimodal de vanguardia diseñada para potenciar a los robots humanoides del futuro con inteligencia artificial fundamental avanzada.
Presentado durante la conferencia GTC en el Centro de Convenciones McEnery de San José, el Proyecto GR00T utiliza un modelo de base de uso general que permite a los robots humanoides procesar entradas de texto, voz, videos y demostraciones en vivo para realizar acciones específicas. Este proyecto aprovecha la Plataforma de Robótica Isaac de Nvidia, que incluye un nuevo Isaac Lab dedicado al aprendizaje por refuerzo.
"La construcción de modelos fundamentales para robots humanoides generales es uno de los desafíos más emocionantes en IA hoy en día", afirmó el CEO de Nvidia, Jensen Huang. Destacó que la convergencia de tecnologías habilitadoras brinda a los robóticos de todo el mundo la posibilidad de avances significativos en la robótica general artificial.
Para facilitar que las empresas aprovechen GR00T, Nvidia ha presentado un chip Jetson Thor especializado, diseñado para robots humanoides. La compañía también anunció mejoras significativas para el desarrollo de brazos de manipulación industrial impulsados por IA y robots capaces de navegar en entornos no estructurados.
¿Qué esperar del Proyecto GR00T de Nvidia?
Aunque el nombre evoca a Groot de Marvel, en realidad significa Tecnología 00 de Robot Generalista. Según Nvidia, GR00T está diseñado para comprender texto en lenguaje natural, voz, video y demostraciones en vivo, lo que le permite replicar movimientos humanos, coordinando destreza y otras habilidades para navegar e interactuar con el mundo real.
Este avance no solo amplía las capacidades de los robots humanoides, sino que también simplifica el proceso de desarrollo y despliegue. Con entradas como texto y demostraciones, los robots pueden ser programados por cualquier persona con acceso adecuado.
En su discurso principal de GTC, Huang demostró diversas tareas realizadas por robots humanoides impulsados por GR00T de empresas como Agility Robotics, Apptronik, Fourier Intelligence y Unitree Robotics. Deepu Talla, quien informó a los periodistas sobre GR00T, indicó que el proyecto capitaliza los últimos avances en IA generativa y transformadores, aunque los detalles sobre su gama completa de capacidades son limitados por ahora.
OpenAI, un líder en IA generativa, también está incursionando en la IA embebida, apoyando a startups como 1X Technologies y Figure. Recientemente, Figure mostró uno de sus robots realizando tareas rutinarias, como recoger basura, utilizando un gran modelo de visión-lenguaje desarrollado por OpenAI.
El Proyecto GR00T actúa como la inteligencia detrás de los robots humanoides, dotándolos de la capacidad de aprender habilidades para diversas tareas útiles. Durante una consulta de medios, Talla señaló que, si bien no está disponible información detallada sobre la arquitectura interna, se compartirán más detalles sobre las capacidades de GR00T en el futuro. Actualmente, solo selectos desarrolladores de robots humanoides tienen acceso anticipado al modelo, pero Nvidia planea ampliar el acceso a más desarrolladores pronto.
Para garantizar que los robots humanoides puedan operar modelos multimodales complejos como GR00T, Nvidia ha presentado la plataforma de computación Jetson Thor. Basado en el SoC Thor, este sistema de computación de alto rendimiento incluye un potente clúster de CPU y una GPU de próxima generación de la arquitectura Blackwell de Nvidia, capaz de ofrecer 800 teraflops de rendimiento en IA de punto flotante de 8 bits. Talla destacó que este rendimiento de GPU es ocho veces mejor que el de la versión anterior, Jetson Orin, y el rendimiento de CPU es 2.6 veces superior.
Nuevas herramientas de robótica Isaac en el núcleo de GR00T
Nvidia está utilizando su Plataforma de Robótica Isaac para hacer realidad el Proyecto GR00T, ofreciendo a los desarrolladores un marco integral de extremo a extremo para diseñar, simular y desplegar robots impulsados por IA.
El proyecto aprovecha el nuevo Isaac Lab, un entorno virtual acelerado por GPU, utilizando simulaciones paralelas para el entrenamiento y prueba del modelo. Además, el servicio de orquestación de computación OSMO permite gestionar cargas de trabajo de entrenamiento y simulación en los sistemas DGX y OVX de Nvidia.
La Plataforma de Robótica Isaac también está ampliando su oferta con dos soluciones dirigidas: Isaac Manipulator e Isaac Perceptor. Isaac Manipulator proporciona bibliotecas aceleradas por GPU y modelos fundamentales para mejorar brazos robóticos con movimientos avanzados y destreza, incluyendo modelos para detectar objetos, estimar su pose 6D, rastrear y realizar predicciones detalladas para el agarre.
Por otro lado, Isaac Perceptor ayuda a los robots a navegar en entornos no estructurados utilizando capacidades de visión de 360 grados con múltiples cámaras, impulsadas por algoritmos de IA para la percepción en 3D y la conciencia del entorno. Nvidia está haciendo esta tecnología disponible a través de su Nova Orin DevKit, colaborando con socios como ArcBest, BYD y KION Group para mejorar las funcionalidades de sus robots móviles autónomos en manufactura y cumplimiento.
"Integrar la plataforma Isaac Perceptor en nuestros montacargas y camiones de alcance Vaux Smart Autonomy AMR permite mejorar la percepción, la navegación semántica y la creación de mapas en 3D para la detección de obstáculos en el manejo de materiales en almacenes y centros de distribución", comentó Michael Newcity, Director de Innovación de ArcBest.
Se espera que las nuevas capacidades de la plataforma Isaac se lancen en el segundo trimestre de este año, mientras que el Proyecto GR00T permanece en acceso anticipado. Nvidia está aceptando solicitudes de más desarrolladores humanoides, con planes de un lanzamiento público más amplio aún por anunciar.