Investigadores de la Universidad de California, Berkeley, han desarrollado un innovador sistema de control para robots humanoides, permitiéndoles navegar con habilidad en terrenos diversos y superar obstáculos. Este sistema, impulsado por inteligencia artificial, se inspira en los marcos de aprendizaje profundo que han transformado los modelos de lenguaje de gran tamaño (LLM). Su principio fundamental es sencillo: al analizar observaciones recientes, la IA puede predecir estados y acciones futuras.
Entrenado completamente en simulación, el sistema demuestra un rendimiento sólido en condiciones impredecibles del mundo real. Al evaluar interacciones pasadas, ajusta dinámicamente su comportamiento para gestionar eficazmente nuevos escenarios que no ha encontrado durante su entrenamiento.
Un Robot para Todos los Terrenos
Los robots humanoides, diseñados para parecerse a los humanos, tienen el potencial de convertirse en asistentes invaluables capaces de realizar diversas tareas físicas y cognitivas. Sin embargo, crear robots humanoides versátiles presenta desafíos significativos, especialmente en el desarrollo de un sistema de control flexible.
Los sistemas de control robótico tradicionales a menudo carecen de adaptabilidad, diseñados para tareas específicas y luchando por manejar la imprevisibilidad de los terrenos y condiciones visuales del mundo real. Esta rigidez limita su utilidad a entornos controlados.
Por lo tanto, hay un creciente enfoque en métodos de control robótico basados en el aprendizaje. Estos sistemas pueden ajustar su comportamiento en función de los datos recogidos de simulaciones o interacciones directas con el entorno.
El sistema de control de la U.C. Berkeley promete guiar hábilmente a los robots humanoides a través de una variedad de escenarios. Implementado en Digit, un robot humanoide de tamaño completo y propósito general, este sistema demuestra excepcionales capacidades para caminar al aire libre, navegando con fiabilidad en entornos humanos cotidianos como pasarelas, aceras, senderos y campos abiertos. El robot atraviesa diversas superficies, incluyendo concreto, goma y césped, sin caerse.
Los investigadores reportan: "Descubrimos que nuestro controlador pudo caminar de manera confiable por todos los terrenos probados y nos sentimos cómodos implementándolo sin una viga de seguridad. Durante una semana de pruebas en entornos al aire libre, no observamos caídas".
Además, el robot ha sido rigurosamente probado para su resistencia ante disturbios. Maneja eficazmente pasos inesperados, objetos aleatorios en su camino e incluso proyectiles, manteniendo la estabilidad cuando es empujado o tirado.
Control de Robots con Transformers
Aunque diversos robots humanoides exhiben habilidades impresionantes, este nuevo sistema destaca por su metodología de entrenamiento y despliegue.
El modelo de control de IA fue entrenado puramente en simulación, utilizando miles de dominios y decenas de miles de millones de escenarios dentro de Isaac Gym, un entorno de simulación física de alto rendimiento. Esta amplia experiencia simulada se transfiere de manera fluida a aplicaciones del mundo real sin ajuste adicional, en un proceso conocido como transferencia de sim a real. Notablemente, el sistema mostró habilidades emergentes en escenarios del mundo real, como navegar por escalones que no fueron cubiertos explícitamente durante el entrenamiento.
Central a este sistema está un "transformador causal", un modelo de aprendizaje profundo que procesa observaciones y acciones proprioceptivas históricas. Este transformador identifica efectivamente la relevancia de información específica, como patrones de marcha y estados de contacto, pertinentes a las observaciones del robot.
Los transformers, conocidos por su éxito en modelos de lenguaje de gran tamaño, son especialmente hábiles para predecir elementos subsecuentes en secuencias extensas de datos. El transformador causal utilizado en este robot aprende de secuencias de observaciones y acciones, permitiéndole anticipar las consecuencias de su comportamiento, adaptándose dinámicamente a paisajes variados, incluso a los desconocidos.
Los investigadores afirman: "Hipotetizamos que la historia de observaciones y acciones codifica implícitamente la información sobre el mundo que un potente modelo de transformador puede usar para adaptar su comportamiento dinámicamente en tiempo de prueba." Este concepto, denominado “adaptación en contexto”, es similar a cómo los modelos de lenguaje utilizan información contextual para aprender nuevas tareas y refinar salidas durante la inferencia.
Los transformers han demostrado ser superiores a otros modelos secuenciales, como redes convolucionales temporales (TCN) y redes de memoria a corto y largo plazo (LSTM). Su arquitectura soporta la escalabilidad con datos y recursos computacionales adicionales, y pueden mejorarse integrando diversas modalidades de entrada.
En el último año, los transformers han emergido como herramientas valiosas dentro de la comunidad robótica, con múltiples modelos utilizando su versatilidad para mejorar las capacidades robóticas. Ofrecen beneficios sustanciales, incluyendo una mejor codificación de diferentes modalidades y la traducción de instrucciones en lenguaje natural de alto nivel en pasos de planificación específicos para robots.
Los investigadores concluyen: "Análogamente a campos como la visión y el lenguaje, creemos que los transformers pueden facilitar nuestro futuro progreso en la escalabilidad de enfoques de aprendizaje para la locomoción humanoide en el mundo real."