O Sistema de Controle de Robôs Baseado em Transformadores da UC Berkeley Adapta-se Perfeitamente a Ambientes Não Vistos

Pesquisadores da Universidade da Califórnia, Berkeley, desenvolveram um sistema de controle inovador para robôs humanoides, permitindo-lhes navegar habilidosamente por terrenos e obstáculos diversos. Este sistema, impulsionado por inteligência artificial (IA), é inspirado nos frameworks de aprendizado profundo que revolucionaram os modelos de linguagem de grande porte (LLM). Seu princípio central é simples: ao analisar observações recentes, a IA pode prever estados e ações futuras.

Treinado totalmente em simulação, o sistema demonstra um desempenho robusto em condições imprevisíveis do mundo real. Ao avaliar interações passadas, ele ajusta dinamicamente seu comportamento para gerenciar cenários novos que não foram abordados durante o treinamento.

Um Robô para Todos os Terrenos

Os robôs humanoides, projetados para se assemelhar aos humanos, têm o potencial de se tornar assistentes valiosos, capazes de realizar diversas tarefas físicas e cognitivas. No entanto, criar robôs humanoides versáteis apresenta desafios significativos, especialmente no desenvolvimento de um sistema de controle flexível.

Sistemas de controle robótico tradicionais geralmente carecem de adaptabilidade, sendo projetados para tarefas específicas e enfrentando dificuldades para lidar com a imprevisibilidade dos terrenos e condições visuais do mundo real. Essa rigidez limita sua utilidade a ambientes controlados.

Por isso, há um foco crescente em métodos baseados em aprendizado para controle robótico. Tais sistemas podem adaptar seu comportamento com base em dados coletados de simulações ou interações diretas com o ambiente.

O sistema de controle da U.C. Berkeley promete guiar habilidosamente robôs humanoides em uma variedade de cenários. Implantado no Digit, um robô humanoide de tamanho real e de múltiplas funções, este sistema demonstra excepcionais capacidades de locomoção em ambientes externos, navegações confiáveis em ambientes cotidianos como calçadas, passagens, trilhas e campos abertos. O robô transita com destreza em várias superfícies – incluindo concreto, borracha e grama – sem cair.

Os pesquisadores relatam: “Descobrimos que nosso controlador conseguiu caminhar sobre todos os terrenos testados de forma confiável e nos sentimos à vontade para implantá-lo sem um andaime de segurança. Durante uma semana de testes em ambientes externos, não observamos quedas.”

Além disso, o robô foi rigorosamente testado quanto à resiliência contra distúrbios. Ele gerencia efetivamente passos inesperados, objetos aleatórios em seu caminho e até projéteis, mantendo a estabilidade quando empurrado ou puxado.

Controle de Robô com Transformers

Embora vários robôs humanoides demonstrem habilidades impressionantes, este novo sistema se destaca pela sua metodologia de treinamento e implantação.

O modelo de controle de IA foi treinado exclusivamente em simulação, utilizando milhares de domínios e dezenas de bilhões de cenários dentro do Isaac Gym, um ambiente de simulação física de alto desempenho. Essa vasta experiência simulada se transfere para aplicações do mundo real sem ajustes adicionais, em um processo conhecido como transferência sim-para-real. Notavelmente, o sistema apresentou habilidades emergentes em cenários do mundo real, como a navegação por degraus que não foram explicitamente abordados durante o treinamento.

No centro deste sistema está um “transformer causal”, um modelo de aprendizado profundo que processa observações e ações proprioceptivas históricas. Este transformer identifica eficazmente a relevância de informações específicas – como padrões de marcha e estados de contato – pertinentes às observações do robô.

Transformers, conhecidos por seu sucesso em modelos de linguagem de grande porte, são particularmente habilidosos em prever elementos subsequentes em extensas sequências de dados. O transformer causal utilizado neste robô aprende com sequências de observações e ações, permitindo que ele antecipe as consequências de seu comportamento, adaptando-se dinamicamente a paisagens variadas, inclusive aquelas desconhecidas.

Os pesquisadores afirmam: “Hipotetizamos que a história de observações e ações implicitamente codifica informações sobre o mundo que um modelo transformer poderoso pode usar para adaptar seu comportamento dinamicamente no momento do teste.” Esse conceito, denominado “adaptação em contexto”, é semelhante à forma como modelos de linguagem utilizam informações contextuais para aprender novas tarefas e refinar saídas durante a inferência.

Transformers se mostraram superiores a outros modelos sequenciais, como redes de convolução temporal (TCN) e redes de memória de curto e longo prazo (LSTM). Sua arquitetura apoia a escalabilidade com dados e recursos computacionais adicionais, e podem ser aprimorados pela integração de diversas modalidades de entrada.

No último ano, os transformers surgiram como ferramentas valiosas na comunidade robótica, com diversos modelos aproveitando sua versatilidade para melhorar as capacidades robóticas. Eles oferecem benefícios substanciais, incluindo uma melhor codificação de diferentes modalidades e a tradução de instruções de linguagem natural de alto nível em passos de planejamento específicos para robôs.

Os pesquisadores concluem: “De forma análoga a campos como visão e linguagem, acreditamos que os transformers podem facilitar nosso progresso futuro na escalabilidade de abordagens de aprendizado para locomoção humanoide no mundo real.”

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles