A Nvidia apresenta o Projeto GR00T: uma IA multimodal de ponta para os humanóides do futuro.

A Nvidia está revolucionando a robótica com o lançamento do Project GR00T—uma IA multimodal de ponta projetada para capacitar os robôs humanoides do futuro com inteligência artificial avançada.

Apresentado durante a conferência GTC no Centro de Convenções McEnery em San Jose, o Project GR00T utiliza um modelo de fundação de uso geral que permite aos robôs humanoides processar entradas de texto, fala, vídeos e demonstrações ao vivo para realizar ações específicas. Este projeto aproveita a Plataforma de Robótica Isaac da Nvidia, incluindo um novo laboratório Isaac dedicado ao aprendizado por reforço.

“Construir modelos de fundação para robôs humanoides é um dos desafios mais emocionantes da IA atualmente,” afirmou o CEO da Nvidia, Jensen Huang. Ele destacou que a convergência de tecnologias habilitadoras oferece aos robóticos em todo o mundo o potencial para avanços significativos na robótica geral artificial.

Para ajudar as empresas a aproveitar o GR00T, a Nvidia apresentou um chip Jetson Thor especializado para robôs humanoides. A empresa também anunciou melhorias significativas para o desenvolvimento de braços de manipulação industrial impulsionados por IA e robôs capazes de navegar em ambientes não estruturados.

O que esperar do Project GR00T?

Embora o nome remeta ao Groot da Marvel, na verdade, ele se refere à Tecnologia 00 de Robô Generalista. De acordo com a Nvidia, o GR00T foi projetado para compreender texto em linguagem natural, fala, vídeo e demonstrações ao vivo, permitindo que ele repita movimentos humanos—coordenando destreza e outras habilidades para navegar e interagir com o mundo real.

Esse avanço não apenas expande as capacidades dos robôs humanoides, mas também simplifica o processo de desenvolvimento e implantação. Com entradas como texto e demonstrações, qualquer pessoa com o acesso necessário pode programar os robôs.

Na sua apresentação na GTC, Huang demonstrou várias tarefas realizadas por robôs humanoides impulsionados pelo GR00T, de empresas como Agility Robotics, Apptronik, Fourier Intelligence e Unitree Robotics. Deepu Talla, que informou jornalistas sobre o GR00T, indicou que o projeto capitaliza os últimos avanços em IA generativa e transformers, embora os detalhes sobre sua gama completa de capacidades sejam limitados por enquanto.

A OpenAI, líder em IA generativa, também está entrando no campo da IA incorporada, apoiando startups como 1X Technologies e Figure. Recentemente, a Figure apresentou um de seus robôs realizando tarefas rotineiras, incluindo coletar lixo, utilizando um grande modelo de visão-linguagem desenvolvido pela OpenAI.

O Project GR00T serve como a inteligência por trás dos robôs humanoides, equipando-os com a habilidade de aprender competências para diversas tarefas úteis. Durante uma consulta da mídia, Talla observou que, embora informações detalhadas sobre a arquitetura interna estejam atualmente indisponíveis, mais insights sobre as capacidades do GR00T serão compartilhados no futuro. Apenas alguns desenvolvedores de robôs humanoides tiveram acesso antecipado ao modelo, mas a Nvidia planeja expandir o acesso a mais desenvolvedores em breve.

Para garantir que os robôs humanoides possam operar modelos multimodais complexos como o GR00T, a Nvidia introduziu a plataforma de computação Jetson Thor. Construído sobre o SoC Thor, esse sistema de computação de alto desempenho inclui um potente cluster de CPU e uma GPU de próxima geração da arquitetura Blackwell da Nvidia, capaz de fornecer 800 teraflops de desempenho em AI com ponto flutuante de 8 bits. Talla destacou que o desempenho dessa GPU é oito vezes melhor do que a versão anterior Jetson Orin e o desempenho da CPU é 2,6 vezes superior.

Novas Ferramentas de Robótica Isaac no Coração do GR00T

A Nvidia está utilizando sua Plataforma de Robótica Isaac para trazer o Project GR00T à realidade, oferecendo aos desenvolvedores uma estrutura abrangente de ponta a ponta para projetar, simular e implantar robôs impulsionados por IA.

O projeto aproveita o novo Isaac Lab—um ambiente virtual acelerado por GPU—utilizando simulações paralelas para o treinamento e teste do modelo. Além disso, o serviço de orquestração de computação OSMO permite o gerenciamento de cargas de trabalho de treinamento e simulação em sistemas Nvidia DGX e OVX.

A Plataforma de Robótica Isaac também está expandindo suas ofertas com duas soluções específicas: Isaac Manipulator e Isaac Perceptor.

O Isaac Manipulator fornece bibliotecas aceleradas por GPU e modelos de fundação para aprimorar braços robóticos com movimento avançado e destreza. Isso inclui modelos para detectar objetos, estimar sua pose 6D, rastrear e fazer previsões detalhadas para agarrar.

Por outro lado, o Isaac Perceptor auxilia robôs a navegar em ambientes não estruturados utilizando capacidades de visão em 360 graus com múltiplas câmeras, impulsionadas por algoritmos de IA para percepção 3D e conscientização do entorno. A Nvidia está disponibilizando essa tecnologia por meio do Nova Orin DevKit, colaborando com parceiros como ArcBest, BYD e KION Group para aprimorar as funcionalidades de seus robôs móveis autônomos na manufatura e na distribuição.

“A integração da plataforma Isaac Perceptor em nossos empilhadores AMR de autonomia inteligente Vaux e caminhões de alcance possibilita uma percepção aprimorada, navegação semântica consciente e mapeamento 3D para detecção de obstáculos no manuseio de materiais em armazéns e centros de distribuição,” disse Michael Newcity, Diretor de Inovação da ArcBest.

As novas capacidades da plataforma Isaac devem ser lançadas no segundo trimestre deste ano, enquanto o Project GR00T continua em acesso antecipado. A Nvidia está aceitando inscrições de desenvolvedores humanoides adicionais, com planos para um lançamento público mais amplo ainda a serem anunciados.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles