Hoje, a Mentee Robotics, uma startup cofundada por Amnon Shashua, fundador da Mobileye e AI21 Labs, saiu do modo stealth para apresentar sua mais recente inovação: o Menteebot, um robô humanoide movido por IA.
Ainda em estágio de protótipo, o Menteebot é projetado para aplicações domésticas e em armazéns, utilizando tecnologias avançadas de IA, incluindo modelos de linguagem de grande escala baseados em transformadores (LLMs), popularizados pelo ChatGPT da OpenAI. Essa abordagem permite que o robô funcione de maneira eficaz em todas as camadas de sua funcionalidade.
A Próxima Geração de Agentes de IA
O Menteebot é posicionado como um robô com foco em IA, capaz de realizar tarefas complexas do início ao fim. Ao contrário de muitos concorrentes que integram IA em sistemas existentes, a Mentee Robotics construiu o Menteebot desde o princípio, com uma filosofia de design centrada em IA.
A empresa lançou um vídeo demonstrando o Menteebot respondendo a comandos verbais, evidenciando sua capacidade de processar tarefas enquanto exibe locomoção, compreensão de cena, detecção de objetos e habilidades de apreensão.
O Que Torna o Menteebot Único?
Embora robôs humanoides tenham sido desenvolvidos ao longo dos anos, a maioria foca em interações físicas, como imitar movimentos humanos. Gerações anteriores foram geralmente pré-programadas ou operadas via software para tarefas específicas, como classificar itens em ambientes controlados.
Avanços recentes em modelos de linguagem e aprendizado incorporado possibilitaram uma nova onda de robôs capazes de entender e responder a comandos em linguagem natural. A Mentee Robotics se destaca ao integrar IA em toda a estrutura operacional do Menteebot, em vez de adaptar designs existentes.
Os Três Níveis do Menteebot
O Menteebot converte comandos humanos em ações complexas utilizando IA em três níveis principais:
1. Interpretação de Comandos: Utilizando LLMs baseados em transformadores, o Menteebot compreende comandos e planeja os passos necessários para concluir as tarefas.
2. Mapeamento Ambiental: Por meio de algoritmos baseados em NeRF, cria um mapa cognitivo 3D de seu entorno, reunindo informações semânticas sobre objetos e localizando-se para navegar dinamicamente por obstáculos.
3. Execução de Tarefas: Ao aplicar uma abordagem de aprendizado de máquina Sim2Real, o Menteebot executa seu plano com movimento autêntico e gestos das mãos adaptados de um ambiente simulado.
Amnon Shashua destacou: "Estamos à beira de uma convergência entre visão computacional, compreensão de linguagem natural e simuladores sofisticados. Na Mentee Robotics, isso marca a base para projetar um robô bípedo de propósito geral capaz de realizar tarefas domésticas e aprender por imitação.”
O vídeo de demonstração mostra o Menteebot movendo frutas de um local para outro na cozinha, embora exija múltiplos comandos para concluir a tarefa, em vez de executá-la em um movimento fluido. Como protótipo, melhorias contínuas são esperadas, permitindo que o Menteebot lide com comandos complexos de forma integrada.
A Mentee antecipa que o modelo de produção final apresentará sensores apenas com câmeras, motores elétricos proprietários para maior destreza e IA totalmente integrada, com lançamento previsto para o primeiro trimestre de 2025. No entanto, o segmento de mercado alvo ainda não foi confirmado.
Concorrência em Humanoides Movidos por IA
Embora a Mentee Robotics se beneficie da expertise de Shashua em visão computacional e LLMs, enfrenta forte concorrência. Empresas como Tesla, Figure AI, apoiada pela OpenAI, e 1X Technologies estão ativamente desenvolvendo humanoides com IA. A Nvidia também lançou o Projeto GR00T, um modelo fundamental para robôs humanoides, em parceria com diversos players da indústria, incluindo Agility Robotics, Boston Dynamics e Unitree Robotics.
A Boston Dynamics revelou recentemente o robô humanoide Atlas, totalmente elétrico, voltado para aplicações automotivas e industriais. O cenário competitivo promete ser dinâmico enquanto a Mentee Robotics trabalha para implementar seu humanoide com foco em IA nesse campo em rápida evolução.