엔비디아, 프로젝트 GR00T 공개: 미래의 휴머노이드를 위한 첨단 멀티모달 AI

엔비디아는 프로젝트 GR00T의 출시로 로봇 공학에 혁신을 일으키고 있습니다. 이 최첨단 다중 모달 AI는 미래의 휴머노이드 로봇에 고급 기초 AI를 통해 힘을 실어주기 위해 설계되었습니다. GR00T는 샌홀리오의 맥에너리 컨벤션 센터에서 열린 GTC 컨퍼런스에서 공개되었으며, 일반적인 목적의 기초 모델을 활용하여 휴머노이드 로봇이 텍스트, 음성, 비디오 및 라이브 시연에서 입력을 처리하고 특정 작업을 수행할 수 있도록 하고 있습니다. 이 프로젝트는 새로운 강화 학습 전용 아이작 랩을 포함한 엔비디아의 아이작 로봇 플랫폼을 활용하고 있습니다.

엔비디아 CEO 젠슨 황은 “일반적인 휴머노이드 로봇을 위한 기초 모델 개발은 현재 AI에서 가장 흥미로운 도전 중 하나입니다”라고 말했습니다. 그는 기술의 융합이 전 세계 로봇 공학자들에게 인공지능 일반 로봇 공학의 중요한 발전 가능성을 제공한다고 강조했습니다.

GR00T를 통해 기업이 이점을 누릴 수 있도록 엔비디아는 휴머노이드 로봇에 특화된 제트슨 쏜 칩을 도입했습니다. 엔비디아는 또한 비구조화된 환경을 탐색할 수 있는 AI 기반 산업 조작 팔 및 로봇 개발을 위한 상당한 개선 사항을 발표했습니다.

엔비디아 프로젝트 GR00T에서 기대하는 점은 무엇인가요? 이름은 마블의 그루트를 연상시키지만, 실제로는 일반 로봇 00 기술을 의미합니다. 엔비디아에 따르면 GR00T는 자연어 텍스트, 음성, 비디오 및 라이브 시연을 이해하도록 설계되어, 인간의 동작을 복제하고 현실 세계와 상호 작용하는 데 필요한 조정 능력과 기타 기술을 습득할 수 있도록 합니다.

이러한 발전은 휴머노이드 로봇의 기능을 확장할 뿐 아니라 개발 및 배포 과정을 단순화합니다. 텍스트 및 시연과 같은 입력으로, 필요한 접근 권한을 가진 누구나 로봇을 프로그래밍할 수 있습니다.

GTC 기조연설에서 황은 Agility Robotics, Apptronik, Fourier Intelligence, Unitree Robotics와 같은 회사에서 GR00T 기반의 휴머노이드 로봇이 수행한 다양한 작업을 시연했습니다. GR00T에 대해 저널리스트에게 briefing을 한 딥푸 탈라는 이 프로젝트가 생성 AI와 트랜스포머의 최신 발전을 활용하고 있다고 언급했으며, 현재로서는 전체 기능에 대한 세부 사항은 제한적입니다.

생성 AI의 선두주자인 OpenAI도 구현된 AI 분야에 진출하고 있으며, 1X Technologies와 Figure와 같은 스타트업을 지원하고 있습니다. 최근 Figure는 OpenAI가 개발한 대형 비전-언어 모델을 사용해 쓰레기 줍기와 같은 일상 업무를 수행하는 로봇을 선보였습니다.

프로젝트 GR00T는 휴머노이드 로봇의 지능을 제공하며, 다양한 유용한 작업을 수행하는 기술 습득 능력을 갖추도록 합니다. 미디어 질문에 대해 탈라는 현재 내부 아키텍처에 대한 상세 정보는 없지만, GR00T의 기능에 대한 추가 정보를 나중에 공유할 것이라고 밝혔습니다. 현재는 몇몇 휴머노이드 개발자만 모델에 조기 액세스할 수 있지만, 엔비디아는 곧 더 많은 개발자들에게 접근 기회를 확장할 계획입니다.

엔비디아는 GR00T와 같은 복잡한 다중 모달 모델을 운영할 수 있도록 제트슨 쏜 컴퓨팅 플랫폼을 도입했습니다. Thor SoC 기반의 이 고성능 컴퓨팅 시스템은 강력한 CPU 클러스터와 엔비디아 블랙웰 아키텍처의 차세대 GPU를 포함하고 있으며, 800테라플롭의 8비트 부동소수점 AI 성능을 제공합니다. 탈라는 이 GPU 성능이 이전 제트슨 오린 버전보다 8배 뛰어나고 CPU 성능도 2.6배 우수하다고 강조했습니다.

GR00T의 핵심에는 새로운 아이작 로봇 공학 도구들이 있습니다. 엔비디아는 아이작 로봇 플랫폼을 활용하여 프로젝트 GR00T를 구현하며, AI 기반 로봇 설계, 시뮬레이션, 배포를 위한 포괄적인 종단 간 프레임워크를 개발자에게 제공합니다.

이 프로젝트는 모델의 교육 및 테스트를 위한 병렬 시뮬레이션을 활용하는 GPU 가속 가상 환경인 새로운 아이작 랩을 활용합니다. 또한 OSMO 컴퓨트 오케스트레이션 서비스는 엔비디아 DGX 및 OVX 시스템에서 교육 및 시뮬레이션 작업을 관리할 수 있게 합니다.

아이작 로봇 플랫폼은 또한 두 가지 목표 솔루션인 아이작 조작기와 아이작 인식기를 통해 제공 범위를 확대하고 있습니다. 아이작 조작기는 로봇 암을 고급 동작 및 손재주로 향상시키기 위해 GPU 가속 라이브러리와 기초 모델을 제공합니다. 여기에는 물체 감지, 6D 자세 추정, 추적, 그리고 잡기에 대한 세밀한 예측 모델이 포함됩니다.

반면, 아이작 인식기는 AI 알고리즘을 기반으로 3D 인식을 위한 다중 카메라의 360도 비전 기능을 통해 로봇이 비구조화된 환경을 탐색하는 데 도움을 줍니다. 엔비디아는 이 기술을 Nova Orin DevKit을 통해 제공하며, ArcBest, BYD, KION Group과 같은 파트너와 협력하여 제조 및 물류 분야에서 자율 모바일 로봇의 기능을 강화하고 있습니다.

ArcBest의 최고 혁신 책임자 마이클 뉴시티는 "아이작 인식기 플랫폼을 당사의 Vaux 스마트 자율 AMR 지게차 및 리치 트럭에 통합함으로써 물류센터에서 물체 처리를 위한 인식 개선, 의미 중심 내비게이션 및 장애물 탐지를 위한 3D 매핑이 가능해졌습니다"라고 말했습니다.

아이작 플랫폼의 새로운 기능은 올해 2분기에 출시될 예정이며, 프로젝트 GR00T는 현재 조기 액세스 단계에 있습니다. 엔비디아는 추가 휴머노이드 개발자로부터의 신청을 받고 있으며, 더 넓은 대중 출시 계획은 아직 발표되지 않았습니다.

Most people like

Find AI tools in YBX