비용과 생성적 AI의 정확성에 대한 우려에도 불구하고 로보틱스 산업은 변혁의 새로운 국면에 접어들고 있습니다. 오늘, 보스턴 다이내믹스, 테슬라, 구글 딥마인드, 아처 항공의 전 직원들이 설립한 로보틱스 스타트업 Figure는 ChatGPT의 제작사인 OpenAI와의 협력을 발표했습니다. 그들의 첫 번째 프로젝트인 Figure 01 휴머노이드 로봇은 정말 인상적입니다.
Figure의 공동 창립자이자 CEO인 브렛 앳콕이 플랫폼 X에 게시한 최근 비디오 데모에서 Figure 01은 인간 및 환경과 상호작용할 수 있는 능력을 보여줍니다. 이 로봇은 명령에 반응하고, 사과와 같은 물체를 가져오며 기본적인 대화도 나눌 수 있습니다—비록 그 반응이 인간 상호작용에 비해 약간 지연되긴 하지만 말입니다. 또한, 쓰레기를 주우며 독립적으로 작업을 수행하고, 식기를 건조대에 올리는 것도 가능합니다.
데모는 한 사람이 "헤이 Figure One, 지금 뭐가 보이니?"라고 묻는 장면으로 시작됩니다. 로봇은 "테이블 중앙의 접시에 빨간 사과가 있고, 컵과 접시가 있는 건조대, 그리고 당신이 테이블에 손을 올리고 서 있는 모습이 보입니다."라고 답합니다. 사람이 먹을 것을 요청하자, 로봇은 효율적으로 사과를 집어 들고 건네주며, 그것이 유일한 식용 아이템임을 인식합니다.
앳콕은 Figure의 온보드 카메라가 OpenAI에 의해 훈련된 대형 비전-언어 모델(VLM)과 연계되어 있다고 전했습니다. 그러나 이 모델이 GPT-4 기반인지 다른 변형인지는 아직 불확실합니다. 우리는 OpenAI에 추가 정보를 요청하였으며, 답변을 받는 대로 업데이트할 예정입니다.
앳콕은 이 비디오가 원거리 조정이나 속도 조절 없이 진정한 능력을 시연하고 있으며, 부드럽고 연속적인 동작을 보여준다고 강조했습니다. 이는 인간과 로봇 간의 자연스러운 상호작용을 보여주는 휴머노이드 로보틱스의 중요한 발전을 의미합니다.
하지만 이 데모는 프로토타입을 강조하며, 상용 배포를 위해 더 많은 개발이 필요하다는 것을 나타냅니다. 앳콕은 위험하거나 바람직하지 않은 작업을 맡아 사회에 긍정적인 영향을 미칠 수 있는 휴머노이드 로봇을 대량 생산하겠다는 비전을 가지고 있습니다.
그의 비전 성명에서 앳콕은 Figure가 군사적 또는 해로운 응용 프로그램을 피하면서 인간의 삶을 향상시키는 것을 목표로 한다고 설명했습니다. OpenAI의 지원을 받는 Figure의 발전은 테슬라의 Optimus 프로젝트와 아마존과 협력 중인 스타트업 Agility와 같은 회사들 간의 경쟁을 강화하고 있습니다. Hugging Face와 같은 새로운 참여자들도 급성장하는 이 분야에서 혁신을 추구하면서 등장하고 있습니다.