В начале этого года, в марте 2024 года, компания Hugging Face, ведущий стартап в области открытых AI моделей и кода, привлекла внимание, наняв Реми Кадена, бывшего научного сотрудника Tesla, для руководства новым проектом по открытой робототехнике. Это событие стало значимым не только из-за того, что Tesla известна своим проектом гуманоидного робота Optimus, но и благодаря недавним прорывам в робототехнике, вызванным большими языковыми моделями на основе трансформеров и генеративным AI — областями, в которых Hugging Face имеет обширный опыт.
Теперь мы можем заглянуть в будущее открытой робототехники от Hugging Face с запуском LeRobot — открытого инструментария, направленного на демократизацию AI робототехники и вдохновение нового поколения инженеров-робототехников. Он теперь доступен на GitHub.
Каден поделился в X (ранее Twitter): "Следующий шаг в развитии AI — это его применение в физическом мире. Мы создаем инициативу, направленную на AI для робототехники, и она открыта для всех!" Он также предоставил ссылку на бесплатный сервер Discord для желающих участвовать в проекте LeRobot и использовать открытый код.
Что такое LeRobot?
LeRobot является надежной платформой, сопоставимой с "Трансформерами для робототехники". Этот инструментарий представляет собой комплексную платформу с универсальной библиотекой для обмена данными, визуализации и обучения продвинутым моделям. Пользователи могут получить доступ к множеству предобученных моделей для старта своих проектов. Кроме того, LeRobot бесшовно интегрируется с физическими симуляторами, позволяя энтузиастам и разработчикам без физического оборудования для робототехники тестировать свои AI модели в виртуальной среде.
Возможности и характеристики
Инструментарий LeRobot предназначен для работы с разнообразным роботехническим оборудованием — от образовательных robotic arms до сложных гуманоидов в продвинутых исследовательских лабораториях. Цель — создать AI систему, способную адаптироваться к различным формам роботов, предлагая универсальность и масштабируемость в различных приложениях. Каден подчеркнул некоторые возможности, доступные теперь в библиотеке LeRobot на GitHub, включая обучение роботов навигировать в незнакомых пространствах и захватывать объекты из видеопотоков, а также передачу предметов между манипуляторами.
Философия открытого кода
Решение предложить LeRobot в формате открытого кода является стратегическим шагом, нацеленным на предотвращение концентрации власти и инноваций в руках нескольких корпораций. Делая его доступным для всех, Hugging Face побуждает глобальное сообщество разработчиков, исследователей и увлеченных людей вносить свой вклад в коллективное развитие AI робототехники.
Создание сообщества и дата-репозитория
В центре разработки LeRobot стоит амбиция создать самый крупный краудсорсинговый датасет в области робототехники. В сотрудничестве с университетами, стартапами, крупными технологическими компаниями и хоббистами Hugging Face стремится собрать обширный репозиторий данных, включающий тербайты бортовых видеозаписей, отформатированных с помощью легковесного LeRobotDataset для быстрого загрузки и скачивания через хаб Hugging Face.
Каден подчеркнул в X: "Мы создаем разнообразное сообщество из разных областей программного и аппаратного обеспечения для разработки следующего поколения умных роботов в реальном мире." Это отражает инклюзивное видение проекта.
Снижение барьеров для входа и поощрение атмосферы совместного обучения и ресурсов позволит Hugging Face воспитать сообщество, способное переопределить будущее AI робототехники.