儘管對生成性人工智慧的成本和準確性存在疑慮,機器人領域正進入一個變革的階段。今天,機器人初創公司Figure宣布與ChatGPT的創造者OpenAI合作,該公司估值達26億美元,創始成員來自波士頓動力、特斯拉、谷歌DeepMind和Archer Aviation。其首個項目Figure 01人形機器人相當令人印象深刻。
在最近由Figure共同創始人兼首席執行官Brett Adcock在平台X上發布的視頻演示中,Figure 01展示了其與人類及環境互動的能力。該機器人能夠根據指令作出反應、取物(如蘋果)並進行基本對話,儘管其回答相比人類的反應稍微延遲。此外,它還能獨立完成任務,如撿垃圾和將餐具放入烘乾架。
視頻中,一名男子問:「嘿,Figure One,你現在看到什麼?」機器人回答:「我看到桌子中央的一個紅蘋果、放著杯子和盤子的烘乾架,以及你旁邊把手放在桌子上的樣子。」當人類請求食物時,機器人迅速抓起蘋果並遞給他,識別出它是桌上唯一的可食用物品。
Adcock透露,Figure的內建攝像頭與OpenAI所培訓的大型視覺語言模型(VLM)接口,但這個模型是否基於GPT-4或其他變體尚不清楚。我們已向OpenAI詢問更多信息,並將在收到回覆後更新。
值得注意的是,Adcock強調,這段視頻展示了真正的能力,無需遠程控制或速度調整,機器人的動作流暢而連貫,顯示出人形機器人技術的顯著進步,體現了機器人與用戶之間的自然互動。
然而,這個演示強調了該原型的開發需求,表明在商業部署之前還需進一步研發。Adcock預見,未來將創造出能以十億單位規模運作的人形機器人,希望能透過接管危險或不受歡迎的工作,為社會帶來積極影響。
在他的願景陳述中,Adcock闡明Figure旨在提升人類生活,並避免軍事或有害應用。Figure在OpenAI的支持下取得的進展,增加了人形機器人領域的競爭,對特斯拉的Optimus項目和與亞馬遜合作的初創公司Agility構成挑戰。新進入者如Hugging Face也在這個快速擴張的領域中尋求創新。