宇樹機(jī)器人成賽博科比!英偉達(dá)CMU新研究,投籃模仿籃球巨星,代碼論文全開源來源:量子位 | 公眾號(hào) QbitAI 作者:明敏 發(fā)自 凹非寺
你以為的宇樹機(jī)器人(H1):
實(shí)際上的宇樹機(jī)器人(G1):輕松來一個(gè)帥氣的科比投籃。
或者是像羅納爾多那樣華麗旋轉(zhuǎn)跳躍。
英偉達(dá)卡內(nèi)基梅隆大學(xué)一起,給宇樹機(jī)器人“一雪前恥”了(doge)。
只通過一個(gè)訓(xùn)練框架,機(jī)器人就能成為“學(xué)人精”,完成各種高難度敏捷動(dòng)作。
從這樣(下左圖)變成這樣(下右圖)。
左圖演我做運(yùn)動(dòng)
要知道,由于仿真環(huán)境和真實(shí)物理世界之間的動(dòng)力學(xué)系統(tǒng)存在偏差,讓機(jī)器人敏捷、協(xié)調(diào)地完成各種類人動(dòng)作仍舊是一個(gè)巨大挑戰(zhàn)。
ASAP方法解決的正是這個(gè)問題,論文和代碼通通開源。
有人感慨,看來機(jī)器人時(shí)代距我們只有幾步之遙。
主創(chuàng)之一Jim Fan也表示:期待2030年“人形”奧運(yùn)會(huì)吧。
顯著提高機(jī)器人靈活性和全身協(xié)調(diào)性
簡(jiǎn)單總結(jié)論文核心提出了ASAP(Aligning Simulation and Real Physics,對(duì)齊模擬與真實(shí)物理)。
這個(gè)框架主要分為兩個(gè)階段。
第一階段,使用經(jīng)過調(diào)整的人類運(yùn)動(dòng)數(shù)據(jù)在模擬環(huán)境中預(yù)訓(xùn)練運(yùn)動(dòng)跟蹤策略。
第二階段,將這些策略應(yīng)用到真實(shí)世界,并收集真實(shí)數(shù)據(jù)來訓(xùn)練一個(gè)“殘差”動(dòng)作模型,用來彌補(bǔ)模型與真實(shí)世界物理動(dòng)態(tài)之間的差距。
然后ASAP將預(yù)訓(xùn)練的策略與差異動(dòng)作模型結(jié)合,并在模擬器中進(jìn)行微調(diào),以便更好地與真實(shí)世界物理動(dòng)態(tài)對(duì)接。
具體步驟分為四步:
1、運(yùn)動(dòng)跟蹤預(yù)訓(xùn)練與真實(shí)軌跡收集:通過將人類視頻中的運(yùn)動(dòng)數(shù)據(jù)轉(zhuǎn)換為類人機(jī)器人動(dòng)作,我們?cè)谀M環(huán)境中預(yù)訓(xùn)練多個(gè)運(yùn)動(dòng)跟蹤策略,并生成真實(shí)世界的運(yùn)動(dòng)軌跡。
2、差異動(dòng)作模型訓(xùn)練:基于真實(shí)世界的運(yùn)動(dòng)數(shù)據(jù),我們訓(xùn)練一個(gè)“差異動(dòng)作模型”,通過最小化模擬狀態(tài)(s_t)和真實(shí)世界狀態(tài)(s^r_t)之間的差距來進(jìn)行優(yōu)化。
3、策略微調(diào):我們固定差異動(dòng)作模型,并將其集成到模擬器中,以調(diào)整模擬和真實(shí)物理之間的匹配,然后微調(diào)之前訓(xùn)練好的運(yùn)動(dòng)跟蹤策略。
4、真實(shí)世界部署:最后,我們將微調(diào)過的策略直接應(yīng)用到現(xiàn)實(shí)世界中,不再需要差異動(dòng)作模型。
研究人員在三個(gè)遷移場(chǎng)景中評(píng)估了ASAP的效果——
從IsaacGym到IsaacSim、從IsaacGym到Genesis,以及從IsaacGym到真實(shí)世界。
使用的機(jī)器人是宇樹G1人形機(jī)器人。
如上是從IsaacGym到IsaacSim,G1踢足球的四種不同動(dòng)作。值得一提的是,ASAP在多個(gè)動(dòng)作中訓(xùn)練,不會(huì)過擬合特定示例。
從IsaacGym到IsaacSim,從IsaacSim到真實(shí)世界,ASAP微調(diào)前后G1運(yùn)動(dòng)跟蹤表現(xiàn)如上。
在特定動(dòng)作(詹姆斯消音步)上,可以看到使用ASAP后,機(jī)器人的穩(wěn)定性更好了。
由此可以看到,G1能夠完成橫款大跳等有難度的運(yùn)動(dòng)動(dòng)作,在姿態(tài)上也和人類更為貼近。
四位華人共同一作
最后來看下研究團(tuán)隊(duì)陣容。
18位作者中絕大多數(shù)都是華人面孔。
共同一作有四位,分別是何泰然、高嘉偉、Wenli Xiao和Yuanhang Zhang。
其中何泰然本科畢業(yè)于上海交通大學(xué),現(xiàn)在是英偉達(dá)GEAR的一員,之前還在MSRA實(shí)習(xí)過。
高嘉偉本科畢業(yè)于清華大學(xué),現(xiàn)在還在申請(qǐng)博士。
Wenli Xiao也是英偉達(dá)GEAR的一員。Yuanhang Zhang本科畢業(yè)于上海交通大學(xué),現(xiàn)在在CMU讀研。
One More Thing
雖然動(dòng)作表現(xiàn)更擬人了,但是宇樹機(jī)器人還是沒逃過跳舞的命運(yùn)……
請(qǐng)欣賞宇樹版APT。
(統(tǒng)治人類后又多了一段要?jiǎng)h除的黑歷史)
項(xiàng)目地址:
https://agile.human2humanoid.com/
為偉大思想而生!
AI+時(shí)代,互聯(lián)網(wǎng)思想(wanging0123),
第一必讀自媒體
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.