▲點(diǎn)擊圖片報(bào)名,抓住風(fēng)口(iOS用戶請(qǐng)用電腦端打開(kāi)小程序)
本期要點(diǎn):“人形”的關(guān)鍵是在于“腿”還是“手”?
你好,我是王煜全,這里是王煜全要聞評(píng)論。
最近,有關(guān)人形機(jī)器人的討論非常火熱,各類進(jìn)展也層出不窮。無(wú)論是國(guó)內(nèi)一些人形機(jī)器人能夠模仿拳擊動(dòng)作、學(xué)會(huì)了騎自行車,還是Figure AI公司在行走步態(tài)上實(shí)現(xiàn)了對(duì)人類的模仿,都引發(fā)了廣泛關(guān)注。
很多朋友都知道,我一直不看好人形機(jī)器人產(chǎn)業(yè),并多次撰文論證了我的觀點(diǎn)。不過(guò)今天,我不是來(lái)反對(duì)人形機(jī)器人的,而是想讓大家思考一個(gè)關(guān)鍵問(wèn)題:我們現(xiàn)在在大力發(fā)展的,究竟是“人形”機(jī)器人,還是僅僅是“雙足”機(jī)器人?
先說(shuō)我的結(jié)論,很明顯,我們發(fā)展的,不過(guò)是“雙足”機(jī)器人而已。
當(dāng)前的各類進(jìn)展,都集中于機(jī)器人的腿部,而人類真正的核心優(yōu)勢(shì)在于上肢的靈活性以及手眼腦的結(jié)合,但這一塊的進(jìn)展十分緩慢。所以,我認(rèn)為,現(xiàn)在的這些機(jī)器人還遠(yuǎn)遠(yuǎn)稱不上“人形”。
因此,我們要大力發(fā)展人形機(jī)器人產(chǎn)業(yè),首先應(yīng)該破除對(duì)于腿和行走的“信仰”。可以說(shuō),當(dāng)前過(guò)度強(qiáng)調(diào)腿部功能,是一種資源和關(guān)注點(diǎn)的錯(cuò)配。
許多人一提到要開(kāi)發(fā)個(gè)“人形”機(jī)器人,就認(rèn)為必須先解決“腿”的難關(guān)。然而現(xiàn)實(shí)卻是,“腿”并不是機(jī)器人最大的瓶頸。
今天,我們暫且不對(duì)機(jī)器人行走的必要性進(jìn)行討論。畢竟理論上,在上下樓梯、跨越障礙物等場(chǎng)景中,足式形態(tài)確實(shí)比輪式或履帶式更具適應(yīng)性,也不能完全否定足式行走相關(guān)研究的必要性。
但是,和相對(duì)成熟的四足不同,雙足行走需要更多的上下肢協(xié)調(diào),因?yàn)橹匦母撸簿透菀姿さ梗?strong>而這正是目前人形機(jī)器人的問(wèn)題:可能能做出復(fù)雜動(dòng)作,但不能避免摔倒。
那該怎么辦呢?問(wèn)題的解就藏在我們每個(gè)人的身體結(jié)構(gòu)里。大家是否注意到,人類無(wú)論是攀爬、跑步、變向以及在失去平衡時(shí)來(lái)恢復(fù)身體的穩(wěn)定,有個(gè)部位的作用都不可或缺,那就是腰部。
現(xiàn)有的機(jī)器人,其下肢動(dòng)作和上肢基本沒(méi)有協(xié)同,因?yàn)橄轮蛙|干之間明顯缺乏一個(gè)關(guān)鍵的“腰部”。這或許就是機(jī)器人在動(dòng)態(tài)表現(xiàn)中非常僵硬,平衡、動(dòng)作協(xié)調(diào)性和靈活性都非常不足的一個(gè)重要原因,讓整個(gè)機(jī)器人更像是一個(gè)移動(dòng)支架。現(xiàn)在的“雙足”機(jī)器人更應(yīng)該稱為“雙足移動(dòng)平臺(tái)”,和輪式、四足式移動(dòng)平臺(tái)是同一類。
所以,說(shuō)句不客氣的話,當(dāng)前的人形機(jī)器人們,連腰都沒(méi)模仿到位,怎么還敢堂而皇之的自稱為“人形”?
其次,我也反復(fù)強(qiáng)調(diào)過(guò),人類的核心優(yōu)勢(shì)并不是腿,而是靈活的上肢,以及良好的手眼腦協(xié)調(diào)能力。可是,當(dāng)前機(jī)器人上肢的研發(fā),包括手臂和手,卻沒(méi)得到足夠重視,投入不足,也導(dǎo)致了進(jìn)展緩慢。
但要注意的是,上肢比下肢可難多了。
下肢的任務(wù)就是實(shí)現(xiàn)穩(wěn)定、高效的移動(dòng)。雙足機(jī)器人模仿人類的步態(tài),雖然是有挑戰(zhàn),但也就是復(fù)現(xiàn)一種已知且相對(duì)規(guī)律的運(yùn)動(dòng)模式,頂多再應(yīng)對(duì)一下不同的地面類型就行了。
而上肢不僅要控制更多像雙手一樣更加精巧的機(jī)械結(jié)構(gòu),更關(guān)鍵的是還要具備驅(qū)動(dòng)其運(yùn)動(dòng)的“智能”,才能夠與真實(shí)的物理世界進(jìn)行精細(xì)交互。
要知道,抓取一個(gè)物體,不僅是定位目標(biāo)再閉合手指那么簡(jiǎn)單。就像我們給了機(jī)器人一句“快點(diǎn)給我擰開(kāi)這個(gè)瓶蓋”的簡(jiǎn)單指令,對(duì)于機(jī)器人而言卻是個(gè)非常復(fù)雜的任務(wù)。
它需要理解瓶子的材質(zhì),判斷軟硬、粗糙程度,要理解瓶子的形狀,才知道抓哪里更好,要 知道瓶子的重量和重心,才能把瓶子拿穩(wěn);還需要感知接觸力的大小和分布,需要理解和預(yù)測(cè)瓶子在被拿起、移動(dòng)、放置過(guò)程中的動(dòng)態(tài)變化。
甚至需要理解任務(wù)指令與物體還有環(huán)境的關(guān)系,比如“快點(diǎn)”究竟要多快,這個(gè)瓶蓋怎樣才能快速擰開(kāi)等等。
然而,當(dāng)前的大語(yǔ)言模型LLM很可能不適用于解決物理交互中的深層理解和決策問(wèn)題。我們需要一種新的、更能體現(xiàn)物理規(guī)律和因果關(guān)系的AI。
因此,“物理人工智能”或“世界模型”的概念應(yīng)運(yùn)而生,其目的在于讓AI在內(nèi)部構(gòu)建對(duì)物理世界運(yùn)行規(guī)律的模擬和預(yù)測(cè)能力。不僅能像“貓”一樣,自主規(guī)劃并執(zhí)行動(dòng)作,還能像人一樣,“感受”和學(xué)習(xí)、總結(jié)物理規(guī)律。這些事情不是僅僅依賴更大規(guī)模的數(shù)據(jù)和訓(xùn)練就能實(shí)現(xiàn)的。
目前這方面的發(fā)展尚處于非常初級(jí)的階段,甚至還沒(méi)達(dá)到當(dāng)年深度學(xué)習(xí)模型剛剛能在圖片中識(shí)別出“貓”的階段,因?yàn)橛行Ю斫馕锢斫换サ哪莻€(gè)模型的算法架構(gòu)以及訓(xùn)練方法都還在探索之中,還未得到驗(yàn)證。
所以,最后,我的判斷是,我們距離真正意義上的、能為我們普遍提供服務(wù)的通用機(jī)器人,還有相當(dāng)長(zhǎng)的路要走。
很明顯,這個(gè)路不是靠“走”出來(lái)的,而是靠“摸”出來(lái)的,而且需要理論和實(shí)踐的共同進(jìn)步。產(chǎn)業(yè)和研究的重心需要從單純的“腿”部移動(dòng)能力,轉(zhuǎn)向更為關(guān)鍵、也更為艱難的“上肢”操作能力。
只有當(dāng)機(jī)器人的上肢能夠像人一樣靈活、自主地與物理世界交互時(shí),我們才能真正的叫它一句“humanoid robots”(人形機(jī)器人)。當(dāng)然,我想到那時(shí),對(duì)于腿的盲目推崇或許也就不攻自破了。
以上就是今天的內(nèi)容,最后再做個(gè)預(yù)告,在今天晚上的特訓(xùn)營(yíng)直播課上,我將做一期加餐課,為你深入剖析特朗普“對(duì)等關(guān)稅”的影響,以及應(yīng)對(duì)之策,如果你感興趣,歡迎掃碼加入,和我一起,先人一步,看清未來(lái)!
王煜全要聞評(píng)論,我們明天見(jiàn)。
↓長(zhǎng)按圖片掃碼報(bào)名, 先人一步,領(lǐng)先一路
【科技特訓(xùn)營(yíng)】看懂科技產(chǎn)業(yè),離不開(kāi)長(zhǎng)期觀察。線上書(shū)院模式,與王老師深度鏈接!為未來(lái)五年做好準(zhǔn)備,先人一步,領(lǐng)先一路!
↓¥399,掌握王煜全AI產(chǎn)業(yè)預(yù)測(cè)精華(iOS用戶請(qǐng)?jiān)陔娔X端打開(kāi))
此外,我們還為您準(zhǔn)備了一份清單
“全球人形機(jī)器人企業(yè)TOP10”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.