作者| 金旺
欄目| 機器人新紀元
2024年,就在人形機器人紛紛涌入工廠時,一款人形機器人卻悄悄進入到了農(nóng)業(yè)場景,從網(wǎng)上公開視頻來看,這款人形機器人可以借助雙目立體視覺系統(tǒng)和靈巧手在農(nóng)場中執(zhí)行西紅柿采摘任務(wù)。
這款人形機器人名為曉唯,由偉景智能研發(fā)。
偉景智能成立于2016年,自2017年開始研發(fā)人形機器人,2019年第一代人形機器人在WRC 2019上亮相后,又在2021年研發(fā)出了第二代人形機器人。
盡管憑借自研的靈巧手、關(guān)節(jié)模組、控制系統(tǒng),以及立體視覺系統(tǒng),偉景智能當時的人形機器人已經(jīng)可以進行自主操作,但是偉景智能創(chuàng)始人蕫霄劍對這一代人形機器人并不滿意,他認為,這樣的人形機器人還無法成為真正走向商用化的產(chǎn)品。
在近日的第二屆中國人形機器人與具身智能產(chǎn)業(yè)大會上,蕫霄劍表示,“偉景智能將在2025年5月推出雙足版和AGV版人形機器人,這代人形機器人是能夠滿足小規(guī)模商用、具有自主操作能力和自主意識的人形機器人。”
也是在本屆大會上,我們與蕫霄劍進行了一場對話,談了談他對人形機器人的看法,以及偉景智能人形機器人不一樣的技術(shù)路線。
01 高精度立體視覺系統(tǒng),是精細化操作關(guān)鍵
問:工業(yè)用到的立體視覺系統(tǒng)與人形機器人用到的有什么差異?
董霄劍:工業(yè)立體視覺系統(tǒng)與人形機器人用到的基本相同,唯一不同的是幀率,工業(yè)場景只需要一次建模就可以進行后續(xù)工作,人形機器人需要做連續(xù)的動態(tài)跟蹤,所以幀率需要高一些。
我們現(xiàn)在在人形機器人上用到的立體視覺系統(tǒng)幀率做到了20幀,要比正常工業(yè)場景用到的高很多。
問:偉景智能的立體視覺系統(tǒng)在工業(yè)場景中采集到的數(shù)據(jù),是如何遷移到人形機器人上的?
董霄劍:我們研發(fā)的飛虎平臺是一個共享操作平臺,該平臺本身由兩部分組成,一個是立體視覺系統(tǒng),另一個是工業(yè)機器人系統(tǒng),我們的飛虎平臺已經(jīng)把這兩部分集成在了一起并在平臺上進行了打通。
問:機器人在工業(yè)場景的泛化性如何實現(xiàn)?
董霄劍:偉景智能目前對外銷售的立體視覺工業(yè)相機已經(jīng)超過1.5萬套,這些工業(yè)相機每臺每天至少要工作一兩百次,由此會產(chǎn)生大量實際工業(yè)數(shù)據(jù)。
但是我并不認為真正的機器人要走一條靠堆砌大數(shù)據(jù)來實現(xiàn)自主操作的路,這種大數(shù)據(jù)和機器人自己感知得到的數(shù)據(jù)不一樣,機器人通過立體視覺系統(tǒng)可以識別各類物體,這是機器人感知系統(tǒng)的意義。
我不認為機器人操作這件事也需要依賴大數(shù)據(jù)來實現(xiàn),我們走的是一條不同的技術(shù)路線,就像我們的機器人充電走的是“插電路線”一樣——機器人在電量不足時可以自己取下插頭,找到插座,插上插頭自己充電,是完全類人的。
這樣的認知系統(tǒng)的建立需要一個非常好的感知系統(tǒng),我們的高精度立體視覺相機目前已經(jīng)可以在任意自然光照條件下實現(xiàn)1m以內(nèi)0.2mm的感知精度。
而如果你真要做精細化操作,就必須要具備高精度的立體視覺系統(tǒng)。
02 擁抱大模型,但不走VLA路線
問:這樣的技術(shù)路線與VLA路線有何不同?
董霄劍:如果感知系統(tǒng)不好,就需要大量工作做認知系統(tǒng)的構(gòu)建,這就像一位近視600度的人類不戴眼鏡和一位正常視力的人類寫出來的字不一樣,由于看不清楚,就需要寫很多遍、做大量的訓(xùn)練。
而由于沒有很好的感知系統(tǒng),無法進行任務(wù)收斂,寫不同字時還需要重新進行訓(xùn)練。
我們有大量的工業(yè)場景數(shù)據(jù),但我們走的并不是以大數(shù)據(jù)為基礎(chǔ)的機器人運動控制訓(xùn)練(VLA)路徑,而是基于高精度立體視覺的路徑。
我們現(xiàn)在基于飛虎平臺和人形機器人產(chǎn)品,構(gòu)建一個為汽車充電或加油的機器人僅僅需要半小時就能完成功能開發(fā),如果沒有小于1mm的感知精度,這一功能的開發(fā)難度將會成倍提升。
問:大模型為偉景智能帶來了怎樣的機會?
董霄劍:如今的大模型核心還是語言大模型,它基本上掌握了人類90%以上的知識,這讓基于語言的理解控制已經(jīng)可以實現(xiàn)。
問:2021年之前,偉景智能在做前兩代機器人時做了哪些應(yīng)用測試?
董霄劍:我們2021年研發(fā)出的人形機器人的能力就已經(jīng)超出了現(xiàn)在新勢力所做的這些機器人的能力,我們那時做出的人形機器人已經(jīng)能夠?qū)崿F(xiàn)打招呼、人臉識別、自主講解等能力。
不過,我當時認為那一代人形機器人距離我對人形機器人的要求還差很遠,我當時認為,人形機器人應(yīng)該能夠像人一樣執(zhí)行任務(wù),當時最欠缺的是自然交互能力,但現(xiàn)在的大模型讓機器人的交互已經(jīng)變得很自然。
就是因為這一點,我當時沒有把它推向大規(guī)模商業(yè)化,這是令我非常遺憾的事。
但是現(xiàn)在回過頭來看,我也不確定那時如果真將人形機器人推向商業(yè)化,沒有像現(xiàn)在這樣一個人形機器人風(fēng)口,是不是也能賣出去。
03 人形機器人有泡沫,但沒有吹到偉景智能
問:去年偉景智能有嘗試將人形機器人用到農(nóng)業(yè)采摘場景,為什么會選擇這個場景?
董霄劍:因為農(nóng)業(yè)人口在中國有8億,它的市場甚至要比工廠場景還要大。
實際上,我們的人形機器人現(xiàn)在已經(jīng)在面向科研、政務(wù)、展館、農(nóng)業(yè)等場景出貨。
我們現(xiàn)在的售價在20萬元左右,我們認為未來要真正進入家庭服務(wù)場景,售價一定在15萬元以內(nèi),這也是我們未來的一個目標市場。
問:今年5月偉景智能將發(fā)布正式商用的人形機器人,這代機器人能直立站立不耗電是如何實現(xiàn)的?
董霄劍:我們的人形機器人沒有采用關(guān)節(jié)模組,而是采用了絲杠結(jié)構(gòu),這讓我們的人形機器人的腿是可以百分之百直立的,而且掉電以后推都推不動。
采用關(guān)節(jié)模組的人形機器人,要保證腿部直立狀態(tài),關(guān)節(jié)模組必須一直處于上電狀態(tài),這就帶來了一個問題,要保持站姿,關(guān)節(jié)模組會產(chǎn)生大量的熱能,這就會導(dǎo)致電機發(fā)熱嚴重,這也是為什么很多人形機器人在不行走時需要吊著的原因。
問:偉景智能的人形機器人前期有進入工廠做測試嗎?
蕫霄劍:我們在農(nóng)業(yè)采摘、農(nóng)業(yè)裝備等場景有做測試。
前幾天我也考察了我們一個潛在客戶的電路板組裝廠,他們組裝廠的每一個車間里有上百位組裝工人在打螺絲,而這種打螺絲場景對于我們來說是最簡單的事。
我們今年會正式將我們的人形機器人推向商用市場做這些事。
問:如何看當下人形機器人發(fā)展階段?機器人市場有沒有泡沫?
董霄劍:我覺得泡沫是非常明顯的,但泡沫并沒有吹到偉景智能。
從現(xiàn)在人形機器人融資環(huán)境來看,只要能攢出一臺人形機器人,有的團隊甚至連技術(shù)路線都沒想好就能拿到上億融資,這顯然是存在泡沫的。
我認為,現(xiàn)在的人形機器人首先應(yīng)該具備完全自主操作能力,否則就是個玩具,而自主操作能力一定要有自主認知系統(tǒng),要有自主認知系統(tǒng)就必須要有很好的自主感知系統(tǒng)。
我們現(xiàn)在做的人形機器人已經(jīng)細化到通過設(shè)計散熱風(fēng)道,為人形機器人本體增加散熱系統(tǒng),這些都是將人形機器人推向商業(yè)市場之前需要考慮和解決的問題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.