宇樹機器人為何需要“人肉遙控”

2025-03-28 17:25:37　來源: 壹零社

重慶舉報

分享至

現(xiàn)階段，人工智能顯然離不開“人工”。

數(shù)十萬的機器人只是大號遙控玩具？

“宇樹科技做得很好，但他是在一個很基礎(chǔ) leve! 做了一個很好的集成，把它放到工廠、家庭，都不可能，而且它是全遙控的可以認為它只是比汽車的騾車還早一期的形態(tài)。”小鵬汽車董事長兼CEO何小鵬談及當(dāng)下爆火的人形機器人時，“全遙控”一詞點出了不少人心中的疑惑。

在科幻片持續(xù)十余年甚至幾十年的熏陶下，大多數(shù)人心中的人形機器人應(yīng)該是可全自主運行的，最起碼應(yīng)該是語音控制的，可誰承想花幾十萬買到的人形機器人卻是需要用遙控器控制的。

前不久，來自長沙的雷先生在網(wǎng)絡(luò)平臺發(fā)布視頻，“全國第一臺！喜提30萬的大玩具：宇樹G1人形機器人。”不過其在視頻中表示，“該機器人目前只能使用遙控操作，因為之前看過它的視頻是可以跳舞的，但是現(xiàn)在的話只能遙控，還不能跳舞，有一點小失望。但是它后期如果OTA能更新，一兩個月后能跳舞的話，我覺得還是可以的。現(xiàn)在它的功能相對簡單，就像一個兩三歲的小孩，只能做出伸手、握手、揮手、轉(zhuǎn)頭一些基本的動作。”

購買者本身也是用于租賃，出租費用每場8千，已預(yù)約到下個月

事實上，不僅僅是宇樹機器人需要操控讓不少粉絲失望，去年底特斯拉TeslaBot機器人亮相時，同樣因涉嫌真人遙控引發(fā)爭議。去過發(fā)布會現(xiàn)場的科技投資博主 CyberCat 在《硅谷 101》播客中也談到，他曾經(jīng)問過現(xiàn)場的特斯拉工作人員，這些機器人是否是遠程控制的。對方的回答是“一定程度上是的”。

人形機器人為何離不開遙控器？

人形機器人要實現(xiàn)全自主運行，需要從環(huán)境感知、決策算法到多模態(tài)交互的多系統(tǒng)融合，但當(dāng)前的人形機器人無法實現(xiàn)對陌生環(huán)境的感知，更談不上自主決策與交互。

以宇樹機器人為例，其在春晚舞臺上成功實現(xiàn)梅花樁行走，得益于之前不斷地針對舞臺這一特定場景的持續(xù)訓(xùn)練實現(xiàn)的。機器人操控員通過定場景的自主訓(xùn)練不斷采集環(huán)境數(shù)據(jù)，并模擬各種可能發(fā)生的情況對機器人反應(yīng)進行預(yù)先訓(xùn)練，從而實現(xiàn)觀眾眼中的“機器人自主表演”。

同時，現(xiàn)有 AI模型對開放性任務(wù)的語義解析與動作分解存在延遲（如自然語言指令響應(yīng)需 5 秒以上），導(dǎo)致實際應(yīng)用中需通過遙控器輸入精確指令以彌補算法決策的滯后性。

再加上硬件成本限制（如核心芯片性能、傳感器精度）迫使廠商在算力分配上權(quán)衡自主功能與實時控制的需求，現(xiàn)階段更傾向后者以保證基礎(chǔ)穩(wěn)定性。

遙控是當(dāng)下“人機互動”最現(xiàn)實的路徑

從技術(shù)路徑看，宇樹G1的遙控需求與其數(shù)據(jù)驅(qū)動的發(fā)展策略密切相關(guān)。機器人上肢的抓取、疊衣服等日常動作需要極高的環(huán)境感知與微調(diào)能力。由于物理世界中的摩擦力、物體形狀等變量復(fù)雜，單純依靠算法預(yù)編程難以覆蓋所有場景。因此，通過“人肉遙控”采集真實人類動作數(shù)據(jù)，成為解決這一問題的關(guān)鍵途徑。

點評

人形機器人的“數(shù)據(jù)饑渴”

當(dāng)前人形機器人的訓(xùn)練高度依賴模仿學(xué)習(xí)（Imitation Learning），即通過大量人類動作數(shù)據(jù)優(yōu)化模型。

特斯拉、宇樹等企業(yè)通過招募數(shù)據(jù)采集員，穿戴動作捕捉設(shè)備執(zhí)行日常任務(wù)（如疊衣服、系鞋帶），生成機器人的訓(xùn)練數(shù)據(jù)集，而這種數(shù)據(jù)采集分為遙操作數(shù)據(jù)和虛擬環(huán)境數(shù)據(jù)兩類，前者操作員通過動作捕捉服實時控制機器人，記錄其關(guān)節(jié)轉(zhuǎn)角和環(huán)境反饋，生成高精度、可直接復(fù)用的數(shù)據(jù)，后者則是由操作員在模擬場景中操控虛擬機械臂，結(jié)合物理引擎生成半合成數(shù)據(jù)，降低實際硬件損耗風(fēng)險。

宇樹科技在動作捕捉領(lǐng)域的合作伙伴諾亦騰指出，2023年后機器人企業(yè)對動捕設(shè)備的需求激增，訂單量增長超6倍，印證了數(shù)據(jù)采集的規(guī)模化需求。因此，這種“人肉遙控”的本質(zhì)，其實是通過人類示范填補機器人動作庫的空白，尤其在復(fù)雜場景中實現(xiàn)泛化能力。

盡管當(dāng)前依賴人類示范，宇樹科技創(chuàng)始人王興興認為，機器人AI模型的突破將逐步減少對“人肉遙控”的依賴。他預(yù)測，通用型機器人AI模型可能在2025年后出現(xiàn)，結(jié)合大語言模型的多模態(tài)能力，最終實現(xiàn)自主決策與動作生成。

微信訂閱

歡迎通過郵局渠道訂閱2025年《電腦報》

郵發(fā)代號：77-19

單價：8元，年價：400元

編輯｜張毅

主編｜黎坤

總編輯｜吳新

爆料聯(lián)系：cpcfan1874（微信）

壹零社：用圖文、視頻記錄科技互聯(lián)網(wǎng)新鮮事、電商生活、云計算、ICT領(lǐng)域、消費電子，商業(yè)故事。《中國知網(wǎng)》每周全文收錄；中國科技報刊100強；2021年微博百萬粉絲俱樂部成員；2022年抖音優(yōu)質(zhì)科技內(nèi)容創(chuàng)作者

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.