現(xiàn)階段,人工智能顯然離不開“人工”。
01
數(shù)十萬的機器人只是大號遙控玩具?
“宇樹科技做得很好,但他是在一個很基礎(chǔ) leve! 做了一個很好的集成,把它放到工廠、家庭,都不可能,而且它是全遙控的可以認為它只是比汽車的騾車還早一期的形態(tài)。”小鵬汽車董事長兼CEO何小鵬談及當(dāng)下爆火的人形機器人時,“全遙控”一詞點出了不少人心中的疑惑。
在科幻片持續(xù)十余年甚至幾十年的熏陶下,大多數(shù)人心中的人形機器人應(yīng)該是可全自主運行的,最起碼應(yīng)該是語音控制的,可誰承想花幾十萬買到的人形機器人卻是需要用遙控器控制的。
前不久,來自長沙的雷先生在網(wǎng)絡(luò)平臺發(fā)布視頻,“全國第一臺!喜提30萬的大玩具:宇樹G1人形機器人。”不過其在視頻中表示,“該機器人目前只能使用遙控操作,因為之前看過它的視頻是可以跳舞的,但是現(xiàn)在的話只能遙控,還不能跳舞,有一點小失望。但是它后期如果OTA能更新,一兩個月后能跳舞的話,我覺得還是可以的。現(xiàn)在它的功能相對簡單,就像一個兩三歲的小孩,只能做出伸手、握手、揮手、轉(zhuǎn)頭一些基本的動作。”
購買者本身也是用于租賃,出租費用每場8千,已預(yù)約到下個月
事實上,不僅僅是宇樹機器人需要操控讓不少粉絲失望,去年底特斯拉TeslaBot機器人亮相時,同樣因涉嫌真人遙控引發(fā)爭議。去過發(fā)布會現(xiàn)場的科技投資博主 CyberCat 在《硅谷 101》播客中也談到,他曾經(jīng)問過現(xiàn)場的特斯拉工作人員,這些機器人是否是遠程控制的。 對方的回答是“一定程度上是的”。
02
人形機器人為何離不開遙控器?
人形機器人要實現(xiàn)全自主運行,需要從環(huán)境感知、決策算法到多模態(tài)交互的多系統(tǒng)融合,但當(dāng)前的人形機器人無法實現(xiàn)對陌生環(huán)境的感知,更談不上自主決策與交互。
以宇樹機器人為例,其在春晚舞臺上成功實現(xiàn)梅花樁行走,得益于之前不斷地針對舞臺這一特定場景的持續(xù)訓(xùn)練實現(xiàn)的。機器人操控員通過定場景的自主訓(xùn)練不斷采集環(huán)境數(shù)據(jù),并模擬各種可能發(fā)生的情況對機器人反應(yīng)進行預(yù)先訓(xùn)練,從而實現(xiàn)觀眾眼中的“機器人自主表演”。
同時, 現(xiàn)有 AI模型對開放性任務(wù)的語義解析與動作分解存在延遲(如自然語言指令響應(yīng)需 5 秒以上),導(dǎo)致實際應(yīng)用中需通過遙控器輸入精確指令以彌補算法決策的滯后性。
再加上硬件成本限制(如核心芯片性能、傳感器精度)迫使廠商在算力分配上權(quán)衡自主功能與實時控制的需求,現(xiàn)階段更傾向后者以保證基礎(chǔ)穩(wěn)定性。
遙控是當(dāng)下“人機互動”最現(xiàn)實的路徑
從技術(shù)路徑看,宇樹G1的遙控需求與其數(shù)據(jù)驅(qū)動的發(fā)展策略密切相關(guān)。機器人上肢的抓取、疊衣服等日常動作需要極高的環(huán)境感知與微調(diào)能力。由于物理世界中的摩擦力、物體形狀等變量復(fù)雜,單純依靠算法預(yù)編程難以覆蓋所有場景。因此,通過“人肉遙控”采集真實人類動作數(shù)據(jù),成為解決這一問題的關(guān)鍵途徑。
03
點評
人形機器人的“數(shù)據(jù)饑渴”
當(dāng)前人形機器人的訓(xùn)練高度依賴模仿學(xué)習(xí)(Imitation Learning),即通過大量人類動作數(shù)據(jù)優(yōu)化模型。
特斯拉、宇樹等企業(yè)通過招募數(shù)據(jù)采集員,穿戴動作捕捉設(shè)備執(zhí)行日常任務(wù)(如疊衣服、系鞋帶),生成機器人的訓(xùn)練數(shù)據(jù)集,而這種數(shù)據(jù)采集分為遙操作數(shù)據(jù)和虛擬環(huán)境數(shù)據(jù)兩類,前者操作員通過動作捕捉服實時控制機器人,記錄其關(guān)節(jié)轉(zhuǎn)角和環(huán)境反饋,生成高精度、可直接復(fù)用的數(shù)據(jù),后者則是由操作員在模擬場景中操控虛擬機械臂,結(jié)合物理引擎生成半合成數(shù)據(jù),降低實際硬件損耗風(fēng)險。
宇樹科技在動作捕捉領(lǐng)域的合作伙伴諾亦騰指出,2023年后機器人企業(yè)對動捕設(shè)備的需求激增,訂單量增長超6倍,印證了數(shù)據(jù)采集的規(guī)模化需求。因此,這種“人肉遙控”的本質(zhì),其實是通過人類示范填補機器人動作庫的空白,尤其在復(fù)雜場景中實現(xiàn)泛化能力。
盡管當(dāng)前依賴人類示范,宇樹科技創(chuàng)始人王興興認為,機器人AI模型的突破將逐步減少對“人肉遙控”的依賴。他預(yù)測,通用型機器人AI模型可能在2025年后出現(xiàn),結(jié)合大語言模型的多模態(tài)能力,最終實現(xiàn)自主決策與動作生成。
微信訂閱
歡迎通過郵局渠道訂閱2025年《電腦報》
郵發(fā)代號:77-19
單價:8元,年價:400元
編輯|張毅
主編|黎坤
總編輯|吳新
爆料聯(lián)系:cpcfan1874(微信)
壹零社:用圖文、視頻記錄科技互聯(lián)網(wǎng)新鮮事、電商生活、云計算、ICT領(lǐng)域、消費電子,商業(yè)故事。《中國知網(wǎng)》每周全文收錄;中國科技報刊100強;2021年微博百萬粉絲俱樂部成員;2022年抖音優(yōu)質(zhì)科技內(nèi)容創(chuàng)作者
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.