“最好的作品永遠(yuǎn)是下一個(gè)!”稚暉君的人形機(jī)器人又雙叒叕進(jìn)化了。
昨天稚暉君就神秘預(yù)告今天會(huì)有驚喜,沒(méi)想到驚喜程度遠(yuǎn)超想象!
鴿了兩年的科技圈頂流 UP 主稚暉君終于帶著他的王炸新作強(qiáng)勢(shì)回歸!果然,還是應(yīng)了他的經(jīng)典臺(tái)詞:“鴿得越久,搞的事越大”!
稚暉君所在的智元 X-Lab 正式推出了史上最復(fù)雜的具身智能項(xiàng)目——靈犀 X2!
這款機(jī)器人不僅是“運(yùn)動(dòng)全能王”:走路、跑步、舉重、踩滑板車、玩平衡車,樣樣精通。
還能夠像人一樣靈動(dòng)地騎自行車。
跳起網(wǎng)上爆火的“科目三”舞蹈,更是輕松拿捏。
據(jù)稚暉君透露,他悄咪咪研發(fā)了三個(gè)月,視頻又精心打磨了一個(gè)月,這才把靈犀 X2 帶到大家面前。
看到這,網(wǎng)友們直接炸鍋:看樣子以后除了買房買車這種大件,還需要買機(jī)器人了。
在最新發(fā)布的視頻中,稚暉君親自介紹了靈犀X2的創(chuàng)新亮點(diǎn)。靈犀X2搭載了情感計(jì)算引擎,融合了運(yùn)動(dòng)、交互、作業(yè)三大智能模塊,突破了傳統(tǒng)人形機(jī)器人只能執(zhí)行簡(jiǎn)單任務(wù)的局限,而且更加“有人味”。
靈犀 X2 的設(shè)計(jì)延續(xù)了稚暉君一貫的硬核風(fēng)格,全程公開(kāi)且充滿創(chuàng)新。
硬件系統(tǒng)被抽象為可復(fù)用的核心組件,包括小腦控制器Xyber-Edge、域控制器 Xyber-DCU、智能電源管理系統(tǒng)Xyber-BMS和核心關(guān)節(jié)模組,像拼積木一樣靈活組裝。
材料上,團(tuán)隊(duì)嘗試了 TPU、ETPU、EVA 等柔性材料,甚至選用過(guò)美妝蛋,最終選定了親和觸感的柔性材料。
X2 全身 28個(gè)自由度,采用仿人體串聯(lián)結(jié)構(gòu),沒(méi)有使用并聯(lián)設(shè)計(jì),既減輕了重量,又實(shí)現(xiàn)了運(yùn)控算法的完全解耦。
在算法上,團(tuán)隊(duì)從傳統(tǒng)Model-based轉(zhuǎn)向?qū)W習(xí)驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí),結(jié)合深度強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí),讓X2學(xué)會(huì)了像人一樣的運(yùn)動(dòng)能力,比如跑步、轉(zhuǎn)圈、跳舞,甚至跳“科目三”。
它還掌握了深蹲、舉杠鈴等高難度動(dòng)作,并能熟練使用滑板車、平衡車等工具。
不過(guò),訓(xùn)練過(guò)程也充滿了“翻車”時(shí)刻,比如橫著走、躺地?cái)[爛或情緒激動(dòng)地跺腳,像極了人類小孩。
交互方面,X2 搭載了基于 Diffusion 的生成式動(dòng)作引擎和多模態(tài)交互大模型“硅光動(dòng)語(yǔ)”,具備毫秒級(jí)反應(yīng)能力,能夠自然對(duì)話。
與此同時(shí),它還能模仿人類的呼吸韻律、展現(xiàn)好奇心,肢體語(yǔ)言豐富,充滿“人味兒”。
當(dāng)然,一個(gè)完美的機(jī)械伙伴,除了提供情緒價(jià)值外,還需要具備強(qiáng)大的泛化作業(yè)能力。
研究人員將操作智能的能力成功遷移到 X2 上,其本體支持柔性阻抗控制,能夠裝配包括靈巧手在內(nèi)的多種末端執(zhí)行器,完成精細(xì)操作也不在話下。
比如,四年前葡萄縫針的神技就再次在 X2 身上上演。
在具身智能方面,智元機(jī)器人開(kāi)源了業(yè)界最大的具身真機(jī)和仿真數(shù)據(jù)集之一,并提出了 RoboDual 的大小腦系統(tǒng)架構(gòu)以及基于ViLLA架構(gòu)的基座大模型“啟元”(GO-1)。
通過(guò)“啟元”大模型的一腦多形能力,X2 初步具備了簡(jiǎn)單任務(wù)中對(duì)操作物體的零樣本泛化能力。例如,它可以從貨架上準(zhǔn)確取放物品,展現(xiàn)了其適應(yīng)多樣化場(chǎng)景的能力。
此外,X2 還能夠在某些任務(wù)中實(shí)現(xiàn)多機(jī)協(xié)作,比如為同伴充電:
最后,在視頻中,稚暉君也談到靈犀 X2 的終極目標(biāo),是實(shí)現(xiàn)“機(jī)器人吉祥三保”——保安、保姆和保潔。
其實(shí),智元的野心一直都遠(yuǎn)不止于成為一家機(jī)器人制造商。智元的目標(biāo)是讓所有機(jī)器人都用上“智元大腦”。畢竟機(jī)器人只有大腦夠聰明,才能創(chuàng)造價(jià)值。
為此,智元走了一條開(kāi)放的路,除了核心的動(dòng)作編排大模型,其他技術(shù)全部開(kāi)源,包括硬件、軟件和未來(lái)數(shù)據(jù)。主打的就是一個(gè)“人形機(jī)器人人人造”。
智元希望成為機(jī)器人領(lǐng)域的“安卓系統(tǒng)”,吸引更多開(kāi)發(fā)者創(chuàng)新,加速人形機(jī)器人在工業(yè)、家庭等場(chǎng)景的普及。
盡管目前免不了有人質(zhì)疑,人形機(jī)器人是浪漫主義的陷阱。
然而,歷史滾滾向前,創(chuàng)新總在爭(zhēng)議中開(kāi)辟新路。曾被嘲笑的飛機(jī),已翱翔藍(lán)天。曾被質(zhì)疑的計(jì)算機(jī),如今無(wú)處不在。
稚暉君的新作,是否指明了家庭機(jī)器人的方向?至少,智元機(jī)器人的目標(biāo)從未改變——打造通用人形機(jī)器人。
2024 年,他們發(fā)布遠(yuǎn)征系列,實(shí)現(xiàn)初步量產(chǎn)。X-Lab 成立,開(kāi)源靈犀X1上線,邁出關(guān)鍵一步。
GO-1 大模型發(fā)布后,智元具身研究中心透露:量產(chǎn)機(jī)器人已達(dá) 1000 臺(tái)。
而現(xiàn)在,靈犀 X2 橫空出世。人形機(jī)器人的時(shí)代,或許真的近了。
參考資料:
B 站、量子位、智東西、APPSO 及其他網(wǎng)絡(luò)截圖
不吃麥芽糖
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.