剛剛,稚暉君旗下創(chuàng)企智元機(jī)器人官宣了兩個(gè)新動(dòng)向——
一則是關(guān)于人事變動(dòng)。
具身智能領(lǐng)域的國(guó)際領(lǐng)軍學(xué)者羅劍嵐博士,已于近日加盟并出任首席科學(xué)家。
羅劍嵐在該領(lǐng)域已深耕10年,曾擔(dān)任Google X、Google DeepMind研究科學(xué)家,是UC伯克利17萬(wàn)引大佬Sergey Levine團(tuán)隊(duì)的核心成員。
他曾參與打造世界上首個(gè)超人類的機(jī)器人真機(jī)強(qiáng)化學(xué)習(xí)系統(tǒng)SERL/HIL-SERL——首次實(shí)現(xiàn)將任務(wù)成功率提升到100%,在全球范圍內(nèi)被廣泛應(yīng)用。
接下來(lái)他將牽頭組建「智元具身智能研究中心」,主導(dǎo)前沿算法研發(fā)與工程化落地。
另一則是關(guān)于公司新合作。
國(guó)際頂尖具身智能公司Physical Intelligence(Pi)正式和智元機(jī)器人達(dá)成合作伙伴關(guān)系,雙方將圍繞動(dòng)態(tài)環(huán)境下的長(zhǎng)周期復(fù)雜任務(wù),在具身智能領(lǐng)域展開(kāi)深度技術(shù)合作。
以及實(shí)屬罕見(jiàn)的是,在競(jìng)逐AI、機(jī)器人以及軟硬件的最前沿陣地,中美兩家明星公司,竟然聯(lián)手了。
稚暉君挖來(lái)具身智能領(lǐng)域大佬
羅劍嵐,出生于1993年,本科畢業(yè)于武漢理工大學(xué)汽車學(xué)院。其后在AI和機(jī)器人重鎮(zhèn)UC伯克利,拿到了博士學(xué)位。
從2015年開(kāi)始,也是在機(jī)器人學(xué)習(xí)領(lǐng)域初步興起的階段,他就投身了機(jī)器人研究當(dāng)中。
過(guò)程中,他逐漸將目光放在了將強(qiáng)化學(xué)習(xí)應(yīng)用到真實(shí)機(jī)器人這一細(xì)分領(lǐng)域。
在積攢了一波學(xué)術(shù)經(jīng)驗(yàn)后,2020年他毅然選擇踏入工業(yè)界,進(jìn)入谷歌多個(gè)機(jī)器人部門任職,包括Google X、DeepMind等。
在此期間,他與機(jī)器人學(xué)習(xí)領(lǐng)域的泰斗Stefan Schaal教授進(jìn)行了一系列合作,主要學(xué)習(xí)了更多從底層動(dòng)力學(xué)到上層控制的機(jī)器人系統(tǒng)知識(shí)。
值得一提的是,Stefan Schaal教授是USC機(jī)器人領(lǐng)域的領(lǐng)軍專家,曾在頂會(huì)和期刊參與發(fā)表了400多篇研究。
兩年時(shí)間,當(dāng)他所參與的項(xiàng)目被孵化為工業(yè)機(jī)器人創(chuàng)企Intrinsic后,他重新回到了伯克利從事博士后研究,師從 Sergey Levine。
Sergey Levine是UC伯克利電氣工程和計(jì)算機(jī)科學(xué)系的副教授,專注于能夠使Autonomous Agents通過(guò)學(xué)習(xí)獲得復(fù)雜行為的算法,特別是能夠使任何自主系統(tǒng)學(xué)習(xí)解決任何任務(wù)的通用方法。
Sergey Levine因兩件事而聲名遠(yuǎn)播。
一是他是領(lǐng)域內(nèi)的大神,不僅谷歌學(xué)術(shù)被引用量為超過(guò)12.7萬(wàn),還是不折不扣的頂會(huì)狂魔。
此前的不完全統(tǒng)計(jì)中,Sergey Levine 2018年在ML和NLP頂會(huì)上共發(fā)表22篇論文;ICML 2019,他參與論文數(shù)量排名第三;NeurIPS 2019、NeurIPS 2020,他均有12篇論文被接收……
其二,他屬于UC伯克利的網(wǎng)紅教授,此前推出的深度學(xué)習(xí)課程Deep Reinforcement Learning(課程代號(hào)CS 285)非常受歡迎。
回到羅劍嵐,正是在回歸學(xué)術(shù)界的這一時(shí)間,他參與產(chǎn)出了“強(qiáng)化學(xué)習(xí)+真機(jī)”這條路線上具有代表性的兩篇論文:SERL和HiI SERL。
SERL/HIL-SERL作為世界上首個(gè)超人類的機(jī)器人真機(jī)強(qiáng)化學(xué)習(xí)系統(tǒng),首次實(shí)現(xiàn)將任務(wù)成功率提升到100%, 在全球范圍內(nèi)被廣泛應(yīng)用。
具體而言,在SERL這項(xiàng)研究中,機(jī)器人能用20分鐘學(xué)會(huì)裝配電路板,成功率達(dá)到了100%。
這一結(jié)果真實(shí)驗(yàn)證了強(qiáng)化學(xué)習(xí)的有效性,而在這之前,該方法一直受到行業(yè)詬病。
至于HIL-SERL,則是基于SERL的升級(jí)版。不過(guò)與SERL僅依賴人類的示范不同,HIL-SERL還結(jié)合了人類的糾正來(lái)訓(xùn)練強(qiáng)化學(xué)習(xí)策略。
實(shí)驗(yàn)結(jié)果顯示,使用強(qiáng)化學(xué)習(xí)框架HIL-SERL,研究者可以直接在現(xiàn)實(shí)世界中訓(xùn)練基于視覺(jué)的通用機(jī)器人操作策略。
其中,機(jī)器人經(jīng)過(guò)1~2.5小時(shí)的訓(xùn)練后,就能完成主板、儀表盤(pán)以及正時(shí)皮帶組裝等操作任務(wù)。
更重要的是,成功率也是100%。
手握上述重要機(jī)器人學(xué)習(xí)技術(shù),羅劍嵐博士這次又選擇加入智元投身工業(yè)落地。
中美明星具身智能公司,罕見(jiàn)聯(lián)手
與此同時(shí),智元機(jī)器人這次也選擇了和一家國(guó)外同行開(kāi)展合作。
Physical Intelligence,去年3月官宣亮相的美國(guó)明星創(chuàng)業(yè)公司,其團(tuán)隊(duì)全是一群機(jī)器人和AI大佬,聯(lián)合創(chuàng)始人就有羅劍嵐博士后研究期間的導(dǎo)師Sergey Levine。
據(jù)了解,這家公司在去年11月完成了4億美元的A輪融資,融資后估值為20億美元,主要投資者包括亞馬遜創(chuàng)始人貝索斯、OpenAI、Thrive Capital等知名公司或投資機(jī)構(gòu)。
關(guān)于智元為什么會(huì)選擇這家公司合作的原因,可能還要從Physical Intelligence所推出的產(chǎn)品或技術(shù)來(lái)追蹤。
就在今年2月底,這家公司推出了“分層交互式機(jī)器人”(Hi Robot)系統(tǒng),它能夠?qū)⒁曈X(jué)-語(yǔ)言-行動(dòng)(VLA)模型,如π0 ,納入一個(gè)分層推理過(guò)程。
劃重點(diǎn),分層推理。
面對(duì)“如何讓機(jī)器人能像人類一樣執(zhí)行復(fù)雜任務(wù)”這個(gè)行業(yè)難題,Physical Intelligence早已明確給出答案:
讓機(jī)器人學(xué)會(huì)以系統(tǒng) 2思維進(jìn)行思考
合理推測(cè),未來(lái)兩家可能會(huì)在讓機(jī)器人學(xué)會(huì)推理方面展開(kāi)深度合作。
另外,據(jù)智元介紹,雙方的合作已經(jīng)初有成效,可以實(shí)現(xiàn)一個(gè)通用模型根據(jù)不同的指令輸入執(zhí)行多個(gè)任務(wù)。
同時(shí)也可以適配多種末端執(zhí)行器,包括靈巧手、平行夾爪和旋轉(zhuǎn)夾爪,并兼容魚(yú)眼和針孔相機(jī)等多種傳感器。
從演示demo可以看到,視頻中的智元機(jī)器人能完成在鏡子前戴上圍巾、換垃圾袋,將物品從傳送帶移入物流箱等覆蓋家庭和工業(yè)場(chǎng)景的多元復(fù)雜任務(wù)。
整體而言,對(duì)行業(yè)來(lái)說(shuō),兩家明星具身智能公司的強(qiáng)強(qiáng)聯(lián)合,不僅蘊(yùn)藏了大模型推理技術(shù)在機(jī)器人領(lǐng)域的垂直應(yīng)用趨勢(shì),而且還將進(jìn)一步加速機(jī)器人真實(shí)落地家用場(chǎng)景。
One More Thing
當(dāng)然,對(duì)于智元今日的人才大新聞,背后還有一段傳奇佳話。
本科畢業(yè)于武漢理工的羅劍嵐,實(shí)際也上演了一段“爽文男主”人生。
因?yàn)閺闹袊?guó)一所211大學(xué)本科,能夠拿到UC伯克利競(jìng)爭(zhēng)激烈的王牌專業(yè)offer,并且碩博連讀,每年5萬(wàn)美元獎(jiǎng)學(xué)金!羅劍嵐的故事堪稱傳奇,甚至被專門報(bào)道過(guò)。
據(jù)《長(zhǎng)江日?qǐng)?bào)》2015年報(bào)道稱,當(dāng)年UC伯克利的機(jī)器人方向博士生競(jìng)爭(zhēng)非常激烈,收到了全球1500份申請(qǐng),而招生名額僅有30個(gè),最后羅劍嵐成功脫穎而出,還打破了紀(jì)錄——成為唯一一位被機(jī)器人和智能機(jī)器實(shí)驗(yàn)室錄取的中國(guó)人。
在采訪中,羅劍嵐坦承自己因?yàn)樵诳蒲许?xiàng)目中關(guān)注到UC伯克利分校卡澤洛尼教授領(lǐng)銜的實(shí)驗(yàn),其后有緣又在天津舉辦的機(jī)器人研究國(guó)際會(huì)議上,獲得了直接向卡澤洛尼教授發(fā)問(wèn)的機(jī)會(huì),并進(jìn)一步在會(huì)后遞上了自己的簡(jiǎn)歷,向教授明確表達(dá):“我想讀您的研究生!”
卡澤洛尼也被年輕本科生的履歷吸引。據(jù)介紹,羅劍嵐從大二開(kāi)始就跟著武漢理工大學(xué)的導(dǎo)師田哲文做項(xiàng)目,發(fā)表了4篇核心期刊論文,參加全國(guó)和省級(jí)重大科研項(xiàng)目有5個(gè),還獲得了美國(guó)數(shù)學(xué)建模比賽一等獎(jiǎng)。
卡澤洛尼教授給他的回答是:“或許我能有機(jī)會(huì)讓你到伯克利來(lái)。”
也正是這句認(rèn)可,點(diǎn)燃了羅劍嵐心底的火苗。
回到武漢后,他又花了大半年時(shí)間,利用別人打游戲的時(shí)間,啃下了卡澤洛尼教授實(shí)驗(yàn)室發(fā)表的100多萬(wàn)字的學(xué)術(shù)資料。
其后2014年8月,羅劍嵐更是上演了一段“孤身飛赴韓國(guó)追教授”的瘋狂。
他查到卡澤洛尼教授將赴韓國(guó)參加一場(chǎng)有關(guān)機(jī)器人的國(guó)際會(huì)議,隨即辦好簽證就追了過(guò)去。并在貴賓室外,等到了卡澤洛尼教授如廁的機(jī)會(huì),再次表達(dá)了希望跟隨讀研讀博的想法。
卡澤洛尼記得羅劍嵐:哦,你住在首爾?
羅劍嵐回答:不!我住在中國(guó)武漢,我來(lái)這里見(jiàn)您,就是希望讀您的研究生!
而且也是在這次會(huì)議上,羅劍嵐的半年苦功也換來(lái)了回報(bào),他獲得提問(wèn)機(jī)會(huì),把幾個(gè)月來(lái)的思考化成幾個(gè)刁鉆的問(wèn)題拋給了教授,卡澤洛尼會(huì)后再次找到他給出認(rèn)可:“小伙子,不出意外,我想,我要把你帶到伯克利。”
于是回國(guó)后,羅劍嵐繼續(xù)與卡澤洛尼教授聯(lián)系,并附上自己的思考,通過(guò)電子郵件給對(duì)方發(fā)了過(guò)去。卡澤洛尼教授告訴他:你寫(xiě)的每篇綜述我都看了七八遍,我不敢相信這是一位來(lái)自中國(guó)的本科生所寫(xiě)。
而也是在卡澤洛尼教授力薦下,羅劍嵐在2015年夏天收到了加州大學(xué)伯克利分校的offer。
機(jī)器人和智能機(jī)器實(shí)驗(yàn)室,每年5萬(wàn)美元獎(jiǎng)學(xué)金,從全球1500份簡(jiǎn)歷中脫穎而出,成為了當(dāng)年唯一一位被該頂級(jí)實(shí)驗(yàn)室錄取的中國(guó)人。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.