99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

稚暉君再放大招!智元機(jī)器人發(fā)布首個(gè)通用具身基座模型:實(shí)現(xiàn)不同形態(tài)機(jī)器人絲滑遷移,具身智能門(mén)檻狂降

0
分享至


前華為天才少年稚暉君的公司智元?jiǎng)倓偘l(fā)布了首個(gè)通用具身基座模型,名叫 啟元大模型Genie Operator-1,簡(jiǎn)稱GO-1


GO-1 背后,是智元提出的全新Vision-Language-Latent-Action (ViLLA)架構(gòu)。 簡(jiǎn)單來(lái)說(shuō),就是把之前的 VLA 架構(gòu)給進(jìn)化了,多了一個(gè) “L” – Latent(隱式),可以利用人類視頻學(xué)習(xí),完成小樣本快速泛化

而且稚暉君還透露明天還有驚喜


下面給大家劃個(gè)重點(diǎn)

ViLLA架構(gòu)

我們都知道,具身智能的關(guān)鍵在于讓機(jī)器人像人一樣感知環(huán)境、理解指令、并做出行動(dòng)。 之前的 VLA 架構(gòu)雖然能讓機(jī)器人 “看到” 和 “聽(tīng)懂”,但在真正執(zhí)行復(fù)雜動(dòng)作時(shí),中間總感覺(jué)隔著一層。 而 ViLLA 的創(chuàng)新之處,就在于它引入了“隱式動(dòng)作標(biāo)記 (Latent Action Tokens)”這個(gè)概念,巧妙地彌合了 “感知-理解” 到 “執(zhí)行” 之間的鴻溝

ViLLA 架構(gòu)的核心構(gòu)成是 VLM (多模態(tài)大模型) + MoE (混合專家模型)。 這倆組合拳打出來(lái),效果杠杠的:

  • ?VLM (多模態(tài)大模型):就像機(jī)器人的 “通用大腦”,用海量互聯(lián)網(wǎng)圖文數(shù)據(jù)訓(xùn)練,負(fù)責(zé)場(chǎng)景感知和語(yǔ)言理解。 智元這次直接用了 InternVL-2B,實(shí)力可見(jiàn)一斑。

  • ?MoE (混合專家模型):MoE 內(nèi)部又分為兩組專家:

    • ?Latent Planner (隱式規(guī)劃器):它利用大量的跨本體和人類操作視頻數(shù)據(jù),學(xué)習(xí)通用的動(dòng)作理解和規(guī)劃能力。 可以理解為機(jī)器人的 “策略中樞”,知道在不同情況下應(yīng)該怎么做。

    • ?Action Expert (動(dòng)作專家):專注于精細(xì)的動(dòng)作執(zhí)行,背后是百萬(wàn)真機(jī)數(shù)據(jù)的喂養(yǎng)。 相當(dāng)于機(jī)器人的 “精細(xì)操作手”,確保動(dòng)作的精準(zhǔn)和流暢。

三者協(xié)同工作,環(huán)環(huán)相扣:VLM 負(fù)責(zé) “看懂”,Latent Planner 負(fù)責(zé) “想明白怎么做”,Action Expert 負(fù)責(zé) “精準(zhǔn)執(zhí)行”。 這套組合拳打下來(lái),機(jī)器人就能像模像樣地完成各種復(fù)雜任務(wù)了。

隱式規(guī)劃器 (Latent Planner) 是 ViLLA 的精髓

為什么說(shuō) ViLLA 架構(gòu)中的 Latent Planner 是點(diǎn)睛之筆? 因?yàn)楦哔|(zhì)量的機(jī)器人真機(jī)數(shù)據(jù)雖然重要,但數(shù)量始終有限,遠(yuǎn)不如互聯(lián)網(wǎng)數(shù)據(jù)那樣海量。 智元很聰明地采用了“隱式動(dòng)作 (Latent Actions)”的方法,讓模型能夠從海量的異構(gòu)數(shù)據(jù)源 (包括人類操作視頻) 中學(xué)習(xí)真實(shí)世界的動(dòng)作知識(shí),并遷移到機(jī)器人操作任務(wù)中。

為了實(shí)現(xiàn)這一點(diǎn),智元還專門(mén)設(shè)計(jì)了Latent Action Model (LAM,隱式動(dòng)作模型)。 LAM 通過(guò)編碼器-解碼器結(jié)構(gòu),學(xué)習(xí)當(dāng)前幀和歷史幀之間的隱式變化,并用Latent Planner預(yù)測(cè)這些隱式動(dòng)作。 這種方法巧妙地解決了數(shù)據(jù)量不足的問(wèn)題,讓模型能夠 “站在巨人的肩膀上” 學(xué)習(xí)。

Action Expert 保證動(dòng)作的靈巧性

除了 Latent Planner,ViLLA 架構(gòu)的另一個(gè)亮點(diǎn)是Action Expert (動(dòng)作專家)。 為了讓機(jī)器人能夠高頻率、高靈巧度地操控,智元引入了 Action Expert,并采用Diffusion Model (擴(kuò)散模型)作為目標(biāo)函數(shù),來(lái)建模低層級(jí)動(dòng)作的連續(xù)分布。 Action Expert 與 Latent Planner 結(jié)構(gòu)類似,也與 VLM 主干網(wǎng)絡(luò)共享 Transformer 結(jié)構(gòu),但使用獨(dú)立的 FFN 和 Q/K/V/O 投影矩陣。 它通過(guò)Denoising Process (去噪過(guò)程)逐步回歸動(dòng)作序列,保證動(dòng)作的精細(xì)和流暢。

實(shí)驗(yàn)效果驚艷:成功率大幅提升

ViLLA 架構(gòu)的效果如何? 實(shí)驗(yàn)數(shù)據(jù)說(shuō)話! 智元在五種不同復(fù)雜度的任務(wù)上測(cè)試 GO-1,結(jié)果顯示,相比已有的最優(yōu)模型,GO-1 的平均成功率提高了 32% (46% -> 78%)! 尤其在 “倒水”、“清理桌面” 和 “補(bǔ)充飲料” 等任務(wù)上,表現(xiàn)尤為突出。 更值得一提的是,單獨(dú)驗(yàn)證 Latent Planner 的作用時(shí),發(fā)現(xiàn)增加 Latent Planner 可以提升 12% 的成功率 (66% -> 78%)。 這充分證明了 ViLLA 架構(gòu)和 Latent Planner 的有效性


GO-1 的發(fā)布,不僅僅是一個(gè)模型,更是具身智能發(fā)展的一個(gè)新里程碑。 它展現(xiàn)了四大關(guān)鍵特點(diǎn):

  1. 1.人類視頻學(xué)習(xí):GO-1 可以學(xué)習(xí)互聯(lián)網(wǎng)視頻和人類示范,更好地理解人類行為,從而更好地為人類服務(wù)

  2. 2.小樣本快速泛化:強(qiáng)大的泛化能力讓 GO-1 能夠在極少數(shù)據(jù)甚至零樣本下泛化到新場(chǎng)景、新任務(wù),大大降低了具身智能的使用門(mén)檻

  3. 3.一腦多形:GO-1 是通用機(jī)器人策略模型,可以在不同機(jī)器人形態(tài)之間遷移,快速適配不同本體,實(shí)現(xiàn)群體升智

  4. 4.持續(xù)進(jìn)化:搭配智元的數(shù)據(jù)回流系統(tǒng),GO-1 可以在實(shí)際使用中不斷學(xué)習(xí)進(jìn)化,越用越聰明

參考:

paper:

https://agibot-world.com/blog/agibot_go1.pdf

https://www.bilibili.com/opus/1042547317663596551?spm_id_from=333.1387.0.0

?星標(biāo)AI寒武紀(jì),好內(nèi)容不錯(cuò)過(guò)?

用你的在看告訴我~

求贊

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
為何說(shuō)梅毒病是最臟的病?醫(yī)生詳細(xì)講解,隔著屏幕都感到頭皮發(fā)麻

為何說(shuō)梅毒病是最臟的病?醫(yī)生詳細(xì)講解,隔著屏幕都感到頭皮發(fā)麻

奇妙的本草
2025-04-28 18:00:08
發(fā)現(xiàn)一個(gè)悲哀的現(xiàn)象:特別長(zhǎng)壽的老人,幾乎都是子女用生命在托舉

發(fā)現(xiàn)一個(gè)悲哀的現(xiàn)象:特別長(zhǎng)壽的老人,幾乎都是子女用生命在托舉

婉秋聊育兒
2025-04-26 05:24:04
之前小S怒吼否定大S珠寶被拍賣(mài),指責(zé)造謠,現(xiàn)如今疑被打臉了!

之前小S怒吼否定大S珠寶被拍賣(mài),指責(zé)造謠,現(xiàn)如今疑被打臉了!

說(shuō)說(shuō)史事
2025-04-28 08:58:00
5月起,中國(guó)將迎來(lái)“四大降價(jià)潮”?除房?jī)r(jià)外,這三類也準(zhǔn)備降價(jià)

5月起,中國(guó)將迎來(lái)“四大降價(jià)潮”?除房?jī)r(jià)外,這三類也準(zhǔn)備降價(jià)

平說(shuō)財(cái)經(jīng)
2025-04-27 07:46:37
曝廣東佛山一公司強(qiáng)制員工節(jié)假日、周末加班,加班費(fèi)每小時(shí)1元

曝廣東佛山一公司強(qiáng)制員工節(jié)假日、周末加班,加班費(fèi)每小時(shí)1元

小人物看盡人間百態(tài)
2025-04-28 13:01:43
馮德萊恩:我們無(wú)法消化產(chǎn)能過(guò)剩,也不會(huì)接受對(duì)歐盟的商品傾銷

馮德萊恩:我們無(wú)法消化產(chǎn)能過(guò)剩,也不會(huì)接受對(duì)歐盟的商品傾銷

羅sir財(cái)話
2025-04-12 20:10:51
美專家意見(jiàn)罕見(jiàn)一致,中國(guó)若一統(tǒng)兩岸,美國(guó)或只剩下一條路可走

美專家意見(jiàn)罕見(jiàn)一致,中國(guó)若一統(tǒng)兩岸,美國(guó)或只剩下一條路可走

荷蘭豆愛(ài)健康
2025-04-27 10:01:19
謝霆鋒演唱會(huì):lucas雙手接奶奶遞的水,細(xì)節(jié)曝家教張柏芝贏麻了

謝霆鋒演唱會(huì):lucas雙手接奶奶遞的水,細(xì)節(jié)曝家教張柏芝贏麻了

西瓜愛(ài)娛娛
2025-04-28 14:42:29
拜登預(yù)言成真?讓特朗普干完這四年,美國(guó)或?qū)⒊蔀槭澜缋隙?>
    </a>
        <h3>
      <a href=通文知史
2025-04-28 08:20:03
烏軍庫(kù)爾斯克擊斃車臣旅長(zhǎng),將別州控制區(qū)擴(kuò)大至300平方公里

烏軍庫(kù)爾斯克擊斃車臣旅長(zhǎng),將別州控制區(qū)擴(kuò)大至300平方公里

史政先鋒
2025-04-28 15:56:33
恒大蛀蟲(chóng)劉永灼,他揮霍敗家的瘋狂堪比許家印

恒大蛀蟲(chóng)劉永灼,他揮霍敗家的瘋狂堪比許家印

紅色鑒史官
2025-04-28 18:20:03
斯諾克世錦賽8強(qiáng)全部誕生,中國(guó)球員2人,1/4決賽對(duì)陣出爐!

斯諾克世錦賽8強(qiáng)全部誕生,中國(guó)球員2人,1/4決賽對(duì)陣出爐!

越嶺體育
2025-04-29 02:36:52
一個(gè)心理學(xué)秘密:性格太較真,愛(ài)操心背后隱藏著這樣的人格特征

一個(gè)心理學(xué)秘密:性格太較真,愛(ài)操心背后隱藏著這樣的人格特征

松果正念袁老師
2024-11-04 22:04:48
世錦賽:丁俊暉遭血洗慘敗布雷切爾,中國(guó)一哥比賽消極引熱議!

世錦賽:丁俊暉遭血洗慘敗布雷切爾,中國(guó)一哥比賽消極引熱議!

世界體壇觀察家
2025-04-29 02:30:11
漢堡主帥:球隊(duì)現(xiàn)在很困難&這是預(yù)期之中的,我們會(huì)振作起來(lái)

漢堡主帥:球隊(duì)現(xiàn)在很困難&這是預(yù)期之中的,我們會(huì)振作起來(lái)

雷速體育
2025-04-28 16:56:11
利茲聯(lián)4-0布里斯托爾城,拉馬扎尼雙響,田中碧、尼奧托破門(mén)

利茲聯(lián)4-0布里斯托爾城,拉馬扎尼雙響,田中碧、尼奧托破門(mén)

懂球帝
2025-04-29 05:06:22
美國(guó)100%想向中國(guó)開(kāi)戰(zhàn),而且比任何時(shí)候都想。

美國(guó)100%想向中國(guó)開(kāi)戰(zhàn),而且比任何時(shí)候都想。

瀘沽湖
2025-04-28 10:09:24
計(jì)劃有變,火箭老板給出休賽期引援宗旨,兩球員可完美頂替范喬丹

計(jì)劃有變,火箭老板給出休賽期引援宗旨,兩球員可完美頂替范喬丹

拾叁懂球
2025-04-28 20:22:54
帕金斯:哈里森覺(jué)得東契奇無(wú)法率隊(duì)奪冠所以交易他 華子更全面

帕金斯:哈里森覺(jué)得東契奇無(wú)法率隊(duì)奪冠所以交易他 華子更全面

直播吧
2025-04-29 00:21:07
第二個(gè)炸點(diǎn)是這個(gè)!郭正亮:違反選罷法已經(jīng)在調(diào)查,最大的都抓了

第二個(gè)炸點(diǎn)是這個(gè)!郭正亮:違反選罷法已經(jīng)在調(diào)查,最大的都抓了

新時(shí)光點(diǎn)滴
2025-04-28 17:31:28
2025-04-29 07:27:00
AI寒武紀(jì) incentive-icons
AI寒武紀(jì)
專注于人工智能,科技領(lǐng)域
652文章數(shù) 259關(guān)注度
往期回顧 全部

科技要聞

傳騰訊阿里從字節(jié)搶購(gòu)算力資源 字節(jié)否認(rèn)

頭條要聞

西班牙遭遇史上最嚴(yán)重停電 已進(jìn)入國(guó)家緊急狀態(tài)

頭條要聞

西班牙遭遇史上最嚴(yán)重停電 已進(jìn)入國(guó)家緊急狀態(tài)

體育要聞

“我們欠球迷一個(gè)冠軍慶典,現(xiàn)在可以狂歡了”

娛樂(lè)要聞

黃渤青島做東請(qǐng)客 桌上全人情世故

財(cái)經(jīng)要聞

外賣(mài)平臺(tái)陷入內(nèi)卷,傷害的是誰(shuí)?

汽車要聞

東風(fēng)日產(chǎn),重新起跑

態(tài)度原創(chuàng)

時(shí)尚
藝術(shù)
數(shù)碼
本地
軍事航空

五一,就躲在家里看書(shū)吧!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

數(shù)碼要聞

蘋(píng)果研發(fā)智能眼鏡代號(hào)“N50”,新款A(yù)pple Vision最快年底發(fā)布

本地新聞

與重慶超合拍|取景框?qū)?zhǔn)來(lái)福士,開(kāi)機(jī)你的電影感之旅

軍事要聞

普京宣布將停火72小時(shí)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 竹山县| 报价| 平度市| 黑龙江省| 襄城县| 河池市| 上高县| 红原县| 合肥市| 汤阴县| 曲阜市| 柳州市| 丹棱县| 元阳县| 隆回县| 尤溪县| 安宁市| 万安县| 韩城市| 山丹县| 莎车县| 五指山市| 井陉县| 阿克苏市| 那曲县| 湘阴县| 克东县| 潜江市| 河池市| 乌恰县| 铁力市| 嘉定区| 临漳县| 宾阳县| 滦平县| 衡阳县| 昌黎县| 怀化市| 朝阳区| 桓台县| 宜宾县|