99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

MIT開發新方法,無需從頭訓練機器人即可執行復雜任務

0
分享至


(來源:MIT News)

在經典動畫《杰森一家》中,機器人女傭 Rosie 可以輕松地從打掃房間切換到做飯、倒垃圾。然而在現實中,訓練一個通用機器人卻是極大的挑戰。

通常,工程師會為某一特定的機器人和任務收集專門的數據,在一個受控環境中對其進行訓練。然而,這種數據收集不僅成本高昂且耗時,并且機器人在陌生環境或新任務下往往難以適應。

為了訓練更高效的通用機器人,MIT 的研究人員開發了一種靈活的技術,將來自多種來源的大量異質數據整合到一個系統中,以此來教授機器人多種任務。

這種方法通過對來自不同領域的數據(如仿真數據和實際機器人數據)以及多種模態(如視覺傳感器和機械臂位置編碼器)進行對齊,將它們轉化為一種“通用語言”,使得生成式 AI 模型可以處理。

通過整合大量數據,這一方法可以用于訓練機器人執行多種任務,而不必每次都從頭開始訓練。

這種方法不僅比傳統技術更快速、成本更低,而且在模擬和現實實驗中,相比從零開始的訓練提高了超過 20% 的性能。

“在機器人學領域,大家常說訓練數據不足。但在我看來,另一個大問題是數據來自于太多不同的領域、模態和機器人硬件。我們的研究展示了如何將這些數據整合起來訓練機器人?!彪姎夤こ膛c計算機科學(EECS)專業的研究生、論文第一作者 Lirui Wang 說道。

Wang 的合作者包括同為 EECS 研究生的 Jialiang Zhao、Meta 研究科學家Xinlei Chen,以及資深作者、EECS 副教授和計算機科學與人工智能實驗室(CSAIL)成員 Kaiming He。該研究將在神經信息處理系統會議上展示。



借鑒 LLM

機器人“策略”會接收來自傳感器的觀測數據,例如攝像頭圖像或機械臂的速度和位置測量數據,進而指導機器人如何移動、去往何處。

通常,策略通過模仿學習進行訓練,即由人類演示操作或遠程控制機器人生成數據,再將這些數據輸入 AI 模型中進行學習。然而,由于這種方法使用的任務數據量較少,機器人在環境或任務發生變化時往往表現不佳。

為此,Wang 和他的團隊借鑒了 GPT-4 等大型語言模型的理念。

這些模型在訓練初期使用大量多樣化的語言數據進行預訓練,隨后再通過少量的任務數據進行微調,如此大量的預訓練數據使得模型能適應多種任務。

“語言領域中的數據都是句子,而機器人數據的多樣性極大。如果想以類似的方式進行預訓練,我們就需要不同的架構?!彼f道。

機器人的數據形式多樣,從攝像頭圖像到語言指令,再到深度圖像。同時,每臺機器人在機械上也各不相同,臂數、夾持器和傳感器的排列各異,數據收集的環境也千差萬別。

MIT 的研究人員因此開發了一種新架構,稱為異質預訓練變換器(HPT),將這些不同模態和領域的數據統一起來。

他們在架構的核心部分引入了一種名為變換器的機器學習模型,用于處理視覺和本體感受(proprioception)輸入。變換器正是大型語言模型的基礎。

研究人員將視覺和本體感受數據對齊為一種統一的輸入形式,稱為“token”,變換器可以處理,每種輸入都以相同數量的 token 表示。

接著,變換器將所有輸入映射到一個共享空間中,隨著數據處理和學習量的增加,逐漸發展為一個大型預訓練模型。變換器的規模越大,其表現也越好。

用戶只需向 HPT 提供少量關于機器人設計、設置和目標任務的數據,HPT 便能將預訓練期間獲得的知識轉移,學習新的任務。



實現靈活操作

開發 HPT 面臨的最大挑戰之一是建立用于預訓練的龐大數據集,涵蓋了 52 個數據集,包含超過 20 萬條機器人軌跡,分為四個類別,包括人類示范視頻和仿真數據。

研究人員還需要開發一種高效的方法,將來自傳感器陣列的原始本體感受信號轉化為變換器可處理的數據。

“本體感受對于實現很多靈巧的動作至關重要。由于在我們的架構中 token 數量總是相同,我們賦予本體感受和視覺相同的重要性,”Wang 解釋道。

在測試中,HPT 在模擬和現實任務中的機器人表現相比每次從零開始的訓練提升了超過 20%。即使任務與預訓練數據差異較大,HPT 的性能仍然得到了提升。

“這篇論文為跨多種機器人結構訓練單一策略提供了新的方法。這使得能夠在多樣的數據集上進行訓練,并大幅擴大了機器人學習方法的數據集規模。同時,這種方法還能快速適應新的機器人結構,這對于新型機器人設計的不斷出現尤為重要。”未參與該研究的卡內基梅隆大學機器人研究所副教授 David Held 說道。

未來,研究人員希望探索數據多樣性對 HPT 性能的提升作用,同時計劃增強 HPT,使其能夠像 GPT-4 和其他大型語言模型一樣處理無標注數據。

“我們的夢想是擁有一個通用的機器人‘大腦’,用戶無需任何訓練就能直接下載使用。雖然我們現在還處在起步階段,但會繼續努力,希望像大型語言模型的突破一樣,在機器人策略上取得突破性進展。”他表示。

該研究部分由亞馬遜大波士頓技術計劃和豐田研究院資助。

https://news.mit.edu/2024/training-general-purpose-robots-faster-better-1028

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
太慘!35歲帥哥陳進去世,生前賺幾十萬,媽媽為省錢讓回家吃中藥

太慘!35歲帥哥陳進去世,生前賺幾十萬,媽媽為省錢讓回家吃中藥

裕豐娛間說
2025-04-04 11:16:30
《人民日報》里說:教育好自己的孩子,是你此生最重要的事業

《人民日報》里說:教育好自己的孩子,是你此生最重要的事業

化作人間一簾夢
2025-04-03 09:10:46
英國82歲老爺子去世前,將65萬鎊倫敦房子送給38歲女服務員,家人怒告奪回!

英國82歲老爺子去世前,將65萬鎊倫敦房子送給38歲女服務員,家人怒告奪回!

英國那些事兒
2025-04-03 23:24:46
奉陪到底!特朗普派人向中國傳話:不“打”可以,但有一個條件

奉陪到底!特朗普派人向中國傳話:不“打”可以,但有一個條件

凌晨觀點
2025-04-03 10:17:57
各地最新最低工資標準出爐,今年有多省份上調

各地最新最低工資標準出爐,今年有多省份上調

第一財經資訊
2025-04-04 17:46:32
賈斯汀·比伯健康危機加劇,海莉緊急求助,親友呼吁外界祈禱

賈斯汀·比伯健康危機加劇,海莉緊急求助,親友呼吁外界祈禱

譯言
2025-04-03 23:59:58
被合生珠光朱氏兄弟拖垮的村民們

被合生珠光朱氏兄弟拖垮的村民們

地產壹線
2025-04-04 15:56:40
看到圖三,我默默開了一瓶勁酒……

看到圖三,我默默開了一瓶勁酒……

印象逍遙子
2025-04-02 23:27:40
上衣越來越短,褲子越來越長,女裝啥時候能回歸正常審美?網友吐槽:比童裝還小,連個口袋都沒有

上衣越來越短,褲子越來越長,女裝啥時候能回歸正常審美?網友吐槽:比童裝還小,連個口袋都沒有

觀威海
2025-04-04 14:54:18
中美若脫鉤,下一階段怎么走?兩國底牌全曝光

中美若脫鉤,下一階段怎么走?兩國底牌全曝光

劉振起觀點
2025-04-04 21:04:02
大量證券公司的小主機流入閑魚,二手49元,背面接口一大堆

大量證券公司的小主機流入閑魚,二手49元,背面接口一大堆

金科技觀察家
2025-04-03 19:49:07
緬甸地震后毒蛇“大逃亡”,千萬要警惕

緬甸地震后毒蛇“大逃亡”,千萬要警惕

緬甸中文網
2025-04-04 14:41:48
劉維偉出軌風波升級!辛莎莎履歷被扒,海量生活照曝光太漂亮!

劉維偉出軌風波升級!辛莎莎履歷被扒,海量生活照曝光太漂亮!

古希臘掌管松餅的神
2025-04-03 15:10:24
中美的貿易戰,各自受傷,但損失應該中國大一些,因為中美貿易

中美的貿易戰,各自受傷,但損失應該中國大一些,因為中美貿易

叮當當科技
2025-04-04 08:13:11
《浪姐6》劇本翻車!何泓姍淘汰后硬剛節目組:老娘可不是王蓉

《浪姐6》劇本翻車!何泓姍淘汰后硬剛節目組:老娘可不是王蓉

凱澤看世界
2025-04-02 00:26:55
從“鐵榔頭”到“整容狂魔” ,65歲醫美失敗的郎平,現狀令人唏

從“鐵榔頭”到“整容狂魔” ,65歲醫美失敗的郎平,現狀令人唏

同知
2025-04-02 17:16:39
越南談中越戰爭:若中國3月5日不撤軍,諒山主力將成建制被消滅

越南談中越戰爭:若中國3月5日不撤軍,諒山主力將成建制被消滅

正觀歷史
2025-04-04 13:55:11
這幾年,比暴富更重要的,是不要讓自己窮回去

這幾年,比暴富更重要的,是不要讓自己窮回去

洞見
2025-04-03 22:19:13
蔚來一ES6撞擊后起火,但車門自動解鎖,門把手自動彈開

蔚來一ES6撞擊后起火,但車門自動解鎖,門把手自動彈開

映射生活的身影
2025-04-04 12:44:18
車主怒斥花60萬買的奧迪Q8新車剛開4天出現明顯異響,7個月修4次無法解決

車主怒斥花60萬買的奧迪Q8新車剛開4天出現明顯異響,7個月修4次無法解決

觀威海
2025-04-04 09:26:24
2025-04-05 00:03:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15023文章數 513513關注度
往期回顧 全部

科技要聞

DeepSeek提出新方法 或將應用于R2

頭條要聞

美媒感慨:特朗普給了中國黃金機遇 讓他們贏得全世界

頭條要聞

美媒感慨:特朗普給了中國黃金機遇 讓他們贏得全世界

體育要聞

挑對手!恩怨局!CBA季后賽故事可太多了

娛樂要聞

汪小菲懶理S媽暗諷,帶孩子戶外散步

財經要聞

中方多箭齊發!對美加征34%關稅

汽車要聞

別克GL8陸尚內飾官圖發布 有望上海車展亮相

態度原創

游戲
本地
旅游
公開課
軍事航空

宮崎英高:會繼續開發單人游戲 新作原是NS1游戲

本地新聞

我在新昌當女主|大佛寺氛圍感拉滿 古偶頂流機位GET

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美軍持續對也門多地空襲已致257人死傷

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 南康市| 米脂县| 扎鲁特旗| 玉环县| 偏关县| 类乌齐县| 张家川| 柳林县| 万源市| 阳泉市| 平顺县| 南和县| 万山特区| 桐庐县| 交城县| 张掖市| 饶河县| 剑川县| 任丘市| 汕头市| 闽清县| 望城县| 衡山县| 离岛区| 奎屯市| 清徐县| 泗洪县| 霞浦县| 双辽市| 塔城市| 吴桥县| 将乐县| 贡嘎县| 独山县| 茶陵县| 嘉峪关市| 聂拉木县| 舟曲县| 温宿县| 射洪县| 蒙山县|