99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

周光最新海外演講:VLA的關(guān)鍵挑戰(zhàn),以及仿真數(shù)據(jù)的短板

0
分享至

1月22日,在第17屆日本國際汽車工業(yè)技術(shù)展上,元戎啟行CEO周光發(fā)表了一場演講,對VLA模型(Vision Language Action Model,視覺語言動作模型)的特點進行了簡要介紹,并宣布該公司已與某頭部車企達成量產(chǎn)合作,共同推出搭載VLA模型的智能駕駛汽車,該車配備英偉達Thor芯片,將于今年投入消費者市場。

RoboX將本次周光的演講內(nèi)容進行了翻譯和整理,供大家參考。

高精地圖就像「作弊」

“高精度地圖雖然在十年前非常有用,能幫助車輛定位,但這種方式更像是一種‘作弊’,因為它只能在限定范圍內(nèi)規(guī)避一定問題。”周光表示,最典型的案例就是傳統(tǒng)基于規(guī)則的Robotaxi,至今仍只能在特定區(qū)域運營。



另外,自然還有高精度地圖一直被詬病的「高成本」、「難以保持鮮度」等問題。

相比來看,無圖化的「端到端」方案的優(yōu)勢在于:

  • 實時感知和重建:車輛能夠?qū)崟r感知周圍環(huán)境,并根據(jù)感知結(jié)果做出決策,而不是依賴于預(yù)先繪制的高精度地圖。這使得車輛能夠適應(yīng)各種突發(fā)情況和道路變化。
  • 處理長尾情況:傳統(tǒng)基于規(guī)則的自動駕駛系統(tǒng)往往難以處理長尾情況,因為這些情況通常沒有在規(guī)則中明確列出。而端到端解決方案則能夠通過學(xué)習(xí)大量數(shù)據(jù)來適應(yīng)這些情況。
  • 可擴展性和泛化性:由于基于神經(jīng)網(wǎng)絡(luò),端到端解決方案可以很容易地擴展到數(shù)百萬輛車上,并且具有很強的泛化能力,可以在全球范圍內(nèi)使用。

VLA,將讓智駕更強大

周光稱,在過去的兩年里,自動駕駛技術(shù)的進步遠遠超過了過去的20年,尤其是在結(jié)合了大語言模型之后。

2022年,元戎啟行(以下簡稱「元戎」)不需要高精地圖和高精定位,并將多個模塊全部融合到一個通用感知網(wǎng)絡(luò)中。該網(wǎng)絡(luò)可以檢測到3D動態(tài)障礙物和靜態(tài)物體,例如地標、邊界等等。

同年,元戎又開始使用深度學(xué)習(xí)方法來處理決策和規(guī)劃,但那時性能還不夠理想。



2023年,元戎進行了端到端的初步測試,并于2024年開始開發(fā)下一代端到端技術(shù)——視覺-語言-動作模型(VLA)。

“VLA與最新的生成式大模型相結(jié)合,讓自動駕駛功能更強大。今年,這一新技術(shù)將被集成到量產(chǎn)車中,并實現(xiàn)交付。“周光說道。

他介紹稱,傳統(tǒng)的感知網(wǎng)絡(luò)利用的是結(jié)構(gòu)數(shù)據(jù)。而神經(jīng)網(wǎng)絡(luò)會使用原始向量,而且是高維向量,這些向量在神經(jīng)模塊之間傳遞信息,并通過超高帶寬進行信息交換,避免信息丟失。

元戎的DeepRoute IO正是這樣一個系統(tǒng)——IO代表輸入和輸出,即輸入數(shù)據(jù),輸出控制命令,這意味著它是一個單一的神經(jīng)網(wǎng)絡(luò)。

傳統(tǒng)方案與VLA、端到端的本質(zhì)區(qū)別

“我認為VLA是端到端2.0。在第一代端到端的架構(gòu)中,已經(jīng)沒有太多代碼了。它就像神經(jīng)網(wǎng)絡(luò)或者大語言模型一樣,從底端直接輸入,并輸出結(jié)果。”

要想搞清楚VLA方案,首先要搞清楚「輸入、輸出、視覺編碼器、文本編碼器,軌跡解碼器」,以及它們?nèi)绾喂ぷ鳌?/p>



周光解釋稱,所謂的「輸入」,就是從攝像頭、導(dǎo)航系統(tǒng)、地圖等接收的「輸入」信號。輸入要通過兩個編碼器,文本編碼器(text encoder)和視覺編碼器(vision encoder)。

視覺編碼器對圖像進行編碼,并從中提取高級特征;而文本編碼器,更多代表著用戶與汽車的交互。

“在傳統(tǒng)方案中,會生成各類特征。雖然看起來簡單,實際上它背后的網(wǎng)絡(luò)復(fù)雜得多。它結(jié)合了文本特征等,然后通過模型進行輸出。”

至于「輸出」,是由軌跡解碼器(trajectory decoder)把模型的輸出轉(zhuǎn)換成系統(tǒng)能理解的軌跡信號,它負責告訴用戶接下來10秒,乃至30秒中,車輛會做什么,也就是給出帶有速度和路徑的軌跡。

同時,「文本解碼器」也會解釋下一步動作的原因。例如,“有兩個行人正在試圖過馬路,車輛需要減速并等他們通過。”



相比之下,基于端到端技術(shù)的自動駕駛解決方案則更加高效,這種方案通過實時感知和重建世界,能夠處理各種復(fù)雜和長尾的情況。

“由于它是基于神經(jīng)網(wǎng)絡(luò)的,因此具有很強的泛化能力,可以適應(yīng)全球范圍內(nèi)的不同道路和環(huán)境。”

周光表示,在端到端技術(shù)加持下,軌跡解碼器就像人類大腦一樣工作,而不是像規(guī)則。

他介紹稱,VLA的關(guān)鍵特性是「思維鏈」:“因為現(xiàn)實世界要復(fù)雜得多,規(guī)則庫無法應(yīng)對這種復(fù)雜度。你需要通過多重信息來決定如何通過復(fù)雜場景,也需要不斷地與其他車輛博弈、交互。”

他為VLA的思維鏈舉了個例子,例如潮汐車道,基于VLA的智能駕駛車輛,能通過文本等看懂可逆車道的道路標志,并從多重信息中確認此時的潮汐車道是否可行駛,并通過轉(zhuǎn)向燈等與其他車輛交互,隨即變換車道,進行轉(zhuǎn)向,最終行駛至潮汐車道中。

這一系列動作都是使用VLA進行的,它可以利用類人的思維,通過對全局上下文的了解,去了解車道的情況,與其他車輛交互,并做出最優(yōu)的、安全的決策。

在周光看來,VLA相比目前的端到端具備兩點關(guān)鍵提升:

首先,它更具適應(yīng)性,也就是VLA可以適應(yīng)并處理復(fù)雜的現(xiàn)實世界場景;

其次,是透明度,也就是它會解釋動作及軌跡原因,“傳統(tǒng)的數(shù)據(jù)系統(tǒng)需要解釋代碼,但是作為人類,我可以自然解釋操控原因,這就是高級推理。VLA正是具備了這樣的高級推理,因為它采用了全局信息和長上下文(context)信息,它可以做出更好的決策并提高安全性。

VLA的關(guān)鍵挑戰(zhàn)

然而,VLA技術(shù)仍然存在許多重大挑戰(zhàn)。首當其沖的,自然還是數(shù)據(jù),而且周光還強調(diào)了真實數(shù)據(jù)的重要性。

“真實世界的數(shù)據(jù)是不同的,它涵蓋了大量的環(huán)境變化,例如閃電、天氣等。這就是我們?yōu)槭裁词褂谜鎸嵤澜鐢?shù)據(jù)的原因,因為合成數(shù)據(jù)無法完整覆蓋這些變化。還有更重要的一點,就是合成數(shù)據(jù)缺乏關(guān)鍵狀態(tài)。例如行人違規(guī)橫穿馬路等場景,是在模擬中是無法得到的。”

對于這點,周光認為,量產(chǎn)車的規(guī)模,決定了迭代的速度:“我們每個月出貨量都在萬臺規(guī)模,擁有大量數(shù)據(jù)來開發(fā)VLA模型。在中國,我們在全國范圍內(nèi)進行測試,收集數(shù)據(jù)。由于中國各地的天氣條件、不同城市都有差異,我們可以覆蓋各種場景,并收集足夠的數(shù)據(jù)用于訓(xùn)練。”

另外,「實時響應(yīng)」也是一個很大的挑戰(zhàn)。大模型需要數(shù)十億量級的參數(shù),以及數(shù)千種類型的計算。所以元戎選擇與英偉達共同開發(fā)VLA模型,再加上元戎自己的推理引擎,可通過AI推理最大限度地提高模型性能。

“我們可以在100毫秒內(nèi)對情況做出響應(yīng),這比人類還快。”

當周光提及近期在美國測試特斯拉FSD最新版本的感受時,他表示FSD的整體表現(xiàn)非常流暢、自然且可預(yù)測。

“但我也注意到了特斯拉數(shù)據(jù)的不足——美國灣區(qū)的車輛相比國內(nèi)少得多,人流量、電動車的密度等都比中國低。如果想在中國部署這個系統(tǒng),這些數(shù)據(jù)都是缺乏的。”

他認為,擁有足夠的臨界態(tài)數(shù)據(jù),才意味著可以更好地和參與交通的其他車輛、行人進行交互。“我確信特斯拉也在使用相同的技術(shù)。”

周光表示,目前元戎正與多家主機廠進行量產(chǎn)合作,其中包括了SUV、乘用車和越野車等車型。

“去年,我們有三款車型實現(xiàn)量產(chǎn),而今年會有超過10款,預(yù)計今年這些車型的產(chǎn)量將超過20萬輛,甚至更多。”



周光提及,最近元戎與Smart建立了戰(zhàn)略合作伙伴關(guān)系,同樣涉及自動駕駛。而且,第一款使用元戎解決方案的MPV也將于今年第一季度上市。

預(yù)計在今年,元戎不僅會在量產(chǎn)汽車中部署VLA模型,還會使用這些技術(shù)探索Robotaxi。

“Robotaxi是商業(yè)邏輯,而不是一項技術(shù)。我認為Robotaxi應(yīng)該使用端到端模型、使用VLA來運營。”他說道。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
印巴局勢升級,中方強調(diào)3句話,措辭很強烈

印巴局勢升級,中方強調(diào)3句話,措辭很強烈

文雅筆墨
2025-04-25 20:12:46
小米員工:記錄一下漲薪經(jīng)歷。19年26萬......24年96萬,25年0萬

小米員工:記錄一下漲薪經(jīng)歷。19年26萬......24年96萬,25年0萬

螞蟻大喇叭
2025-04-17 17:05:39
現(xiàn)在高價賣掉房子的人,都將后悔?新定調(diào),2025年房產(chǎn)或開始洗牌

現(xiàn)在高價賣掉房子的人,都將后悔?新定調(diào),2025年房產(chǎn)或開始洗牌

巢客HOME
2025-04-24 08:40:02
中國發(fā)現(xiàn)第一毒蛇---白頭蝰

中國發(fā)現(xiàn)第一毒蛇---白頭蝰

心中的麥田
2025-04-25 16:49:57
阿嬌胖出圈,上熱搜!這顏值我跪了,美真沒統(tǒng)一標準!

阿嬌胖出圈,上熱搜!這顏值我跪了,美真沒統(tǒng)一標準!

觀察鑒娛
2025-04-25 09:32:13
韋德:有小卡在哈登不用砍30、40分 哈登可以到G5&G6再爆發(fā)

韋德:有小卡在哈登不用砍30、40分 哈登可以到G5&G6再爆發(fā)

直播吧
2025-04-25 21:47:31
“美國談判籌碼比想象中更少,中方根本不急”

“美國談判籌碼比想象中更少,中方根本不急”

觀察者網(wǎng)
2025-04-25 19:10:07
痛心!抗癌網(wǎng)紅玲寶去世,死前睜眼張大嘴巴,很留戀紅塵世界

痛心!抗癌網(wǎng)紅玲寶去世,死前睜眼張大嘴巴,很留戀紅塵世界

魔都姐姐雜談
2025-04-19 15:31:22
女子懷疑婆婆送自己假手鐲,可婆婆說值100萬,女子偷偷去鑒寶,專家看后:你真大膽

女子懷疑婆婆送自己假手鐲,可婆婆說值100萬,女子偷偷去鑒寶,專家看后:你真大膽

財經(jīng)三分鐘pro
2024-12-07 13:06:14
樊振東震撼發(fā)聲,劉國梁下桌竟藏驚人秘密!

樊振東震撼發(fā)聲,劉國梁下桌竟藏驚人秘密!

溫讀史
2025-04-24 16:57:17
怪不得說不要和藏族男孩談戀愛!那些意想不到的經(jīng)歷,簡直太炸裂了

怪不得說不要和藏族男孩談戀愛!那些意想不到的經(jīng)歷,簡直太炸裂了

有趣的火烈鳥
2024-12-05 10:03:02
球品見人品,李夢人品沒得說!她是“十年一遇的巨星”也不為過

球品見人品,李夢人品沒得說!她是“十年一遇的巨星”也不為過

墨史軒
2025-04-24 21:07:20
美官員承認誤判 特朗普原以為中國會最早"服軟"

美官員承認誤判 特朗普原以為中國會最早"服軟"

看看新聞Knews
2025-04-25 13:11:02
杜蕾斯新晉女模身材照曝光,網(wǎng)友都不淡定了!

杜蕾斯新晉女模身材照曝光,網(wǎng)友都不淡定了!

健身迷
2025-04-23 09:42:13
“我能和你發(fā)生性關(guān)系嗎?”

“我能和你發(fā)生性關(guān)系嗎?”

法律讀品
2025-04-17 16:00:31
脫北者揭秘張成澤被捕真相:死前曾給金正恩戴綠帽,9名愛人殉葬

脫北者揭秘張成澤被捕真相:死前曾給金正恩戴綠帽,9名愛人殉葬

神秘歷史故事
2023-12-18 13:57:42
G3快船勝掘金!盧獨贊西蒙斯,倫納德贊范甘迪,約基奇自認差距!

G3快船勝掘金!盧獨贊西蒙斯,倫納德贊范甘迪,約基奇自認差距!

籃球資訊達人
2025-04-25 14:47:51
A股:剛剛,重磅會議召開,事關(guān)資本市場,給所有股民的提醒

A股:剛剛,重磅會議召開,事關(guān)資本市場,給所有股民的提醒

虎哥閑聊
2025-04-25 15:56:50
中鋒回歸,遼寧隊決戰(zhàn)廣廈12人大名單曝光,楊鳴不留情面

中鋒回歸,遼寧隊決戰(zhàn)廣廈12人大名單曝光,楊鳴不留情面

宗介說體育
2025-04-25 14:06:19
戀情危機后,關(guān)曉彤首發(fā)文引網(wǎng)友稱:這波操作真牛,鹿晗傻眼!

戀情危機后,關(guān)曉彤首發(fā)文引網(wǎng)友稱:這波操作真牛,鹿晗傻眼!

默默有話說
2025-04-24 15:02:24
2025-04-26 02:03:00
RoboX
RoboX
關(guān)注智能汽車、機器人在內(nèi)的具身智能前沿科技
125文章數(shù) 0關(guān)注度
往期回顧 全部

汽車要聞

"下一代純電寶馬"提前體驗 用代碼編譯駕駛樂趣

頭條要聞

"生母繼父殺子案"已2年 鄰居:孩子外婆曾幾月不出門

頭條要聞

"生母繼父殺子案"已2年 鄰居:孩子外婆曾幾月不出門

體育要聞

?跑得最快的院長來啦!蘇炳添擔任暨大體育學(xué)院院長

娛樂要聞

王菲被諷刺為愚婦 張柏芝最終還是贏了

財經(jīng)要聞

政治局會議傳遞積極信號 機構(gòu)熱議6大看點

科技要聞

文心模型再降價80%,李彥宏:我打下了價格

態(tài)度原創(chuàng)

親子
游戲
教育
公開課
軍事航空

親子要聞

警惕!孩子出現(xiàn)這些變化,可能是性早熟信號

最高1449元!《邊緣行者》超帥聯(lián)名限量服裝發(fā)售

教育要聞

河北某小學(xué)的一道數(shù)學(xué)新題,這題當時很多學(xué)生不會做

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:俄羅斯沒"接管"烏克蘭就是讓步

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 洪雅县| 锡林浩特市| 垦利县| 收藏| 敦化市| 驻马店市| 青海省| 河东区| 沈阳市| 永吉县| 锦州市| 温泉县| 突泉县| 龙游县| 大田县| 利津县| 遵化市| 壶关县| 司法| 刚察县| 商水县| 霞浦县| 遂昌县| 辽宁省| 陕西省| 康定县| 仁化县| 甘谷县| 中山市| 汝南县| 特克斯县| 佛冈县| 清流县| 波密县| 柘城县| 富裕县| 宁陕县| 罗田县| 阿巴嘎旗| 凤凰县| 大安市|