網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

理想暴雨夜測(cè)端到端智駕，最快年底推送L3自動(dòng)駕駛

2024-06-13 23:15:58　來源: 科技叢林

北京舉報(bào)

分享至

昨晚的北京，又是雷暴+大風(fēng)。

即便在屋里，都能感受到天氣的惡劣，這樣的天氣并不適合開車，因?yàn)楹苋菀装l(fā)生事故。

但是就在這樣的天氣狀況下，理想反而跑出去測(cè)試自家的智駕系統(tǒng)。

01理想暴雨夜測(cè)端到端智駕

從理想汽車董事長(zhǎng)李想本人發(fā)布的視頻可以看到，外面的雨非常大，而且視野受阻，前方車輛都已經(jīng)打起雙閃。

要知道，暴雨這種惡劣天氣，智駕硬件比如攝像頭，感知能力會(huì)受到很大影響，進(jìn)而影響智駕表現(xiàn)。

但是理想智駕發(fā)揮，穩(wěn)穩(wěn)行駛在車道內(nèi)，在紅綠燈路口前準(zhǔn)確識(shí)別響應(yīng)，而且還做了變道，準(zhǔn)確而迅速。

讓人印象深刻的是，在路口右轉(zhuǎn)后碰到異形障礙物，理想智駕也能識(shí)別并做繞行。

這個(gè)表現(xiàn)確實(shí)可圈可點(diǎn)。

李想在自己微博中透露，這就是突破性的E2E+VLM技術(shù)的「自動(dòng)駕駛」。

聊這個(gè)之前，先說理想現(xiàn)在的智駕體系。

目前，理想智駕分為AD Pro和AD Max，前者基礎(chǔ)，后者高階。

AD Pro引入了輕舟智航作為智駕供應(yīng)商，理想自己的精力則放在AD Max上。

2023年12月，理想給用戶推送了AD Max 3.0。

3.0將感知、規(guī)控模型化，同時(shí)引入BEV 大模型和 Occupancy 占用網(wǎng)絡(luò)，讓理想做到了無圖城市NOA。

雖然從整體架構(gòu)層面來看，AD Max 3.0已經(jīng)偏向端到端，但是還沒有實(shí)現(xiàn)完全的端到端。

而這次演示的智駕版本才算是真正的端到端智駕。

02最快年底推送L3自動(dòng)駕駛

「我們認(rèn)為最早在今年年底，最晚在明年的上半年，真正的L3（有監(jiān)督的自動(dòng)駕駛），就可以批量向用戶交付。」

這是李想在前不久2024中國重慶汽車論壇上立下的flag。

注意，是自動(dòng)駕駛（L3及以上），不是輔助駕駛（L0-L2.9）。

剛剛提到的「E2E+VLM技術(shù)」就是理想實(shí)現(xiàn)自動(dòng)駕駛底氣。

理想給自動(dòng)駕駛系統(tǒng)構(gòu)建兩個(gè)系統(tǒng)：快系統(tǒng)（System 1）和慢系統(tǒng)（System 2）。

這個(gè)系統(tǒng)概念來自丹尼爾·卡尼曼（Daniel Kahneman）的著作《思考，快與慢》：

系統(tǒng)一（快速思考）：這是一個(gè)快速、直覺、自動(dòng)的思考系統(tǒng)。它幾乎不需要我們有意識(shí)的努力，可以迅速對(duì)信息做出反應(yīng)。系統(tǒng)一處理日常任務(wù)，如識(shí)別熟悉的面孔、簡(jiǎn)單的決策和習(xí)慣行為。它依賴于啟發(fā)式和心理定勢(shì)，可能快速但不總是準(zhǔn)確。系統(tǒng)一在很多情況下能夠很好地工作，但在復(fù)雜或需要深入分析的情況下可能會(huì)出錯(cuò)。

系統(tǒng)二（慢速思考）：這是一個(gè)緩慢、邏輯、努力的思考系統(tǒng)。它需要我們集中注意力和精力來進(jìn)行復(fù)雜的計(jì)算、深入的思考、解決難題或評(píng)估系統(tǒng)一的直覺反應(yīng)。系統(tǒng)二在處理需要邏輯推理、風(fēng)險(xiǎn)評(píng)估和長(zhǎng)期規(guī)劃的任務(wù)時(shí)更為可靠，但它也更容易疲勞和出錯(cuò)。

在理想看來，端到端智駕是靠數(shù)據(jù)驅(qū)動(dòng)，但是現(xiàn)實(shí)生活中未知場(chǎng)景/長(zhǎng)尾場(chǎng)景無窮無盡，單靠數(shù)據(jù)驅(qū)動(dòng)無法完全解決智駕遇到的問題，很多場(chǎng)景需要擁有對(duì)真實(shí)事件真正的理解和變通能力。

于是，對(duì)于L3以及L4自動(dòng)駕駛的實(shí)現(xiàn)，理想引入了新方式：知識(shí)驅(qū)動(dòng)。

然后就有了這兩個(gè)快慢系統(tǒng)。

System 1（快系統(tǒng)）：通過端對(duì)端，進(jìn)行快速信息輸入和響應(yīng)。

System 2（慢系統(tǒng)）：通過VLM這樣的認(rèn)知模型，對(duì)周遭環(huán)境進(jìn)行分析推理并進(jìn)行邏輯思考。

在后續(xù)決策環(huán)節(jié)，兩種決策結(jié)果可以進(jìn)行擬合比對(duì)，給出最優(yōu)規(guī)控解。

反映到車端就是智駕能更擬人，誤觸發(fā)也會(huì)更少。比如以后在開車路上碰到前方路牌上的車輛廣告，系統(tǒng)會(huì)更精準(zhǔn)識(shí)別，不會(huì)誤觸發(fā)AEB，再比如在復(fù)雜路口，可以做更擬人的避讓通行等。

今年升級(jí)后的理想AD Max3.0換上了兩顆Orin X芯片，算力更強(qiáng)，所以一顆用來跑端到端，另外一顆則用來跑壓縮后的VLM模型，就這么剛剛好。

此外，理想還有一個(gè)云端世界模型，用來訓(xùn)練這兩個(gè)快慢系統(tǒng)，進(jìn)而形成完整數(shù)據(jù)閉環(huán)。

在過去幾年，理想也構(gòu)建了龐大的智駕訓(xùn)練集群以實(shí)現(xiàn)對(duì)智駕模型訓(xùn)練和快速迭代（算力1400 PFLOPS）。

一個(gè)參考數(shù)據(jù)：小鵬扶搖智算中心算力600PFLOPS；毫末智行智算中心雪湖·綠洲(MANA OASIS)算力為670PFLOPS；百度給極越留的智駕算力在1.8-2.2EFLOPS；華為智駕云端訓(xùn)練算力3.5EFLOPS（真遙遙領(lǐng)先）。

今年三季度，理想將正式在全國推送無圖NOA，同時(shí)也會(huì)向測(cè)試用戶推送搭載E2E+VLM技術(shù)的「自動(dòng)駕駛」。

李想這樣說道：「隨著這套技術(shù)的演進(jìn)，算力的增強(qiáng)，模型的加大，我認(rèn)為無監(jiān)督的L4自動(dòng)駕駛也會(huì)在至少三年內(nèi)實(shí)現(xiàn)。」

所以，理想智駕終于要抬頭了？

03理想智駕抬頭？

現(xiàn)在的理想，比之前低調(diào)很多，在沉下心做技術(shù)。

我知道，可能部分人看到理想這樣的表現(xiàn)直接嗨了。

但是我還是要潑個(gè)冷水：現(xiàn)在還只是內(nèi)部測(cè)試，距離正式推送還有很長(zhǎng)一段時(shí)間。

就目前來看，理想的智駕挺強(qiáng)，但是和絕對(duì)頭部的小鵬華為尚有差距。

要知道，在國內(nèi)端到端智駕上，小鵬和華為跑得更快。

小鵬在5月推送了國內(nèi)首個(gè)端到端智駕，2025年小鵬汽車將在國內(nèi)實(shí)現(xiàn)類L4級(jí)智駕體驗(yàn)。

華為大概率會(huì)在今年8月推送端到端智駕的ADS3.0，首發(fā)車位到車位智駕領(lǐng)航NCA。

那么，應(yīng)用「E2E+VLM技術(shù)」的新智駕，能不能讓理想扳回一局？

我說不好。

但我知道的是，理想現(xiàn)在正憋著一口氣，在合適的時(shí)候就會(huì)爆發(fā)出來。

完。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.