昨晚的北京,又是雷暴+大風(fēng)。
即便在屋里,都能感受到天氣的惡劣,這樣的天氣并不適合開車,因?yàn)楹苋菀装l(fā)生事故。
但是就在這樣的天氣狀況下,理想反而跑出去測(cè)試自家的智駕系統(tǒng)。
01理想暴雨夜測(cè)端到端智駕
從理想汽車董事長(zhǎng)李想本人發(fā)布的視頻可以看到,外面的雨非常大,而且視野受阻, 前方車輛都已經(jīng)打起雙閃。
要知道,暴雨這種惡劣天氣,智駕硬件比如攝像頭,感知能力會(huì)受到很大影響,進(jìn)而影響智駕表現(xiàn)。
但是理想智駕發(fā)揮,穩(wěn)穩(wěn)行駛在車道內(nèi),在紅綠燈路口前準(zhǔn)確識(shí)別響應(yīng),而且還做了變道,準(zhǔn)確而迅速。
讓人印象深刻的是,在路口右轉(zhuǎn)后碰到異形障礙物,理想智駕也能識(shí)別并做繞行。
這個(gè)表現(xiàn)確實(shí)可圈可點(diǎn)。
李想在自己微博中透露,這就是突破性的E2E+VLM技術(shù)的「自動(dòng)駕駛」。
聊這個(gè)之前,先說理想現(xiàn)在的智駕體系。
目前,理想智駕分為AD Pro和AD Max,前者基礎(chǔ),后者高階。
AD Pro引入了輕舟智航作為智駕供應(yīng)商,理想自己的精力則放在AD Max上。
2023年12月,理想給用戶推送了AD Max 3.0。
3.0將感知、規(guī)控模型化,同時(shí)引入BEV 大模型和 Occupancy 占用網(wǎng)絡(luò),讓理想做到了無圖城市NOA。
雖然從整體架構(gòu)層面來看,AD Max 3.0已經(jīng)偏向端到端,但是還沒有實(shí)現(xiàn)完全的端到端。
而這次演示的智駕版本才算是真正的端到端智駕。
02最快年底推送L3自動(dòng)駕駛
「我們認(rèn)為最早在今年年底,最晚在明年的上半年,真正的L3(有監(jiān)督的自動(dòng)駕駛),就可以批量向用戶交付。」
這是李想在前不久2024中國重慶汽車論壇上立下的flag。
注意,是自動(dòng)駕駛(L3及以上),不是輔助駕駛(L0-L2.9)。
剛剛提到的「E2E+VLM技術(shù)」就是理想實(shí)現(xiàn)自動(dòng)駕駛底氣。
理想給自動(dòng)駕駛系統(tǒng)構(gòu)建兩個(gè)系統(tǒng):快系統(tǒng)(System 1)和慢系統(tǒng)(System 2)。
這個(gè)系統(tǒng)概念來自丹尼爾·卡尼曼(Daniel Kahneman)的著作《思考,快與慢》:
系統(tǒng)一(快速思考):這是一個(gè)快速、直覺、自動(dòng)的思考系統(tǒng)。它幾乎不需要我們有意識(shí)的努力,可以迅速對(duì)信息做出反應(yīng)。系統(tǒng)一處理日常任務(wù),如識(shí)別熟悉的面孔、簡(jiǎn)單的決策和習(xí)慣行為。它依賴于啟發(fā)式和心理定勢(shì),可能快速但不總是準(zhǔn)確。系統(tǒng)一在很多情況下能夠很好地工作,但在復(fù)雜或需要深入分析的情況下可能會(huì)出錯(cuò)。
系統(tǒng)二(慢速思考):這是一個(gè)緩慢、邏輯、努力的思考系統(tǒng)。它需要我們集中注意力和精力來進(jìn)行復(fù)雜的計(jì)算、深入的思考、解決難題或評(píng)估系統(tǒng)一的直覺反應(yīng)。系統(tǒng)二在處理需要邏輯推理、風(fēng)險(xiǎn)評(píng)估和長(zhǎng)期規(guī)劃的任務(wù)時(shí)更為可靠,但它也更容易疲勞和出錯(cuò)。
在理想看來,端到端智駕是靠數(shù)據(jù)驅(qū)動(dòng),但是現(xiàn)實(shí)生活中未知場(chǎng)景/長(zhǎng)尾場(chǎng)景無窮無盡,單靠數(shù)據(jù)驅(qū)動(dòng)無法完全解決智駕遇到的問題,很多場(chǎng)景需要擁有對(duì)真實(shí)事件真正的理解和變通能力。
于是,對(duì)于L3以及L4自動(dòng)駕駛的實(shí)現(xiàn),理想引入了新方式:知識(shí)驅(qū)動(dòng)。
然后就有了這兩個(gè)快慢系統(tǒng)。
System 1(快系統(tǒng)):通過端對(duì)端,進(jìn)行快速信息輸入和響應(yīng)。
System 2(慢系統(tǒng)):通過VLM這樣的認(rèn)知模型,對(duì)周遭環(huán)境進(jìn)行分析推理并進(jìn)行邏輯思考。
在后續(xù)決策環(huán)節(jié),兩種決策結(jié)果可以進(jìn)行擬合比對(duì),給出最優(yōu)規(guī)控解。
反映到車端就是智駕能更擬人,誤觸發(fā)也會(huì)更少。比如以后在開車路上碰到前方路牌上的車輛廣告,系統(tǒng)會(huì)更精準(zhǔn)識(shí)別,不會(huì)誤觸發(fā)AEB,再比如在復(fù)雜路口,可以做更擬人的避讓通行等。
今年升級(jí)后的理想AD Max3.0換上了兩顆Orin X芯片,算力更強(qiáng),所以一顆用來跑端到端,另外一顆則用來跑壓縮后的VLM模型,就這么剛剛好。
此外,理想還有一個(gè)云端世界模型,用來訓(xùn)練這兩個(gè)快慢系統(tǒng),進(jìn)而形成完整數(shù)據(jù)閉環(huán)。
在過去幾年,理想也構(gòu)建了龐大的智駕訓(xùn)練集群以實(shí)現(xiàn)對(duì)智駕模型訓(xùn)練和快速迭代(算力1400 PFLOPS)。
一個(gè)參考數(shù)據(jù):小鵬扶搖智算中心算力600PFLOPS;毫末智行智算中心雪湖·綠洲(MANA OASIS)算力為670PFLOPS;百度給極越留的智駕算力在1.8-2.2EFLOPS;華為智駕云端訓(xùn)練算力3.5EFLOPS(真遙遙領(lǐng)先)。
今年三季度,理想將正式在全國推送無圖NOA,同時(shí)也會(huì)向測(cè)試用戶推送搭載E2E+VLM技術(shù)的「自動(dòng)駕駛」。
李想這樣說道:「隨著這套技術(shù)的演進(jìn),算力的增強(qiáng),模型的加大,我認(rèn)為無監(jiān)督的L4自動(dòng)駕駛也會(huì)在至少三年內(nèi)實(shí)現(xiàn)。」
所以,理想智駕終于要抬頭了?
03理想智駕抬頭?
現(xiàn)在的理想,比之前低調(diào)很多,在沉下心做技術(shù)。
我知道,可能部分人看到理想這樣的表現(xiàn)直接嗨了。
但是我還是要潑個(gè)冷水:現(xiàn)在還只是內(nèi)部測(cè)試,距離正式推送還有很長(zhǎng)一段時(shí)間。
就目前來看,理想的智駕挺強(qiáng),但是和絕對(duì)頭部的小鵬華為尚有差距。
要知道,在國內(nèi)端到端智駕上,小鵬和華為跑得更快。
小鵬在5月推送了國內(nèi)首個(gè)端到端智駕,2025年小鵬汽車將在國內(nèi)實(shí)現(xiàn)類L4級(jí)智駕體驗(yàn)。
華為大概率會(huì)在今年8月推送端到端智駕的ADS3.0,首發(fā)車位到車位智駕領(lǐng)航NCA。
那么,應(yīng)用「E2E+VLM技術(shù)」的新智駕,能不能讓理想扳回一局?
我說不好。
但我知道的是,理想現(xiàn)在正憋著一口氣,在合適的時(shí)候就會(huì)爆發(fā)出來。
完。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.