文 | 308
編輯 | 經(jīng)緯
在中國智能駕駛領(lǐng)域競爭體系的排名中,理想汽車打算排在什么樣的位置?
答案是:第一名。
在成都車展期間,面對智見 Time 提出的上述問題,理想汽車智能駕駛研發(fā)副總裁郎咸朋給出了一個(gè)明確的答案,他的原話是:「我們一定希望達(dá)到第一的位置,都想爭第一,我們肯定是朝著第一去的」。
這意味著,在理想汽車為其智能駕駛設(shè)定的目標(biāo)中,它是要超越國內(nèi)所有玩家的。
但這并非容易之事。畢竟,在過去很長的一段時(shí)間里,理想汽車在智能駕駛的技術(shù)進(jìn)展和落地進(jìn)度并不算是特別靠前。其中,城市導(dǎo)航輔助駕駛此前在面向全國落地的過程中,無論是在實(shí)際技術(shù)落地的節(jié)奏上,還是在用戶認(rèn)知層面,都形成了一定的排序格局。
眼下,在端到端技術(shù)的加持下,理想汽車正試圖打破這一格局——而它的武器,卻不僅僅是端到端。
在智駕的戰(zhàn)場中,走了不少彎路
對于智能駕駛領(lǐng)域的任何一個(gè)玩家來說,端到端都不可能是一蹴而就的,也絕不是憑空而來的—— 特斯拉是如此,華為、小鵬也都是如此。
因此, 理想汽車,也并不能例外。
實(shí)際上,以 2023 年 4 月正式宣布開啟智能駕駛 3.0 時(shí)代為起點(diǎn),理想汽車在智能駕駛的上一個(gè)階段進(jìn)行了一年多的技術(shù)開發(fā)和商業(yè)落地進(jìn)程,最終在 OTA 6.0 版本中實(shí)現(xiàn)了基于無圖 NOA 的全國城市道路都能開——并且為端到端打下了前期基礎(chǔ)。
這并不是一個(gè)非常容易的過程。
2023 年 4 月,正值上海車展期間,理想汽車發(fā)布了「雙能戰(zhàn)略」,并宣布其智能駕駛進(jìn)入到 3.0 時(shí)代,也就是基于 AD Max 3.0 版本,智能駕駛的落地從高速 NOA 擴(kuò)展到城市 NOA。
從硬件層面來說,理想汽車的城市 NOA 適用于搭載雙 Orin-X 芯片和激光雷達(dá)的 AD Max 車型。
在這場發(fā)布會(huì)上,理想汽車還宣布,理想 AD Max 3.0 的城市 NOA 功能將于二季度開始推送內(nèi)測用戶,到年底將推送至 100 座國內(nèi)城市。
當(dāng)時(shí),理想汽車在AD Max 3.0 中給出的技術(shù)方案,主要是將靜態(tài) BEV 網(wǎng)絡(luò)、動(dòng)態(tài) BEV 網(wǎng)絡(luò)和 Occupancy 網(wǎng)絡(luò)融合并通過 NeRF 增強(qiáng)后,匯總到預(yù)測模型并進(jìn)行決策和規(guī)劃。
這是一個(gè)典型的分段式算法架構(gòu),并不算落后,卻很難有效支撐理想城市 NOA 的大規(guī)模落地。
于是,到了 2023 年 6 月的理想家庭科技日上,理想汽車又宣布為 AD Max 3.0 引入了NeuralPriorNet(NPN,神經(jīng)先驗(yàn)網(wǎng)絡(luò)),并且通過過大量學(xué)習(xí)人類司機(jī)在真實(shí)路口應(yīng)對信號燈變化的行為,訓(xùn)練了TrafficIntentionNet(TIN,信號燈意圖模型)。
這兩個(gè)模型的引入,讓理想汽車初步具備將城市 NOA 在特定城市落地的能力,卻很難走向泛化,在實(shí)際的落地節(jié)奏上也面臨阻礙。
這期間,理想汽車又在其智駕產(chǎn)品落地落地的節(jié)奏中,引入了通勤 NOA 的概念,這很難說是一個(gè)完全正確的決策——2023 年 8 月,在成都車展上,理想汽車關(guān)于智駕在 100 城落地的宣布口徑又從「城市 NOA」調(diào)整為「通勤 NOA」,讓外界大跌眼鏡,也在行業(yè)引發(fā)爭議。
好在,到了 2023 年 12 月,理想汽車在經(jīng)歷了一系列的高強(qiáng)度投入和算法模型重構(gòu)之后,正式面向用戶推送了 OTA 5.0 版本。
在理想汽車的官方話術(shù)中,升級到 OTA 5.0 版本之后,全場景智能駕駛將覆蓋全國所有高速公路和城市環(huán)路,以及 110 個(gè)城市的城區(qū)道路——到這個(gè)階段,理想汽車才算是完成了城市 NOA 架構(gòu)的技術(shù)驗(yàn)證和初步落地。
需要注意的是,在 OTA 5.0 版本中,理想智能駕駛在底層的算法架構(gòu)上依舊采用的是模塊化的設(shè)計(jì),其中包含感知、定位、規(guī)劃、導(dǎo)航、NPN 等,這一代架構(gòu)可以支撐理想汽車在全國 100 個(gè)城市推送城市 NOA 功能,但卻并不足以支持「全國都能開」。
這種情況下,泛化能力更強(qiáng)的無圖 NOA,成為了理想汽車的下一步選擇。
于是,在很短的時(shí)間里,理想汽車又對 AD Max 3.0 下的算法架構(gòu)進(jìn)行了重新調(diào)整,將整個(gè)模型縮減為感知和規(guī)劃兩個(gè)模塊,同時(shí)在架構(gòu)中去掉了 NPN 和對先驗(yàn)信息的依賴,并最終實(shí)現(xiàn)了對算法架構(gòu)的升級,使得城市 NOA 的落地不依賴于高精地圖。
這就是「無圖 NOA」。
2024 年 7 月 15 日,理想汽車面向普通用戶推動(dòng)了 OTA 6.0 功能,其中最大的更新點(diǎn),就是無圖 NOA,它不依賴高精地圖等先驗(yàn)信息,沒有開城限制,也不限城市、鄉(xiāng)鎮(zhèn),可以實(shí)現(xiàn)在全國范圍內(nèi)可導(dǎo)航的道路都能夠開啟 NOA。
也就是說,通過無圖 NOA 功能,理想汽車終于實(shí)現(xiàn)了「全國都能開」。
縱觀理想汽車首次發(fā)布 AD Max 3.0 到最終實(shí)現(xiàn)「全國都能開」的過程,其實(shí)很容易發(fā)現(xiàn),在過去一年多的時(shí)間里,理想汽車在智能駕駛的落地過程中確實(shí)走了一些彎路。但這種彎路其實(shí)在在一定程度上給理想汽車積累了不少技術(shù)開發(fā)和落地方面的經(jīng)驗(yàn)和教訓(xùn)。
更重要的是,正是由于這些經(jīng)驗(yàn)和教訓(xùn),讓理想汽車很好地抓住了「端到端」這個(gè)可以在智能駕駛領(lǐng)域「換道超車」的難得機(jī)遇。
算法之外,算力、數(shù)據(jù)也是挑戰(zhàn)
對于整個(gè)自動(dòng)駕駛行業(yè)來說,「端到端」并不是一個(gè)新名詞。
從全球范圍來看,特斯拉是最早在自動(dòng)駕駛的算法架構(gòu)中引入端到端方案的玩家;而馬斯克本人也在 2023 年 5 月首次對外披露了 FSD v12 版本中端到端的存在,并且在 2023 年 8 月首次進(jìn)行了 FSD V12 內(nèi)測版本的對外直播。
此后,國內(nèi)的一眾自動(dòng)駕駛玩家也紛紛參與到端到端方案的競賽中去,而這一競賽在 2024 年隨著特斯拉 FSD V12 版本的一步步推送逐漸進(jìn)入到激烈狀態(tài)。
而理想汽車毫無疑問也成為重要玩家之一。
2024 年 6 月上旬,理想汽車 CEO 李想在重慶汽車論壇的公開演講中,首次談到了理想汽車在端到端自動(dòng)駕駛方面的重要突破。
他表示,理想汽車在 2023 年 9 月專門成立了一個(gè)用于自動(dòng)駕駛研究的團(tuán)隊(duì);后來,基于《思考,快與慢》這本書的啟發(fā),理想汽車尋找到了現(xiàn)有的基于端到端技術(shù)的方案。
從技術(shù)框架的角度來說,理想汽車的這套端到端方案有三個(gè)重要板塊:
1、端到端(E2E)模型本身,即系統(tǒng) 1。
根據(jù)官方說法,它統(tǒng)合了感知、預(yù)測、決策、控制等多個(gè)模塊,采用的是 One Model 的算法架構(gòu),只有一個(gè)模型,輸入的是傳感器,輸出的是行駛軌跡——這個(gè)架構(gòu)本身,類似于特斯拉在端到端方案中提到的「Video in & Control out」。
2、VLM(視覺語言模型),即系統(tǒng) 2。
根據(jù)理想汽車官方說法,它的整體算法架構(gòu)是由一個(gè)統(tǒng)一的 Transformer 模型組成,輸出的信息包括對環(huán)境的理解、駕駛決策和駕駛軌跡,并傳遞給系統(tǒng) 1 控制車輛——本質(zhì)上,它所扮演的角色,類似于人類的綜合信息理解能力。
3、世界模型。
它主要部署在云端,其目的是用來驗(yàn)證系統(tǒng) 1 和系統(tǒng) 2 的能力,其在技術(shù)上的主要原理,借鑒了 OpenAI 在今年年初發(fā)布的 Sora。
關(guān)于世界模型與系統(tǒng) 1 和系統(tǒng) 2 之間的關(guān)系,郎咸朋表示:
世界模型對系統(tǒng) 1 和系統(tǒng) 2 來說,最大作用是提供一個(gè)訓(xùn)練和測試的場地。原來是這個(gè)場地放在真實(shí)的世界里面,我們把世界弄到模型。在世界模型里,我們的測試、錯(cuò)題、真題,都在這個(gè)世界模型中進(jìn)行訓(xùn)練。
根據(jù)理想汽車官方說法,端到端的這套方案最大的特點(diǎn)在于,它能夠通過模型實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng),從而不依賴于人類手寫的規(guī)則——也因此具備四個(gè)方面的能力:通用障礙物的理解能力,超視距導(dǎo)航能力,道路結(jié)構(gòu)理解能力,擬人的規(guī)劃能力。
換句話說,與以往方案相比,它在自動(dòng)駕駛能力方面的上限更高了。
不過,一個(gè)新的端到端技術(shù)架構(gòu),對于整個(gè)自動(dòng)駕駛技術(shù)體系的各個(gè)方面都提出了不一樣的要求。對于理想汽車來說,為了這套端到端+ VLM 架構(gòu)更好地運(yùn)行,它也做了大量的準(zhǔn)備。
比如說,在數(shù)據(jù)方面,理想汽車方面告訴智見 Time,One Model 方案的問題在于,它的訓(xùn)練難度非常大,也需要非常優(yōu)質(zhì)的訓(xùn)練數(shù)據(jù)。
實(shí)際上,理想汽車在訓(xùn)練端到端的過程中,進(jìn)行了一定的數(shù)據(jù)篩選,主要是通過打分的方式選擇「老司機(jī)」的數(shù)據(jù),而在理想汽車的車主中,被標(biāo)注為「老司機(jī)」的數(shù)據(jù)比例僅為 3%。
在算力方面,這套端到端+VLM 架構(gòu)主要涉及到兩個(gè)方面:一個(gè)是車端算力,一個(gè)云端算力。
在車端算力方面,理想汽車智能駕駛高級算法專家詹錕表示,現(xiàn)在 Orin-X 能夠完美適配這套端到端+ VLM 方案的運(yùn)行——但是隨著算力的增加,一旦理想汽車進(jìn)入到 Thor 階段,會(huì)有一個(gè)更大規(guī)模數(shù)據(jù)量訓(xùn)練的端到端大模型,效果會(huì)進(jìn)一步提升。
在云端算力方面,由于模型訓(xùn)練對于云端算力的要求,理想汽車也花了大量的功夫來提升自動(dòng)駕駛訓(xùn)練的算力;其中在成都車展期間,理想汽車表示其訓(xùn)練算力已經(jīng)達(dá)到了 5.39 EFLOPS,預(yù)計(jì)到 2024 年年底達(dá)到 8 EFLOPS 以上。
不過,在理想汽車智能駕駛研發(fā)副總裁郎咸朋的說法中,最終實(shí)現(xiàn)自動(dòng)駕駛需要的訓(xùn)練算力要達(dá)到 100 EFLOPS 的量級,折合成投入每年要超過 10 億美金。
值得強(qiáng)調(diào)的是,除了算法架構(gòu)、數(shù)據(jù)、算力等問題,理想汽車在端到端+VLM 的技術(shù)框架下還要解決方案的評估、測試等一系列問題。
根據(jù)理想汽車在 9 月 14 日發(fā)布的最新消息,全新一代智能駕駛端到端 + VLM 萬人體驗(yàn)團(tuán)已經(jīng)正式開啟推送,涵蓋 MEGA / L9 / L8 / L7 / L6 的 AD Max 車型。而根據(jù)官方說法,基于這套架構(gòu)的方案預(yù)計(jì)會(huì)在今年年底明年年初推送給廣大用戶。
不僅如此,在 理想汽車「端到端+VLM為」還面向千人用戶推送了版本號為 6.2.0(E2E-VLM Beta 4)版智駕系統(tǒng),并表示這是行業(yè)首個(gè)「車位到車位」產(chǎn)品落地體驗(yàn)。
可見,理想汽車也已經(jīng)加入到「車位到車位」的智能駕駛新一輪競爭中去。
理想發(fā)力「端到端」的商業(yè)邏輯
對于理想汽車來說,它之所以如此花大力氣投入到端到端,本質(zhì)上還是爭奪在智能駕駛領(lǐng)域上的頭部地位 —— 這固然有著技術(shù)開發(fā)和用戶體驗(yàn)層面的邏輯,但從本質(zhì)上來說,這其實(shí)依舊是一個(gè)商業(yè)邏輯。
原因很簡單,智能駕駛對于用戶的購車決策變得越來越重要了。
實(shí)際上,從去年開始,華為、小鵬等玩家都在不斷推動(dòng)自動(dòng)駕駛面向更多用戶群體和更廣泛的用戶場景進(jìn)行落地;尤其是在下半年,搭載了華為 ADS 2.0 的問界新 M7 一飛沖天,已經(jīng)讓整個(gè)行業(yè)看到了智能駕駛對于用戶的價(jià)值。
甚至到目前為止,華為在智能駕駛方面的這一優(yōu)勢依舊在為鴻蒙智行貢獻(xiàn)著可觀的銷量。
而到了今年,尤其是在端到端技術(shù)的加持下,智能駕駛對于用戶購車決策的權(quán)重影響越來越明顯。正是從去年四季度就體會(huì)到這一點(diǎn),理想汽車才會(huì)如此用力地抓住智能駕駛領(lǐng)域新一輪技術(shù)變化——也就是端到端——來贏得用戶認(rèn)可。
根據(jù)理想汽車總裁馬東輝公布的數(shù)據(jù),無圖 NOA 從 7 月份開始全量推送以來,用戶對智能駕駛的接受度在提升,城市 NOA 的日活躍度和行駛里程都明顯增加,甚至翻了幾倍。同時(shí),根據(jù)朗咸朋的說法,在無圖 NOA 全量推送之后,城市 NOA 的日活比例已經(jīng)高于高速 NOA 的日活比例。
這意味著,用戶對于理想汽車智能駕駛的接受度越來越高。
不僅如此,在理想汽車的門店銷售中,它對于智能駕駛的加速擁抱,也已經(jīng)在市場端推動(dòng)理想汽車智能駕駛車型的銷量增長。
對此,馬東輝在最新一季的財(cái)報(bào)電話會(huì)議中表示:
從市場端來看,智駕對于銷量產(chǎn)生了積極的推動(dòng)作用。潛在用戶來門店試駕 NOA 的比例翻倍增長,并且各個(gè)車型的 AD Max 訂單占比都在提升,特別是 30 萬以上車型,AD Max 的訂單占比已經(jīng)接近 70%。
另外,根據(jù)智見 Time獨(dú)家獲得的最新數(shù)據(jù):在用戶對于理想 L9 的選擇中,選擇 AD Max 版本的車主達(dá)到了 80% 左右。
值得關(guān)注的是,從 9 月 10 日開始,理想 L9 試駕車已經(jīng)開啟新一代「端到端 + VLM」智能駕駛零售中心體驗(yàn)——到了 9 月 20 日,理想汽車也宣布,全系車型開啟新一代「端到端 + VLM」智能駕駛門店體驗(yàn)。
也就是說,端到端方案,已經(jīng)成為理想汽車加大力度賣車的一個(gè)重要法寶。
實(shí)際上,通過對智能駕駛的擁抱,理想汽車正在構(gòu)建一個(gè)「以智能駕駛促進(jìn)銷量增長,以銷量增長來推動(dòng)智能駕駛發(fā)展」的商業(yè)邏輯。
對此,馬東輝也公開表示:
我們認(rèn)為從端到端 + VLM 開始,智駕研發(fā)的門檻已經(jīng)建立,因?yàn)閺倪@一代開始,才是真正使用人工智能的方式去做智駕,而人工智能需要大量的數(shù)據(jù)和算力,會(huì)讓具備高階智駕車輛保有量以及充足研發(fā)投入的企業(yè),在智能駕駛方面的優(yōu)勢增加,并且實(shí)實(shí)在在地促進(jìn)銷量提升,而銷量提升又會(huì)帶來保有量和研發(fā)投入的提升,這是一個(gè)不斷正向滾雪球的過程。
也就是說,以現(xiàn)有的 L 系列產(chǎn)品在用戶體驗(yàn)和市場反饋上的良好表現(xiàn)和理想汽車的正向現(xiàn)金流為基礎(chǔ),通過端到端 + VLM 加持下的智能駕駛能力,很好地扮演了理想汽車銷量增長催化劑的作用,并且繼續(xù)帶動(dòng)整個(gè)理想汽車走向正循環(huán)。
從這個(gè)角度看,在 2024 年理想汽車已經(jīng)放棄推出純電 SUV 的前提下,它借助端到端帶來的機(jī)會(huì),在智能駕駛領(lǐng)域的大力投入和大張旗鼓,確實(shí)不失為明智的選擇。
畢竟,從短期來看,有了端到端的加持,理想汽車為了補(bǔ)足智駕短板后能夠更好地賣車;從長期來看,一旦通過端到端實(shí)現(xiàn)智能駕駛能力的突破,理想汽車就足以構(gòu)建智能駕駛方面的長期競爭力,其正面影響是巨大的。
更重要的是,在李想本人的長期目標(biāo)中,理想汽車要在 2030 年成為一家世界領(lǐng)先的人工智能企業(yè)。
因此,智能駕駛是理想汽車勢必要拿下的第一個(gè)山頭。
從理想汽車長期以來的戰(zhàn)略選擇來看,它在智能駕駛新一輪的大舉投入和全力以赴,實(shí)際上也是為了在這個(gè)汽車智能化的核心領(lǐng)域中,與眾多選手一決高下。
這不僅僅是新一輪技術(shù)的較量,也是商業(yè)能力的較量,更是一場關(guān)于占領(lǐng)用戶心智的較量。
當(dāng)然,這也意味著,以端到端和視覺大語言模型等技術(shù)的到來為契機(jī),理想汽車試圖打破中國智能駕駛產(chǎn)業(yè)格局的新一輪戰(zhàn)爭,已經(jīng)正式打響。
本文來自微信公眾號“智見 Time”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.