用智駕供應(yīng)商的方案,何必遮遮掩掩?
作者 | 郭瑞嬋
編輯 | 李雨晨
一直以來(lái),走全棧自研路線的新勢(shì)力奪取了智駕的大部分聲量,但現(xiàn)在格局已有所松動(dòng)。
“蔚小理華”之外,智己也開(kāi)始越來(lái)越頻繁地在智駕測(cè)評(píng)榜單中出現(xiàn)。
今年9月,智己正式交付了全國(guó)都能開(kāi)的無(wú)圖NOA,成為第四家達(dá)成這一里程碑的車企。一個(gè)月后,智己又正式推出了基于“一段式端到端大模型”的IM AD 3.0。
與這些玩家不同,智己的IM AD智駕系統(tǒng)是與Momenta聯(lián)合開(kāi)發(fā)。一直以來(lái),頭部車企對(duì)于采用供應(yīng)商智駕方案的行為諱莫如深,即使是非自研也必須被包裝成全棧自研。但是智己和Momenta一直公開(kāi)為對(duì)方站臺(tái)。
智己,是Momenta能夠在智駕行業(yè)扎穩(wěn)腳根的關(guān)鍵一步。Momenta CEO曹旭東如此形容兩家之間的關(guān)系:“雖然是兩個(gè)公司,但勝似一個(gè)團(tuán)隊(duì)。”
曹旭東表示,智駕的摩爾定律是兩年10倍,但智己與Momenta追求的目標(biāo)要遠(yuǎn)高于此,可能是兩年100倍甚至更高,實(shí)現(xiàn)這個(gè)目標(biāo),需要兩邊都具有高效的迭代效率,數(shù)據(jù)閉環(huán)效率的提升要從以月為單位加速到以周為單位、以一天為單位。
“放到任何一家公司內(nèi)部,能夠達(dá)到這樣效率的團(tuán)隊(duì)在行業(yè)內(nèi)都是鳳毛麟角。”
通過(guò)聯(lián)合Momenta,智己宣布將在年內(nèi)獲得L4級(jí)無(wú)駕駛?cè)说缆窚y(cè)試牌照,成為全國(guó)首個(gè)同時(shí)具備L2+、L3、L4智能駕駛量產(chǎn)能力的汽車品牌。
1
都在講端到端,智己與Momenta的有何不同?
IM AD 3.0的關(guān)鍵詞是“直覺(jué)”,這出自于行業(yè)里正在流行的“快慢系統(tǒng)”理論——人類大腦95%的決策都依賴于快系統(tǒng),即直覺(jué)與條件反射,端到端智駕大模型則通過(guò)減少人為定義的規(guī)則以復(fù)刻人類大腦的快系統(tǒng)。
一段式端到端大模型,是目前復(fù)刻人類大腦快系統(tǒng)最極致的階段,通過(guò)把感知和規(guī)劃兩個(gè)模型整合成一個(gè)大模型,傳感器原始數(shù)據(jù)輸入后直接就輸出規(guī)劃路徑,模擬人類的快速直覺(jué)反應(yīng)。
它的優(yōu)勢(shì)在于,無(wú)需人為定義從感知到規(guī)劃的接口,能學(xué)習(xí)全局信息與隱含信息,就算面對(duì)看不清的道路結(jié)構(gòu)與情況,也能綜合分析車流、行人的軌跡等全局隱含信息,基于全局信息輸出行駛軌跡,通過(guò)理解環(huán)境做到邊看邊開(kāi)的老司機(jī)駕駛行為。
以路上的水坑為例,在過(guò)去的分段式模型中,水坑場(chǎng)景是比較難解決的Corner Case之一。首先需要人為定義水坑的類型,并用大量數(shù)據(jù)訓(xùn)練感知模型以認(rèn)知水坑,而在規(guī)劃模型中,也同樣需要大量躲避水坑的駕駛數(shù)據(jù)來(lái)訓(xùn)練學(xué)習(xí)。
一段式端到端大模型去除了人為定義水坑的步驟,即使對(duì)水坑沒(méi)有顯性定義,也可以通過(guò)學(xué)習(xí)隱含的認(rèn)知繞過(guò)水坑。由此可見(jiàn),一段式端到端大模型的泛化能力更強(qiáng)、上限也更高。
同時(shí)為了保證下限,IM AD 3.0加入了“安全邏輯網(wǎng)絡(luò)”進(jìn)行兜底,負(fù)責(zé)對(duì)一段式端到端大模型生成的多模態(tài)候選軌跡做最終判斷,以確保直覺(jué)性決策的安全性。
端到端成為現(xiàn)實(shí)后,并非迎來(lái)了技術(shù)的終局,而是一個(gè)新的開(kāi)始,算力與數(shù)據(jù)是未來(lái)競(jìng)爭(zhēng)的核心。
特斯拉以雄厚的財(cái)力與數(shù)據(jù)優(yōu)勢(shì)已經(jīng)占據(jù)競(jìng)爭(zhēng)的高點(diǎn),馬斯克曾表示,今年特斯拉投入到自動(dòng)駕駛的訓(xùn)練與推理的花費(fèi)將超過(guò)100億美金。
自動(dòng)駕駛端到端大模型的訓(xùn)練試錯(cuò)成本非常高昂,如何降低試錯(cuò)成本是關(guān)鍵。
智己與Momenta提出了長(zhǎng)、短期記憶結(jié)合的模式。這一模式仿照了人類記憶的形成過(guò)程,人在探索外界世界時(shí),外界的信息數(shù)據(jù)首先進(jìn)入短期記憶,經(jīng)過(guò)短期記憶的篩選驗(yàn)證后,才會(huì)進(jìn)入長(zhǎng)期記憶習(xí)得能力與經(jīng)驗(yàn)。
長(zhǎng)期記憶是一段式端到端大模型,短期記憶是DLP模型。后者是一個(gè)小版本,主要用于驗(yàn)證方法以及訓(xùn)練數(shù)據(jù)是否正確,實(shí)現(xiàn)算法的快速迭代,做到平均一天迭代一個(gè)版本。被短期記憶驗(yàn)證過(guò)的方法與數(shù)據(jù),在積累一段時(shí)間以后,會(huì)應(yīng)用到一段式端到端大模型上,基本保證一次訓(xùn)練就能訓(xùn)練得對(duì)、訓(xùn)練得好,從而降低試錯(cuò)成本。
“長(zhǎng)短期記憶結(jié)合的模式是我們的一個(gè)秘密武器。”曹旭東介紹,這種模式比直接完全用端到端大模型去試錯(cuò),能減少10~100倍的訓(xùn)練成本。
另外在數(shù)據(jù)層面,曹旭東提到,目前Momenta已經(jīng)實(shí)現(xiàn)了百分百的數(shù)據(jù)驅(qū)動(dòng)與算法自動(dòng)化迭代,擁有億級(jí)優(yōu)勢(shì)數(shù)據(jù)的積累。到2027年,Momenta的數(shù)據(jù)積累預(yù)計(jì)突破1000億公里,徹底解決自動(dòng)駕駛的終極長(zhǎng)尾問(wèn)題。
2
追趕與超越:供應(yīng)商合作模式的范本
智己與Momenta能夠在此時(shí)追趕上業(yè)內(nèi)的端到端熱潮,離不開(kāi)最初的路線選擇。
早期的Momenta曾是“異類”,當(dāng)同行們都在沿著Rule-based方法做智能駕駛,Momenta從一開(kāi)始就堅(jiān)決押注數(shù)據(jù)驅(qū)動(dòng)。
智駕技術(shù)路線向端到端收攏,須經(jīng)歷三個(gè)階段,首先是感知的模型化,接著是規(guī)控的模型化,再下一步則是感知與規(guī)控的合二為一。
感知的模型化是業(yè)內(nèi)共識(shí),但是在規(guī)控的模型化上出現(xiàn)了分歧,基于傳統(tǒng)的Rule-based方法,只要投入的人力夠多,就以較快的速度取得不錯(cuò)的規(guī)控效果。
不過(guò),Rule-based始終受限于人力以及無(wú)法窮盡的Corner Case難題,當(dāng)智駕開(kāi)進(jìn)城區(qū)里,依靠Rule-based根本不可能大范圍開(kāi)城。2020年,當(dāng)各家都還困于高速NOA的開(kāi)發(fā)量產(chǎn)時(shí),Momenta就開(kāi)始將數(shù)據(jù)驅(qū)動(dòng)引入規(guī)控環(huán)節(jié),試圖代替Rule-based。
曹旭東回憶,當(dāng)時(shí)行業(yè)里很多人都不認(rèn)同這種做法,“這放到當(dāng)時(shí)是有理由的,那時(shí)候用Deep Learning做Planning,在一些場(chǎng)景會(huì)有驚艷的表現(xiàn),但是也會(huì)在很多場(chǎng)景里出現(xiàn)匪夷所思的問(wèn)題。”
因此,規(guī)控的模型化其實(shí)是邁向端到端的一道高門檻,首先需要具備發(fā)現(xiàn)問(wèn)題的能力,還要有分析、跟進(jìn)并且解決問(wèn)題的能力,這背后需要一整套研發(fā)體系的支撐。
Momenta與智己一同打磨了兩年多時(shí)間,到2023年4月,兩家才把數(shù)據(jù)驅(qū)動(dòng)的規(guī)控做到量產(chǎn),應(yīng)用在高速NOA上。
當(dāng)時(shí),智己和Momenta召開(kāi)了一場(chǎng)發(fā)布會(huì),發(fā)布了命名為DLP的規(guī)控模型,但彼時(shí)業(yè)內(nèi)對(duì)此并無(wú)太多認(rèn)知。
“我們用Deep Learning做planning,比特斯拉還要更早,特斯拉今年上半年才上了端到端,Planning變成深度學(xué)習(xí)。”曹旭東說(shuō)。
到了今年,在感知與規(guī)控都已實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的基礎(chǔ)上,再加上背后持續(xù)進(jìn)步的研發(fā)體系支撐,智己與Momenta將感知模型與規(guī)控模型合并成了一段式端到端大模型。
實(shí)際上,從正式開(kāi)始推送高速NOA,到完成一段式端到端大模型的切換,智己與Momenta僅用了一年半的時(shí)間。
這一年半,智己與Momenta實(shí)現(xiàn)了從高速到城區(qū),從高精地圖到輕圖,從Rule-based到端到端的切換。
在這些進(jìn)展背后,是曹旭東所說(shuō)的“勝似一個(gè)團(tuán)隊(duì)”。
兩方的合作始于2020年末,也曾經(jīng)歷過(guò)磨合期,從現(xiàn)在的結(jié)果看來(lái),彼此互有成就。這4年時(shí)間,Momenta從智己那里積累了從0到1的工程化經(jīng)驗(yàn),得到了打磨產(chǎn)品與研發(fā)體系的機(jī)會(huì),智己也憑借Momenta的技術(shù)能力得到了競(jìng)爭(zhēng)智駕第一梯隊(duì)的入場(chǎng)券。
“從Momenta同學(xué)的角度來(lái)講,他不是在為一個(gè)某個(gè)客戶工作,我們也不會(huì)說(shuō),Momenta是我們的供應(yīng)商,就用怎么卡供應(yīng)商、怎么控制供應(yīng)商的思維模式去工作。”
智己智駕項(xiàng)目總監(jiān)王康表示,現(xiàn)在IM AD智駕系統(tǒng)的開(kāi)發(fā)與迭代都是兩個(gè)團(tuán)隊(duì)一起去發(fā)現(xiàn)問(wèn)題與解決問(wèn)題,任何一個(gè)OTA的版本,都是雙方共同規(guī)劃與討論出來(lái)的結(jié)果,每周的設(shè)計(jì)變更也都是兩個(gè)團(tuán)隊(duì)一起評(píng)估與驗(yàn)證。
在供應(yīng)商模式下,留給智己的考驗(yàn)是,如何做出好的產(chǎn)品定義與產(chǎn)品特色。
跨域融合,是智己的一個(gè)突破方向。去年智己LS6上市時(shí),智己就已推出了基于艙駕融合打造的全域數(shù)字視野補(bǔ)盲功能以及“雨夜模式”。
今年,基于靈蜥數(shù)字底盤,智己將智駕域與底盤域進(jìn)行聯(lián)通與融合,以“云臺(tái)車身控制”功能為例,依托智駕系統(tǒng)對(duì)環(huán)境的精準(zhǔn)感知,能夠識(shí)別大曲率的彎道,對(duì)底盤進(jìn)行智能調(diào)整,提升駕乘的舒適度與平穩(wěn)度。
另一方面,靈蜥數(shù)字底盤也賦能了智駕,四輪轉(zhuǎn)向功能帶來(lái)更小的轉(zhuǎn)彎半徑,智駕在調(diào)頭場(chǎng)景下更輕松,減少智駕體驗(yàn)中斷的概率。
在智己看來(lái),靈蜥數(shù)字底盤是智能駕駛非常合適的載體。“智駕體驗(yàn)是否讓用戶感到舒適,有沒(méi)有頓挫,都要有好的底盤來(lái)做‘手、腳、眼、腦’的協(xié)調(diào)工作,只有做到這樣,才能算是真正好用的智能駕駛。”智己智駕中心總監(jiān)賀錦鵬表示。
由智己官方提供的實(shí)時(shí)數(shù)據(jù)顯示,IM AD智駕系統(tǒng)的用戶黏性持續(xù)有所提升,前一周智己用戶在日常出行當(dāng)中使用IM AD的比例為81.4%,而在過(guò)去一周中使用IM AD的用戶比例已達(dá)到95.65%。
去年開(kāi)始,智己明確了以智能車為品牌的賣點(diǎn),如今智駕已經(jīng)追趕上來(lái),智己剩下要做的事情是如何把車賣好。
文遠(yuǎn)知行IPO:做自動(dòng)駕駛淘汰賽的「逆行者」與「破局者」
長(zhǎng)安智能化自研告別「PPT」模式
最適合下行期互聯(lián)網(wǎng)人的車:小鵬M03
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.