近日,由汽車(chē)評(píng)價(jià)研究院及地平線主辦的「地平線杯」世界十佳智能汽車(chē)、世界智能汽車(chē)品牌論壇如期舉辦。在大會(huì)現(xiàn)場(chǎng),長(zhǎng)城汽車(chē)技術(shù)中心副總經(jīng)理——耿偉峰圍繞端到端智駕方案的優(yōu)缺點(diǎn)及解決方案,進(jìn)行了詳細(xì)介紹。
耿偉峰表示,長(zhǎng)城也曾經(jīng)歷傳統(tǒng)的CNN多相機(jī)感知+高精地圖的高速NOA方案,但依賴地圖并非長(zhǎng)遠(yuǎn)之計(jì)。
“在整個(gè)行業(yè)剛開(kāi)始推城市NOA的時(shí)候,還是基于高精地圖的。這導(dǎo)致只能逐個(gè)城市地進(jìn)行開(kāi)城。長(zhǎng)城認(rèn)為,這樣的路線是走不通的。”
由此,藍(lán)山的智駕系統(tǒng)從一開(kāi)始,就未采用高精地圖,只用導(dǎo)航地圖。而下一階段,長(zhǎng)城希望實(shí)現(xiàn)全場(chǎng)景的「車(chē)位到車(chē)位自動(dòng)駕駛」。
他介紹稱,高精地圖能夠彌補(bǔ)很多算法問(wèn)題,的確能夠提升體驗(yàn),但是覆蓋性很差。
“根據(jù)所有圖商的并集統(tǒng)計(jì),全國(guó)雙向車(chē)道地圖大概是1000萬(wàn)公里,真正的高速和高架只有3.6%。而在城市也只有10%左右有高精地圖的覆蓋。”
耿偉峰表示,一旦智駕進(jìn)城,道路復(fù)雜度會(huì)指數(shù)級(jí)增加,面臨的場(chǎng)景是無(wú)限的,其中也包括一些異常突發(fā)場(chǎng)景:違規(guī)自行車(chē)、違規(guī)行人、非機(jī)動(dòng)車(chē)等等。如此看來(lái),基于規(guī)則的開(kāi)發(fā)難度是無(wú)法想象的。
因此,長(zhǎng)城的智駕系統(tǒng)并未像其他車(chē)企那樣,從分段式架構(gòu)開(kāi)始做,而是利用SEE一體化智駕技術(shù)架構(gòu)。
“端到端架構(gòu)是現(xiàn)階段實(shí)現(xiàn)城市無(wú)圖NOA的最優(yōu)解。基于數(shù)據(jù)驅(qū)動(dòng),可減少約75%的人工編碼。同時(shí),算法能力會(huì)更強(qiáng),迭代速度也會(huì)更快,極大提升了場(chǎng)景解決速度。”
不過(guò)他也指出,雖然目前最先進(jìn)的端到端技術(shù)適用于大多數(shù)場(chǎng)景,但并非所有場(chǎng)景,這還是因?yàn)槠湎孪迒?wèn)題。
“端到端的優(yōu)勢(shì)是能夠處理復(fù)雜場(chǎng)景,更加絲滑擬人,而且不卡頓;劣勢(shì)則是有時(shí)在一些莫名其妙的場(chǎng)景下,會(huì)犯一些低級(jí)錯(cuò)誤,尤其是簡(jiǎn)單的場(chǎng)景。例如遵守交通規(guī)則,或者簡(jiǎn)單的壓線、變道等問(wèn)題,而且出現(xiàn)問(wèn)題后定位非常困難。”
基于這些問(wèn)題,長(zhǎng)城設(shè)計(jì)的端到端智駕模型,思路是基于模型概率性的算法,加上確定性的算法,利用安全規(guī)則對(duì)端到端結(jié)果進(jìn)行篩選。
同時(shí),長(zhǎng)城也會(huì)針對(duì)預(yù)測(cè)結(jié)果,以及端到端輸出參考線,做傳統(tǒng)的運(yùn)動(dòng)規(guī)劃。其算法架構(gòu)是兩個(gè)銜接緊密的大模型:一個(gè)是負(fù)責(zé)統(tǒng)一的感知,一個(gè)是負(fù)責(zé)預(yù)測(cè)、決策和規(guī)劃輸出,多參考線和目標(biāo)的意圖規(guī)劃信息,然后進(jìn)行安全規(guī)則檢查,基于時(shí)空聯(lián)合規(guī)劃生成最終的行車(chē)軌跡,然后再進(jìn)行橫縱向的車(chē)輛控制。
另一方面,藍(lán)山智駕采用的基礎(chǔ)數(shù)據(jù),是基于長(zhǎng)城多年積累所得,現(xiàn)已累計(jì)到數(shù)十PB,包括真實(shí)用戶的回傳數(shù)據(jù)和專業(yè)數(shù)采數(shù)據(jù)。
耿偉峰稱,僅藍(lán)山車(chē)型,每個(gè)月就會(huì)產(chǎn)生大概6000臺(tái)的增量,上市幾個(gè)月回傳數(shù)據(jù)已經(jīng)超過(guò)2PB。
但是,對(duì)以后的高階智駕來(lái)說(shuō),數(shù)據(jù)的量并非關(guān)鍵問(wèn)題,關(guān)鍵還是如何將這些數(shù)據(jù)有效利用好。
為此,長(zhǎng)城針對(duì)數(shù)據(jù)治理做了詳細(xì)設(shè)計(jì)。首先通過(guò)多維度精細(xì)的標(biāo)簽體系把數(shù)據(jù)進(jìn)行拆分,每個(gè)精細(xì)場(chǎng)景我們都要保證數(shù)據(jù)的均衡,并且測(cè)試、驗(yàn)證也精細(xì)化細(xì)分場(chǎng)景。
另外,長(zhǎng)城針對(duì)數(shù)據(jù)采用VLM視覺(jué)語(yǔ)言模型,提取向量特征;同時(shí)基于精細(xì)標(biāo)簽+AI向量特征,精準(zhǔn)挖掘出稀有的數(shù)據(jù),以及實(shí)車(chē)表現(xiàn)不太好的關(guān)鍵場(chǎng)景。
“這些手段能夠保證我們數(shù)據(jù)分布的合理,而不是簡(jiǎn)單的靠猛堆數(shù)據(jù)的方法進(jìn)行學(xué)習(xí)。”
他表示,傳統(tǒng)數(shù)據(jù)標(biāo)簽的挖掘方案中,篩選效率不足,針對(duì)場(chǎng)景挖掘數(shù)據(jù)也需要耗費(fèi)大量的人力和時(shí)間。而采用智能標(biāo)簽體系+AI特征的方法,可以最大程度縮減挖掘時(shí)間,節(jié)省人力。
“目前,人工只需要對(duì)數(shù)據(jù)進(jìn)行確認(rèn),就可以針對(duì)感知、預(yù)測(cè)、決策進(jìn)行一些標(biāo)注處理。”
除此之外,長(zhǎng)城的九州超算中心可動(dòng)用的總算力超過(guò)3 EFLOPS,并且正在持續(xù)指數(shù)級(jí)增長(zhǎng)。
“基于大模型、數(shù)據(jù)和算力資源,我們會(huì)將原計(jì)劃上市4個(gè)月的開(kāi)城時(shí)間(原計(jì)劃在12月底開(kāi)城),縮短到2.5個(gè)月,在11月份實(shí)現(xiàn)了所有城市公開(kāi)道路都可以行駛。”
耿偉峰表示,上次OTA版本已可支持掉頭等復(fù)雜場(chǎng)景,下次的OTA將會(huì)實(shí)現(xiàn)待轉(zhuǎn)區(qū)、環(huán)島通行等場(chǎng)景支持。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.