2023年智駕行業最熱門的詞,一定是無圖城市NOA。
無圖城市NOA意味著智駕車輛擺脫對高精地圖的依賴,僅靠自身的傳感器和普通導航地圖,能在更多城市中將駕駛員從繁雜的駕駛任務中解放出來。對消費者來說,這是他們最期待的智駕功能;對智駕企業來說,這是他們競相爭奪的“圣杯”。
從這一年開年起,多家車企不停吹風,將推出不依賴高精地圖的城市NOA產品,年底前保證開城XX座。但一年時間中,圍繞無圖城市高階智駕量產的打臉此起彼伏。
有些公司設定的無圖城市NOA開城計劃從秋天推到冬天,從年底前轉進到第二年;也有些公司被控訴,表面宣傳無圖方案,實則對高精地圖的使用未曾斷絕。除了極少數兌現承諾的公司,無圖城市NOA的量產競賽更像是一場宣傳角力。
過度宣傳帶來了反噬,不少消費者將無圖城市NOA默認為吹牛,但這也是行業正本清源的機會。
在智駕企業中,元戎啟行是最早參賽無圖城市NOA的那一批,他們在2020年敲定了不依賴高精地圖的智駕路線,經過三年研發,于去年初發布了不依賴高精地圖的城市NOA智能駕駛方案DeepRoute-Driver 3.0,把智駕開城的競爭維度從“快”豐富為“多快好省”,獲得了車企的青睞。
元戎啟行“無圖”智駕方案在上海的晚高峰路段進行路測
背后的道理很簡單:智能駕駛是一項十項全能競賽。從“假開城、假無圖”,走向“真無圖,真量產”, 快很重要,但不顧一切的快不是無圖城市NOA的唯一贏法。
在無圖潮流中,在種種廣告與爭議中,高階智駕勢必會回歸商業本質。
01
繪圖速度追不上開城
在陡然失勢前,高精地圖曾經被中國企業熱烈追捧。
2018年,通用汽車的新款凱迪拉克CT6進入中國,高配車型搭載了Super Cruise超級輔助駕駛系統,系統依托高德率先量產的高精地圖工作,能在高速上解放駕駛員的雙腳。在2020年前后,新勢力們也開始基于高精地圖發布高速NOA功能。
在當時,乘用車上的智駕系統硬件與軟件能力都相對有限,而高精地圖是一種強大的輔助工具。一方面,高精地圖繪制出了道路上的靜態元素,可以降低智駕系統感知的難度;另一方面,高精地圖提供的超視距先驗信息,也能幫助智駕車輛及早進行行駛路徑的規劃,減少無效變道。
這一時期,國內不僅老牌圖商紛紛入局,也迎來了高精地圖創業熱以及地圖采集資質的擴容大潮。采集高精地圖所需的導航電子地圖甲級制作資質,原本僅有十余張,2020年暴漲至近30張。除了特斯拉和一小部分創業公司,行業大都認可高精地圖能夠幫助自動駕駛量產,加速商業化。
但3年后,高精地圖的地位迎來反轉,在車企與智駕供應商們的齊聲呼喊下,“無圖”方案成為更主流的趨勢。這種變化的原因有些戲劇性——智駕的商業化進程進一步加速了。
2023年,小鵬、問界等新勢力產品中智能化屬性拉滿的高配車型銷量大漲,占比超過50%。來自麥肯錫的消費者調查報告顯示,本土高端新勢力能夠搶單傳統豪華品牌,“更先進的自動駕駛”位列第二要素[1]。這意味著,在中高檔車型上, 高階智駕已經成為影響消費者購買決策的主要因素。
而在日常駕駛場景中,城區占據了超過80%駕駛里程與時長。能夠在城里解放駕駛員的城市高階智駕/城市NOA,自然成為智能電動汽車的殺手級應用。為了贏得訂單,車企向城市NOA投放了巨量資源,以季度為單位推動智駕開城,將算法迭代的速度卷到了周更甚至日更。
而在車企爭分奪秒時,高精地圖成了拖后腿的存在。當智駕的領軍車企設定了一年時間開城數十上百座甚至全國都能開的目標時,去年上半年國內開放了城區高精地圖的城市只有個位數。
差得這么遠的原因在于,高精地圖是一種準入門檻高、資產類型重的基礎設施,成本高、采集難、審核嚴、更新慢——模式有點像修鐵路,修好后收益不小,但短時間修遍全國不現實,誰來出錢也是個難題。
老牌圖商四維圖新披露過數據,8年時間在高精地圖上花費了30億元,而想要覆蓋全國高精地圖成本是100-200億元,以及每年額外的更新費用[2]。
為了避免被成本拖垮,百度、高德、騰訊、四維圖新都推出了基于眾包方案的輕量級高精地圖,并拿到了過百城市的審圖號。但車企出于多方面的疑慮反應并不積極:更新速度如何?數據的歸屬權如何?圖商會轉嫁過來多少地圖采集與更新成本?
就在高精地圖路線遇阻之時,實力較強的車企與智駕企業在2023年進行了技術的史詩級更新,將Transformer+BEV引入到高階智駕的技術棧中,通過傳感器數據的前融合,獲得了更強的智駕實時感知能力,將感知與規控統一到了一個坐標系。
高精地圖大部分功能,能夠被這套新的技術棧取代。車企發現Transformer+BEV的技術下,導航地圖夠用了,高精地圖聲勢漸弱自然不奇怪。
02
廣告學的面子 工程學的里子
然而,在業界高喊去高精地圖的過程中,也出現了一些趣事:去年10月,有圖商出面打假,指出一些車企的智駕方案看似無圖,實則在暗地使用高精地圖,“真假無圖”在智駕圈子里一時引發了熱烈討論。
爭端背后是車主們不太了解的行業現實:無圖智駕口頭開城簡單,工程實踐難上加難。
如果將高階智駕比作一場考試,那么高精地圖可以看作一份被精心修正過的、表達道路靜態元素的參考答案,里面已經提前清晰地劃出了車道線,車道線的通達、連接關系,車道線與紅綠燈的對應關系等。在現實中道路靜態物體沒變化的前提下,它是穩定而值得信賴的。
在高精地圖的幫助下,車企開發智駕系統時可以更多將資源、算力用于動態物體的感知與應對上,能夠顯著降低城市NOA的工作難度、保證使用體驗(如過十字路口時更穩定、無效變道更少)。這也是為何一些車企會在高階智駕產品上遵循“有圖用圖”的原則。
而智駕系統在去高精地圖后,對道路靜態元素感知就不再是“抄答案、對答案”,而是要依靠車輛的實時感知自己解題。這需要對技術框架進行大范圍改造,感知、預測、規控算法都要改,難度幾何級提升。在各種場景和細節中,學霸與學渣的區別便會顯現出來。
比如在車道線不清晰的地方、十字路口,車輛需要自己腦補車道;車輛要根據看到的路牌和地面標志,推測道路是左轉、直行還是右轉;車輛需要自己學習“哪個紅綠燈控制哪條車道”······而在不同城市中,車道線、路口特征、標志、紅綠燈可能會有不同形態,這些都需要大量收集真實道路數據,訓練出一個見多識廣的感知網絡。
又比如在沒有高精地圖后系統缺乏超視距感知,作為彌補車輛需要大幅提升感知距離(避免進錯車道、或錯過路口等)。但在BEV技術框架下,提升感知距離又會顯著增加算力的消耗,如何把一份算力掰成兩份花是必修的課題。
實際上,城市NOA轉向無圖,影響的遠不止感知環節。
因為整個技術邏輯從類似于開火車變成了真正靈活地開汽車,要求車輛在自由度極高、 變量極多的空間里快速交互、博弈,不斷找到最優解并精確執行。這在數學原理上有些像被AlphaGo解決的圍棋,但又遠比圍棋更復雜。
為了保證安全、效率,智駕系統需要對包括車、人、非機動車甚至寵物在內的大量交通參與者作出較長時間的運動軌跡預測。如果想要精確,需要收集、訓練的數據維度將超乎想象,不僅有各類物體的交通行為,甚至會包括人類的姿勢乃至手勢。
而對多物體長時間的軌跡預測,也會在實時運行中大量消耗芯片算力與內存,需要特定的內存優化技術。
在智駕的規劃控制環節,由于實時感知結果更容易“漂移”,大量“行蹤不定”的交通參與者撲面而來,規控算法也迎來了巨大挑戰,它必須能夠為充滿不確定性的上游結果兜底,保持穩健但又不過于謹慎,在行車安全、效率、舒適中取得平衡。
在大量的既要又要中,傳統基于人工規則的規控方案已很難應對,國內的頭部企業都在摸索神經網絡+人工規則的混合規控方案。
而要實現各環節算法精進的前提,是先解決如何有效進行自動化數據標注、場景挖掘,搭建能真正把云端算力儲備用上的數據閉環,這同樣潛藏著大量的know-how。
上述種種問題相互糾纏影響,解決需要持續的資源投入與工程實踐的積累。儲備不足又起步較晚的企業,在競爭壓力下確有可能通過偷偷開掛的方式來欲蓋彌彰。
實際上,如今國內流行的無圖城市NOA,特斯拉在前兩年的AI Day上就已經給出了大致的方向,但具體的道路只能由國內的企業自行摸索,而摸索的過程已經足夠篩掉大部分行業參與者。
03
回歸商業本質
如果要給國內智駕行業斷代,那么在去年以前,呼聲更高的顯然是力大磚飛的派別,這時車企與智駕供應商熱衷于在車輛上玩“疊疊樂”,被堆疊的不僅是高精地圖,還有高規格傳感器、大算力芯片,嘗試以各種外部依賴解決棘手的智駕難題。
而在2023年以來,與去高精地圖同步進行的,是行業嘗試用盡可能少的硬件和算力,挑戰量產高階智駕。極越喊出了去激光雷達,大疆要在數十T算力的芯片上做通勤模式智駕,而元戎啟行則推出了基于單枚OrinX、不依賴高精地圖的高階智駕方案。
它們內在的邏輯一致,都是降低成本,從而登上更多量產車,盡早真正實現大規模的高階智能駕駛商業化。
理論上,對各種基礎設施和硬件的依賴越少,智駕方案的泛化性就越強、成本越低,能進入的市場也越廣闊。但同樣,能依賴的武器越少,也會愈發考驗一家智駕公司的內功——不依賴高精地圖是上乘武功,而在算力不那么大的平臺上做出無圖城市NOA,則是頂級功法。
目前,城市NOA大多使用Orin X作為計算芯片,單枚AI算力254TOPS,成本約400美元。目前車企普遍使用兩枚Orin X組合的計算平臺,算力翻倍,但成本并非400美元X2。由于布置兩枚Orin X需要額外的PCB板、I/O、供電以及更高規格的散熱設計等,兩枚Orin X構成的計算平臺成本會顯著高于單枚Orin X平臺的2倍。
只用一枚Orin X驅動無圖城市NOA意味著大量的成本節約。
2023年,元戎啟行推出高階智駕方案DeepRoute-Driver 3.0,其中支持無圖城市NOA的Pro版本使用單枚Orin X,使用7枚攝像頭和一枚激光雷達,硬件成本2000美元,Air版支持高速NOA,硬件成本1000美元。作為參考,小鵬使用了雙OrinX、激光雷達加上Nappa真皮的G6 Max版,比使用單Orin X、無激光雷達的G6 Pro貴了兩萬。
但在一顆Orin X上量產無圖城市NOA也意味著極限挑戰。
由于Transformer+BEV架構下的高階智駕算法模型在快速成長,神經網絡參數與層數都遠超從前,因此對算力與存儲的要求更高。要在計算負載更重的情況下用更少的算力完成任務,一方面考驗對模型的優化、壓縮,另一方面則考驗對算力的充分壓榨。
一個冷知識是,Orin X對外宣稱的254T算力由GPU、DLA兩種計算單元共同提供,如果要高效利用算力,則要求智駕企業對不同的計算單元足夠了解,有相應的開發能力讓算法同時調用它們。當然實際情況更復雜,因為Orin X上還有CPU、DSP等多類計算單元。
為了極致壓榨算力,元戎啟行使用了名為DeepRoute-Engine的推理引擎技術,它能拆分、合并算法中不同算子(一套算法由大量不同算子組成,每個算子可以看成是一項計算函數)的相近、相同計算需求,靈活分配給Orin X上的異構計算單元,減少重復計算和數據搬運、等待,緩解帶寬瓶頸,有效提升芯片算力的利用率。
實際上,為了幫助下游用好芯片,英偉達會提供一些深度學習加速庫供合作伙伴調用,但來自英偉達的幫助只能讓下游達到平均水平。而智駕系統應用端算法的變化總是會快于英偉達的支持,此時能夠多大程度發揮芯片性能的決定性因素,還是智駕企業的積累與創新。
而元戎啟行已經在自研的推理引擎上投入了多年時間開發、迭代,才能與其他工程手段一起,形成降低成本、提升性能的組合拳。在多地的泛化測試中,元戎啟行基于單枚Orin X的無圖城市NOA方案表現流暢,這最終幫助他們獲得了多家車企的訂單。
尾聲
2023年,隨著ChatGPT爆火,大力出奇跡的風潮在泛AI領域蔓延,大模型的風也吹到了汽車領域。
但高階智駕作為搭載在汽車上、依賴在端側實時計算的AI,其實很難指望大力出奇跡。它既要尊重汽車行業的特色:多到令人發指的約束條件;也要尊重軟件行業的規律:想要發揮軟件的邊際效應,就必須設定足夠低的硬件門檻。
越早選擇同時尊重兩條規律、為此踏入真·量產路程的智駕企業,越可能活到終局。
參考資料:
[1]2023麥肯錫中國汽車消費者洞察,McKinsey
[2]智能駕駛火速迭代:“有圖”“無圖” 誰更靠譜,廣州日報
作者:遠川汽車組
編輯:羅松松
視覺設計:疏睿
責任編輯:遠川汽車組
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.