“端到端”在質疑聲中紛紛落地,智駕頭部玩家幾乎都趕在了2024年末官宣了端到端的量產消息。同時直覺智駕、本能智駕、監督式智駕、交互式智駕等越來越多的智駕新名詞開始涌現,這些都是市場端在向監管端發出消息:L3放行已刻不容緩。
文丨智駕網 金山
編輯 | 浪浪山上的小豬妖
臨近2024年底,“端到端”的量產應用成為高階智駕領域熱度最高的話題。
以城市領航輔助為代表的高階智駕功能,從2023年的初現端倪,再到2024年的大規模落地,如今已經成為各大車企爭奪高階智駕話語權的焦點。
而高階智駕發展到今天的L2+級別,想要再上一個臺階達到L3級甚至更高,原有技術在面對復雜多變的城市道路時就顯得有點吃力了。
于是,“端到端”成了智駕領域最近一個階段被高頻提及的關鍵詞。
目前,官方宣布已經落地端到端技術的車企越來越多,全球層面的第一個是特斯拉,國內的第一個是小鵬。
今年3月,特斯拉推出了FSD系統的V12版本,該版本宣稱刪除了幾十萬行的人工規則代碼,采用了端到端自動駕駛解決方案。
今年7月底,小鵬宣布向全球用戶全量推送AI天璣系統XOS 5.2.0版本,該版本采用了國內首個量產端到端大模型,官方宣稱其高階智駕系統提升到了“全國都好用”的水平。
在8月開幕的2024成都車展上,極越宣布PPA智駕升級為百度ASD,采用“純視覺+端到端大模型”的高階智駕方案在極越07上實現首搭。
雖然更多的車企還沒有實現量產落地,但也在緊鑼密鼓地進行端到端技術的研發。蔚來在年中成立了大模型團隊,小米也將智駕技術研發團隊的感知與規控兩個部門合二為一。
8月初,梅賽德斯-奔馳則在上海研發中心宣布,全新一代自動駕駛系統的“無圖”L2++城市領航輔助已經開始測試,并且應用了端到端大模型。
而在10月末,又有兩個新勢力品牌官宣了端到端落地的消息。
10月23日,理想汽車宣布全新一代雙系統智能駕駛解決方案“端到端+VLM視覺語言模型”正式全量推送。
到10月28日,智己汽車宣布IM AD 3.0率先完成從“最像人”到“有直覺”的斷代式進化,為智駕系統率先注入人工智能生成的“直覺”——基于智己汽車與Momenta聯合打造的“一段式端到端直覺式智駕大模型”。
至此,智己正式加入端到端陣營,并成為國內第一個官宣落地“一段式端到端”的車企。
01.
“直覺”智駕與“一段式端到端”
究竟什么是端到端?這是高階智駕進入端到端時代首先要理清的概念。
所謂的“端到端”,一端是傳感器,包括攝像頭、激光雷達等,它們就像眼睛一樣承擔輸入環境信息的作用;另一端是行駛軌跡,也就是系統接收了來自傳感器的信息后,會輸出規劃軌跡,從而控制車輛按照軌跡行駛。
以往,傳統的智能駕駛系統采用的是模塊化模型,將感知、預測、規劃分別為三個獨立的模型。每個模型的技術棧差異較大,處于下游的規劃模型需要依賴工程師編寫大量代碼去制定行駛規則。在模塊化的技術架構下,信息的傳遞會出現減損,系統的維護難度大,無法從容應對復雜路況。
端到端大模型則截然不同,將感知、預測、規劃三個模型融為一體,無需程序員編寫冗長的代碼去制定規則,而是用海量數據去訓練系統,賦予機器自主學習、思考和分析的能力。端到端模型不會出現信息傳遞減損,能夠更好地處理復雜的駕駛任務。
這就是我們常說的系統具備了學習能力,可實現“邊看邊開”,從而擁有了應對復雜場景的能力。
按照智己官方的說法,IM AD 3.0能以更接近人腦結構的思考方式,生成本能反應主導的直覺決策能力,可以能像人類思維一樣做出瞬間預判,具備“十年老司機”的直覺駕駛體感。
這個所謂的“直覺”,其實就是端到端技術的核心價值——打破傳統架構中模塊化方案的解決思路,不再依賴人工編寫的規則,讓感知信息能夠更加無損地參與到每一次的路徑規劃,輸出更加類人的駕駛策略。
因此,智己提到的這個“直覺”,其實也不算是新概念,而是對端到端技術最恰當的一種比喻。
據官方介紹,智己IM AD 3.0讓智能汽車首次擁有了綜合分析道路環境全局信息的能力,尤其在應對突發狀況時,能夠“腦補”出看不見、看不全的路況信息,像人類高級思維一樣可以做出瞬間預判,即人們通常所說的“直覺”或“下意識反應”。
在具體場景方面,智己在發布會上展示了測試視頻,可見IM AD3.0能夠禮讓盲區橫穿的行人、可以繞行水坑等特殊障礙物;在面對人車混流的無保護左轉場景時,能夠像老司機一樣老練博弈,而不再原地傻等;在錯綜復雜的路口,即使面對無中線、超寬車等看不清的路況,也能流暢通行。
智己還表示,IM AD3.0已經可以做到“全國都好開,全場景都敢用”。
其實從端到端技術的落地時間來講,智己并不算快,但此次官宣還有一個看點,那就是“一段式端到端”的落地,這讓智己成為國內首個實現這一技術上車的車企。
當前,端到端大模型基本都采用分模塊智駕結構,也就是所謂的“兩段式”架構,分別為感知的端到端和規控的端到端,二者各自獨立。
為智己提供智駕方案的科技企業Momenta CEO曹旭東表示,在兩段式端到端中,感知的端到端一定需要這個物體對于人來說是比較好定義的,這樣的話才能夠很好地搜集訓練數據,以及學習和驗證。但是對于復雜的通用障礙物,比較難在感知的端到端里面做定義的,規控的端到端就無法收到對應的輸入,進而忽視掉重要的感知信息,做出一些誤判的駕駛行為。
“一段式端到端大模型”則取消了分模塊智駕結構,將感知與規劃整合進一個大模型,通過數據飛輪提供的海量優質數據,訓練一個完整的神經網絡,分析全局信息、隱含信息,學習優秀的人類駕駛行為,從原始數據輸入到規劃路徑輸出,形成了類似人腦的高級思維“直覺”反應。
曹旭東表示,一段式端到端的好處是感知的端到端和規控的端到端聯系在一起,哪怕未定義的物體出現,在感知大模型的幫助下,仍然會做出合理避讓。
為了解決一段式端到端方案前期下限低的問題,Momenta的端到端模型采用了短期記憶和長期記憶的訓練邏輯。其中,短期記憶的訓練周期是以“天”為級別的,好的數據和好的方法得到驗證之后再進入長期記憶的模型學習。
這是一個類似于人類大腦進行學習的邏輯,當一個新的數據進來,它會先進入短期記憶,等到數據和方法被驗證之后,才會進入長期記憶去學習。
根據官方數據,這套智己與Momenta聯合打造的“一段式端到端大模型”在“長短期記憶模式”架構的助力下,將模型訓練成本節省了10-100倍,同時還大幅提升了迭代速度。
02.
“端到端”到底難在何處?
雖然官宣落地端到端的車企越來越多,但無論是在研發端,還是在市場端,業內人士對端到端的觀點及判斷并不一致。
8月16日,在第四屆沈陽智能網聯汽車挑戰賽上,同濟大學汽車學院教授朱西產表示:“特斯拉的端到端、人工智能讓自動駕駛更加成為可能,端到端被特斯拉帶火了,國內的車企都在說端到端。但現在,誰宣布端到端量產上車了,他的這個車你就別買。”
而在此一周之前,華為終端董事長、智能汽車解決方案BU董事長余承東評價特斯拉FSD到:“其商用版本進步非常大,上限挺高,但下限也很低。我們去測試,路上停著靜止不動的白色貨車,不減速就直接撞過去了,還有綠色的貨車,也是不減速就去撞。”
根據朱西產的解讀,端到端大模型雖然能夠提供強大的泛化能力,但是在安全性方面存在不確定性。國內車企在數量和AI訓練算力方面與特斯拉相比還有較大差距,所以近兩年端到端量產上車的可能性不大。因為大模型需要的高算力還很難在車端布置,并且大模型目前也很難解決“長尾難題”。
所謂“長尾難題”,就是指在自動駕駛過程中那些發生概率較低、但種類繁多的特殊場景所帶來的潛在風險。這些問題涵蓋各種零碎、極端的情況和難以預測的人類行為,例如:帶有凸出貨物的卡車、打傘的行人、倒在路中央的樹木,以及異形車輛、亂穿馬路的行人和自行車、雨雪等極端天氣、極暗的行車環境等。
同樣是在8月初,極越CEO夏一平也曾表達了對端到端技術的看法。
他表示:“端到端很難一蹴而就,我不認為現在市場上有任何一家是端到端,絕對不可能的,這個世界上現在沒有人是端到端,不要吹這個牛。特斯拉目前還是分段式的,真正端到端、完全視覺看到直接做執行還很難。要知道,這背后的驗證模型是巨大的投入。”
夏一平所提到的巨大投入,就是端到端大模型量產的最大難點——它的完善需要巨額的訓練數據積累,由此帶來的人力、物力和財力的消耗也是非常可觀的。
以特斯拉為例,僅僅建設超算中心就花費了40億美金,而端到端大模型越完善,也將意味著參數越多、數據越多,其中還包括圖片和視頻數據。
在數據采集方面,目前車企紛紛依靠用戶的車輛采集數據,銷量越大也意味著數據越豐富。據業內人士預測,誰的銷量先破100萬輛,誰就有可能在智能駕駛采集數據方面率先取得突破,而特斯拉在美國市場已經銷售了170多萬輛,它在數據積累上的體量是目前任何一個品牌都很難達到的。
朱西產認為,根據國內車企目前在智能駕駛開發的數據能力和AI訓練算力,先做到感知的端到端,在規控算法上保留安全準則模型,這種分段式的端到端方案模型是比較合理的技術路線。
以當前的情況來看,已經官宣落地的“端到端”大概率都是這個模式。
據極越官方表示,百度在AI和自動駕駛領域擁有超過十年時間、超過1500億資金的持續投入,基于L4級自動駕駛大模型Apollo ADFM打造了ASD。Apollo的L4級自動駕駛里程已經超過1億公里,并建立了超5.5EFLOPS的高算力訓練集群,可以實現模型的高效訓練和快速迭代。
在這一點上,智己與Momenta宣布“模型訓練成本節省了10-100倍,并大幅提升了迭代速度”其實與之意思相同,那就是強調數據訓練效率提升,已經積累到了可以支持端到端落地的量級。
而至于小鵬、理想等品牌,目前尚未針對數據訓練給出詳細的解讀信息。
03.
L3量產只差臨門一腳
隨著端到端大模型的陸續落地,智能駕駛突破現有的L2級“限制”已經迫在眉睫了。
智己在宣布“一段式端到端直覺式智駕大模型”量產上車的時候,也同步官宣了“同時具備L2、L3、L4級智能駕駛量產能力”的消息。
按照官方公布的信息,智己的L2+級高階輔助駕駛已在全國范圍內開通全系車型“無圖城市NOA”;歐洲市場的L2+道路測試也已啟動;L3級自動駕駛已進入量產倒計時,智己在今年6月入選了全國首批“L3準入及路試聯合體名單”,預計將于2026年正式具備L3級自動駕駛方案的量產條件;預計將在年內獲得首批“L4級無駕駛人道路測試牌照”,實現無人駕駛車率先上路。
智己表示,在隨著L3、L4級自動駕駛相關法律法規的逐步出臺,智己將最快落地全行業最領先的自動駕駛體驗。
比智己更早一點官宣的是華為,余承東在2024世界智能網聯汽車大會上表示,預計ADS 4(參數丨圖片).0將于2025年推出,將實現高速L3級自動駕駛商用及城區L3級自動駕駛試點。
而像小鵬、理想、蔚來、極越等具備了高階智駕能力的品牌,其實也已經具備了突破L2級的技術積累,他們的智駕系統在功能上距離允許“脫手”也只差法規的松綁而已了。
因此,L3級智能駕駛的落地,已經到了只差臨門一腳的時刻。
在6月15日舉辦的中國汽車藍皮書論壇上,華為智能汽車解決方案BU CEO靳玉志表示,汽車智能駕駛已經在L2級停留了太長時間,L3級自動駕駛技術在高速公路等場景的應用已經較為成熟,應該盡快允許商用。
雖然法規究竟何時可以“解綁”尚未可知,但端到端技術的逐步落地和持續完善無疑將起到助推作用。
對于L3的放行,智駕網曾多次表示,可以分步實現,沿承從代客泊車、高速NOA、再到城市封閉道路NOA,最終到完成城市NOA的一個逐步放開的順序。
而對于所謂歷史性的事故責任主體從駕駛者向車企的轉換,應遵循經濟救濟原則,引入代客泊車險、高速NOA險種等措施,用經濟的方式解決責任主體的風險問題。??????????????????????
今年隨著端到端的落地,直覺智駕、本能智駕、監督式智駕這新些的智駕名詞,事實上都是強調高階智駕來到一個新的階段,而對于消費者而言,就是特定場景下,車輛已可以實現比人類駕駛員更好的表現。
那么監管層,需要適當時刻放行L3,為這個產業真正解綁。
【關注智能汽車,關注智駕網視頻號】
關注汽車的智駕時代上智駕網(http://autor.com.cn)
合作or新聞線索提供,聯系郵箱:editor@autor.com.cn
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.