理想從2021年自研智駕開始,到目前差不多三年時間,但今年是理想在智駕上說的最多的一年。頭部新勢力中,理想是最晚發(fā)力的一家。小鵬和蔚來2016年開始,自動駕駛公司Momenta是2016年,華為是2019年開始。
理想智駕 加速追趕
這里需要回答兩個問題,為什么慢了?為什么今年智能駕駛提的最多?
第一個問題,理想沒有正面回答,理由大家都知道,因為之前的歷史遺留問題。但李想認(rèn)為這不重要,他認(rèn)為智能駕駛最重要的還是數(shù)據(jù)。算法,人才等其他要素都可以通過資金來彌補。
我同意這個說法,但理想忽略了一個問題,智能駕駛不僅跟數(shù)據(jù)有關(guān),還跟工程能力有關(guān),工程能力是積累,是無數(shù)個日夜的臟活苦活累活熬出來的經(jīng)驗,這一步不能跨越。比如模型在芯片上的部署,如何調(diào)整相關(guān)參數(shù),降低功耗延遲等,都需要一點點的積累沉淀。決定自動駕駛強弱的指標(biāo)中,數(shù)據(jù)和工程經(jīng)驗的影響因素各占50%。
再來看第二個問題,為什么今年講的最多?
理想的答案是因為今年開始發(fā)現(xiàn)智駕對賣車有巨大影響。理想給了一組數(shù)據(jù),今年2月AD Max的交付量占比只到20%左右,今年下半年超過50%。
當(dāng)然,還有一個沒提到的原因是因為今年確實有點東西了,2021年布局時間太短,之前能講的東西確實不多。
延展到理想對待端到端的態(tài)度,在宣發(fā)口徑上,商湯絕影在2022年就是開始提端到端,地平線作為第一作者在2023年發(fā)布了相關(guān)論文UniAD,并且獲得了當(dāng)年CVPR的最佳論文,首次為自動駕駛端到端通用網(wǎng)絡(luò)架構(gòu)的設(shè)想給出了具體范式。但是Momenta CEO曹旭東說他們在2019年就開始用端到端做規(guī)控算法。
簡而言之,在端到端上,理想依然不是第一個發(fā)力的選手,即便從宣發(fā)口徑上,小鵬在520當(dāng)天宣布兩段式端到端落地,研發(fā)時間肯定還要提前。但理想表示自己其實很早就注意到了端到端的價值,一直沒有做的原因是在等足夠的數(shù)據(jù)和算力。理想認(rèn)為端到端 VLM大模型本質(zhì)是用人工智能來做自動駕駛。人工智能的三個要素:算法、數(shù)據(jù)和算力,三者缺一不可。
理想今年準(zhǔn)備好了,所以就開始著手了。理想給出的數(shù)據(jù)支撐是到今年初其(高質(zhì)量訓(xùn)練)數(shù)據(jù)量達到10億(公里) 左右規(guī)模,這是一個基礎(chǔ)。第二是算力基礎(chǔ)今年初也到了5EFLOPS。
理想堅持用“端到端+VLM”的理由是,當(dāng)一套智能駕駛系統(tǒng)遇到?jīng)]有見過的場景時,端到端+VLM是當(dāng)下最好的處理方式,但端到端+VLM的能力也已經(jīng)快逼近極限,因為VLA已經(jīng)在預(yù)研中。
理想也解釋了為什么一直堅持用激光雷達的原因。因為攝像頭黑夜最高只能看到100米,激光雷達可以看到200米。其實還是老生常談的問題,攝像頭很難處理暗光場景,理想去掉了角雷達,會一直保留激光雷達,理想認(rèn)為激光雷達是安全帶。李想認(rèn)為,如果特斯拉在中國一定會使用激光雷達。
按馬斯克的風(fēng)格應(yīng)該不會,老馬的理解是他認(rèn)為激光雷達信號對相機信息是一種干擾。本質(zhì)上是技術(shù)理念的不同。
靠L2無法實現(xiàn)L4 2025年實現(xiàn)L3
理想認(rèn)為L2是輔助駕駛,而L3(有監(jiān)督自動駕駛)、L4屬于自動駕駛,L3是L4的先導(dǎo)。通過L2永遠無法實現(xiàn)L3,也就是所謂的自動駕駛。
這里延展另外一個話題,特斯拉的邏輯是用一套系統(tǒng)實現(xiàn)輔助駕駛和Robotaxi。這里有兩種說法,一種是輔助駕駛屬于L2,Robotaxi屬于L4,特斯拉通過數(shù)據(jù)驅(qū)動的方式實現(xiàn)L2向L4的跨越,這個理念和理想相悖;另一種是特斯拉用FSD實現(xiàn)的Robotaxi也屬于L2的輔助駕駛范疇。
理想認(rèn)為自動駕駛是能力、輔助駕駛是功能。功能是預(yù)設(shè)條件,在開發(fā)這個功能之前就一定預(yù)設(shè)了他的能力上限,但是能力沒有邊界,可以不斷持續(xù)成長和迭代。大白話說就是一個可持續(xù),一個不可持續(xù)。這個問題其實今年6月李想在重慶論壇上提到過這個點。
理想認(rèn)為,要想實現(xiàn)有監(jiān)督智能駕駛,一個前提是實現(xiàn)車位到車位,也就是解決最前面一百米和最后面一百米。智駕從小區(qū)車位開始,然后包括園區(qū)道路、泊車、城市道路,還有高速和收費站ETC都會全部打通。
理想還表示,如果按照端到端+VLM這套體系,有可能在2025年實現(xiàn)L3,也就是所謂的有監(jiān)督自動駕駛。
所以,新的問題是,如何去定義有監(jiān)督的自動駕駛?出了問題是誰的責(zé)任?
理想近期目標(biāo)是今年綜合MPI(城市+高速綜合接管里程)做到100公里接管一次的能力。而且不是安全接管,是體驗接管,用戶覺得不舒服接管。到明年、后年提升至500公里、甚至1000公里以上。要達到這個目標(biāo)的前提條件是達到500公里的綜合MPI(城市+高速綜合接管里程),預(yù)計需要2000萬Clips(視頻片段)的水平。按照理想的說法,如果2000萬Clips從不到5%的老司機去篩選,總數(shù)據(jù)要突破50億公里甚至上百億公里。
坦白說難度很大,特斯拉今年4月智駕總數(shù)據(jù)突破10億英里,差不多是16億公里,全球銷量在600萬臺左右。理想今年11月剛突破100萬,總數(shù)據(jù)10億公里。按比例去推,100億數(shù)據(jù)需要1000萬總銷量。當(dāng)然以后車越買越多,數(shù)據(jù)增長一定是非線性的,但是突破百億公里總里程絕非易事。2025年可能性幾乎為零。
理想認(rèn)為拿到L4門票需要3個條件:銷量500萬以上;自己掌握VLA(視覺語言行動模型);足夠多的錢去招募最頂級人才,并且堆算力。
總而言之,理想這兩年的智駕可以說是急下猛藥,效果如何,拭目以待吧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.