“繼大語(yǔ)言模型重構(gòu)人類的信息世界之后,大模型還將走向多模態(tài),進(jìn)一步重構(gòu)人類的物理世界,自動(dòng)駕駛就是大模型重構(gòu)物理世界的典型代表?!?/strong>
10月17日,在首鋼園舉辦的百度世界大會(huì)2023上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏向外界展示了百度在大模型領(lǐng)域的最新進(jìn)展,自動(dòng)駕駛是其中重要一環(huán)。
當(dāng)天下午,在百度舉辦的“大模型‘重構(gòu)’智能汽車”分論壇上,百度智能駕駛事業(yè)群組(IDG)智能汽車業(yè)務(wù)部總經(jīng)理蘇坦發(fā)布了百度Apollo基于大模型技術(shù)實(shí)踐和探索的一系列成果。
百度Apollo量產(chǎn)城快/高速領(lǐng)航功能的行泊一體產(chǎn)品Apollo Highway Driving Pro此前已經(jīng)在新嵐圖Free車型首發(fā)上市,該方案將在更多車型搭載,并計(jì)劃在2024年升級(jí)推出包含城市記憶行車、城快/高速領(lǐng)航功能行泊一體產(chǎn)品以及自主泊車2.0。
百度Apollo成功量產(chǎn)的Apollo Highway Driving Pro進(jìn)一步演進(jìn),發(fā)布了全新一代Apollo City Driving,使用場(chǎng)景從封閉道路升級(jí)到城市開(kāi)放道路,功能場(chǎng)景無(wú)限接近全域。
當(dāng)天,極越發(fā)布國(guó)內(nèi)首個(gè)BEV+Transformer純視覺(jué)高階智駕技術(shù)方案,并已在上海城區(qū)道路實(shí)現(xiàn)領(lǐng)航輔助駕駛。極越搭載的,正是百度Apollo的城市NOA產(chǎn)品——Apollo City Driving Max。作為國(guó)內(nèi)首個(gè)純視覺(jué)城市領(lǐng)航高階智駕產(chǎn)品,其將于今年第四季度量產(chǎn)落地。
同時(shí),百度Apollo還行業(yè)首發(fā)了Apollo Robo-Cabin艙駕一體軟芯融合智算平臺(tái),這是全球首個(gè)真正意義上在單SOC上實(shí)現(xiàn)了艙駕融合運(yùn)行的平臺(tái)。
在智能汽車市場(chǎng)迎來(lái)規(guī)?;慨a(chǎn)的前夕,大模型的出現(xiàn)讓智能汽車的底層邏輯發(fā)生了重構(gòu),百度集團(tuán)資深副總裁、智能駕駛事業(yè)群組總裁李震宇認(rèn)為這種變化體現(xiàn)在三個(gè)方面。
首先,語(yǔ)言大模型上車后,人車交互的方式會(huì)從“命令式”升級(jí)到“對(duì)話式”;其次,通過(guò)Transformer和BEV等新技術(shù)徹底重構(gòu)自動(dòng)駕駛技術(shù)棧,感知能力將獲得代際感提升,加速純視覺(jué)方案的成熟和普及;第三,未來(lái)的大模型還將走向多模態(tài),塑造出完全自動(dòng)駕駛的汽車機(jī)器人。
對(duì)智能汽車來(lái)說(shuō),大模型上車后最大的優(yōu)勢(shì)體現(xiàn)在哪些方面?最近無(wú)圖化趨勢(shì)盛行,高精地圖未來(lái)會(huì)不會(huì)消失?在深度內(nèi)卷的汽車行業(yè),主機(jī)廠都在談降本,對(duì)于百度這樣的供應(yīng)商來(lái)說(shuō)又意味著什么?
2023年10月17日下午,在百度世界大會(huì)分論壇結(jié)束后,蘇坦接受了每日汽車電訊的采訪,對(duì)上述熱點(diǎn)問(wèn)題分享了自己的觀點(diǎn)。
以下為訪談節(jié)錄,有刪節(jié)。
每日汽車電訊:大模型上車最大的優(yōu)勢(shì)體現(xiàn)在哪些方面?
蘇坦:大模型時(shí)代讓我們覺(jué)得非常興奮,當(dāng)我們深入到這個(gè)領(lǐng)域里面去以后,很強(qiáng)大地感受到大模型產(chǎn)品帶來(lái)的力量,因?yàn)樗牡讓舆壿嬜兞耍麄€(gè)產(chǎn)品底層的開(kāi)發(fā)范式發(fā)生了根本性的改變。
過(guò)去大家講的所有的智能化產(chǎn)品,總體來(lái)看還是一個(gè)基于規(guī)則、經(jīng)驗(yàn)累積的基本邏輯,是傳統(tǒng)的軟件堆砌。但是模型時(shí)代,很多事情發(fā)生了巨大的變化。
過(guò)去的時(shí)代,在感知領(lǐng)域無(wú)數(shù)的小模型對(duì)齊,車道線有車道線的檢測(cè),障礙物有障礙物的檢測(cè),紅綠燈有紅綠燈的檢測(cè),甚至到車方面,車輪有車輪的檢測(cè),車邊緣有車邊緣的檢測(cè),無(wú)數(shù)小模型集合在一起,數(shù)據(jù)搜集會(huì)存在很明顯的瓶頸,因?yàn)樘?xì)碎了。
智能化的構(gòu)建也并不容易,因?yàn)闊o(wú)數(shù)小的case在一起還是基于一定的邏輯串聯(lián)。
現(xiàn)在我們用全新一代的4D的Transformer BEV,把所有的全吃掉,形成一個(gè)統(tǒng)一的邏輯,非常好地把整個(gè)動(dòng)態(tài)環(huán)境重建出來(lái)了。
對(duì)于規(guī)劃控制也一樣,過(guò)去我們有無(wú)數(shù)的規(guī)則,積累下來(lái)一系列的邏輯,告訴你車該怎么開(kāi),現(xiàn)在用模型的方式,我們學(xué)習(xí)人怎么看,這樣就把體驗(yàn)天花板拉高了。
過(guò)去的自動(dòng)駕駛corner case越多,邊界越多,處理起來(lái)越復(fù)雜,而模型天然能夠處理這些,這是它的天然優(yōu)勢(shì)。
每日汽車電訊:高精地圖會(huì)不會(huì)消失?
蘇坦:高精地圖會(huì)不會(huì)消失的問(wèn)題現(xiàn)在討論得如火如荼,但是我們作為在行業(yè)里面有非常深的地圖積累的一家廠商,同時(shí)也做了自動(dòng)駕駛,我們對(duì)這件事情是非常淡定的狀態(tài)。為什么呢?
我們非常清楚地知道行業(yè)里面某一些正在以無(wú)圖的形式對(duì)外宣傳的廠商,因?yàn)樗麄兏覀冇泻献鳎晕耶?dāng)然知道它有圖沒(méi)圖。
我必須得說(shuō),未來(lái)在城市級(jí)別的智能駕駛的實(shí)現(xiàn),由于城市場(chǎng)景的復(fù)雜,用過(guò)去的那種方法做高精地圖肯定會(huì)遇到很大的成本瓶頸和數(shù)據(jù)鮮度更新的瓶頸,這件事情在行業(yè)里面是有共識(shí)的,這個(gè)共識(shí)就是過(guò)去的方式不太對(duì)。
但是有沒(méi)有新的方式讓這些事情變得可持續(xù),目前站在百度的角度來(lái)看,我們比較堅(jiān)信是有的,這個(gè)方案并不是原先意義上的無(wú)圖。
完全地看真實(shí)世界解決所有問(wèn)題,依然會(huì)出現(xiàn)有很多的場(chǎng)景和corner case用這個(gè)方法不能很好地處理,最后是犧牲了用戶的體驗(yàn)去換一個(gè)所謂的純無(wú)圖,這個(gè)東西最重要的就是安全和體驗(yàn),最后犧牲了安全和體驗(yàn)達(dá)到了技術(shù)上的極致,這個(gè)顯然不是做產(chǎn)品追求的東西。
所以百度在未來(lái)一段時(shí)間會(huì)嘗試用新的方式去做,比如現(xiàn)在這種超清的數(shù)據(jù),清到什么程度,清到跟手機(jī)地圖類似的程度,基于大模型的感知能力很強(qiáng),同時(shí)數(shù)據(jù)的輕量級(jí)輕量到可持續(xù),輕量到已經(jīng)不再成為負(fù)擔(dān),這樣它將來(lái)的規(guī)?;瘧?yīng)用就會(huì)變得很好。
所以從長(zhǎng)遠(yuǎn)來(lái)看,我并不認(rèn)為終局經(jīng)典意義上的無(wú)圖會(huì)發(fā)生,在未來(lái)重感知輕地圖的結(jié)合會(huì)變得很好。
舉一個(gè)例子,我們現(xiàn)在已經(jīng)發(fā)布的Apollo Highway Driving Pro跟嵐圖合作已經(jīng)上市了,里面有非常標(biāo)準(zhǔn)化的高精、標(biāo)清,再加上算力平臺(tái),加上高速高清,這是非常好的融合。
所以在我來(lái)看,無(wú)圖還是有圖,是高精還是超清,本質(zhì)上是需要兼顧體驗(yàn)、兼顧安全的一個(gè)算數(shù)題,不是一個(gè)絕對(duì)意義上的科研問(wèn)題。
每日汽車電訊:如何看待整個(gè)行業(yè)都在降本、卷價(jià)格?
蘇坦:整個(gè)中國(guó)汽車行業(yè)大家都在降本,我們也希望我們的智駕產(chǎn)品讓更多的車用得起,所以一定程度上用技術(shù)創(chuàng)新從而驅(qū)動(dòng)整車系統(tǒng)的綜合成本下降,這是我們毋庸置疑去做的。
整個(gè)行業(yè)對(duì)于降本的趨勢(shì)以及在降本過(guò)程中對(duì)于智駕本身的降本需求,實(shí)際上它對(duì)于有技術(shù)實(shí)力的廠商來(lái)看是一個(gè)機(jī)遇,而不僅僅是一個(gè)挑戰(zhàn),為什么呢?
因?yàn)橹悄荞{駛這一代產(chǎn)品里面,降本的核心不是或者不僅僅是通過(guò)供應(yīng)鏈降本,它更多的其實(shí)是通過(guò)技術(shù)進(jìn)步帶來(lái)了開(kāi)發(fā)模式,帶來(lái)了傳感器組合、帶來(lái)了算力等等一系列突破,所以說(shuō)在技術(shù)上有更強(qiáng)積累,有更大前瞻性的廠商對(duì)于成本的控制力會(huì)帶來(lái)這種相當(dāng)于傳統(tǒng)廠商降維的趨勢(shì)。
這種例子很多,比如傳感器,你的純視覺(jué)做得足夠好的時(shí)候,周邊的那些雷達(dá)需求就會(huì)降下去,自定位的能力做得足夠好的時(shí)候,就不需要再購(gòu)買(mǎi)那些昂貴的高精定位等等一切的東西,所有這些東西都來(lái)自于技術(shù)進(jìn)步推動(dòng)的一個(gè)對(duì)于整個(gè)產(chǎn)品結(jié)構(gòu)式的推進(jìn)。
像我們的Apollo City Driving 這個(gè)產(chǎn)品已經(jīng)打通到通勤了,這不是一個(gè)新的產(chǎn)品,是整個(gè)的傳感器、整體的系統(tǒng)不發(fā)生大的變化的情況下,通過(guò)成本規(guī)劃、技術(shù)創(chuàng)新往上大幅度提升天花板。
包括今天提到的Apollo BEV Model,這些都不是說(shuō)用最好的硬件來(lái)做我的技術(shù),而是反過(guò)來(lái)用最好的技術(shù)來(lái)實(shí)現(xiàn)最大的價(jià)值。
所以某種意義上我會(huì)認(rèn)為行業(yè)本身有競(jìng)爭(zhēng)壓力,有降本的需求,這是行業(yè)必須要面對(duì)的事實(shí),而這個(gè)過(guò)程中如果我們想要在智駕行業(yè)很好地發(fā)展,我們一定要順應(yīng)這個(gè)趨勢(shì)。至于大家認(rèn)為這種砍價(jià)會(huì)影響高科技公司的毛利率,我們不這么看。
用更快的科技創(chuàng)新帶來(lái)結(jié)構(gòu)性的降本,一方面可以帶來(lái)差異化的競(jìng)爭(zhēng)優(yōu)勢(shì),一方面又可以讓你的智駕產(chǎn)品更快地上到更多的車上去,所以在我們看來(lái)降本是一個(gè)機(jī)遇。
舉個(gè)例子,新嵐圖FREE(參數(shù)丨圖片)這個(gè)產(chǎn)品上市一周多時(shí)間,大訂就突破15000多訂單,這是嵐圖發(fā)布出來(lái)的數(shù)據(jù)。
因?yàn)槲覀兊暮献髂J绞巧宪嚵艘院笥脩粜枰顿M(fèi)激活,到現(xiàn)在為止激活率80%多,幾乎用戶買(mǎi)了以后都去付費(fèi)激活了,我就是沖這個(gè)功能買(mǎi)的,這就形成一個(gè)正反饋。
越來(lái)越多的用戶感受到了智駕帶來(lái)強(qiáng)大的產(chǎn)品力,用了就回不去了,我們?cè)诤笈_(tái)看到滲透率很高,這一點(diǎn)我們很欣慰,用戶不是開(kāi)通了一個(gè)功能,不怎么用,偶爾用,而是天天用。而且他在不斷嘗試這個(gè)場(chǎng)景能不能用,一旦他試成功了,我以后要接著用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.