小鵬今年的1024科技日,被挪到了11月6日。而在10月24日當(dāng)天,小鵬汽車副總裁、自動(dòng)駕駛負(fù)責(zé)人李力耘宣布,AI天璣5.4.0正式開啟公測(cè):該版本下的智駕能力不僅在擬人化上可以呈現(xiàn)質(zhì)變,變道成功率也提升了53%,繞行成功率提升了155%。
同時(shí),小鵬汽車智能體驗(yàn)負(fù)責(zé)人于桐也表示,天璣5.4.0還將帶來(lái)更具美感的SR渲染、更線性的動(dòng)能回收、更舒適的AI底盤,另外還大幅放寬了智駕啟動(dòng)的條件。
RoboX更加關(guān)注的,是李力耘在現(xiàn)場(chǎng)對(duì)端到端方案,以及AI鷹眼視覺(jué)技術(shù),進(jìn)行了首次解讀。
E2E的三種主流路線
“端到端是非常復(fù)雜嚴(yán)謹(jǐn)?shù)募夹g(shù),這不是一蹴而就的事。但我認(rèn)為智駕已經(jīng)從冷兵器走向了熱兵器階段——在AI時(shí)代,我們更側(cè)重于用算力,用更大的算力、數(shù)據(jù)以及大模型,去解決智能駕駛更高階的擬人博弈和接管率等問(wèn)題。”李力耘說(shuō)道。
他在會(huì)上分享了主流端到端的三種路線:
1、小模型堆疊:小鵬曾經(jīng)考慮,在每一個(gè)模塊中都引入AI模型,再通過(guò)一些規(guī)則和算法,讓每個(gè)模塊的AI模型有機(jī)結(jié)合起來(lái)。“但這樣的方法仍然需要很多規(guī)則時(shí)代的工程師去定制接口,進(jìn)行拼接和串聯(lián)。”李力耘說(shuō)道。
2、車端大模型:自下而上地在車端去構(gòu)建網(wǎng)絡(luò)來(lái)解決問(wèn)題的方法,但是眾所周知,車端算力是有限的,車端大模型也有著「見(jiàn)效快,但上限低」的缺點(diǎn)。
3、云端大模型:這也是小鵬目前采用的方案。李力耘稱,只有突破硬件的限制,真正的探索能力的上限才是智駕的制勝關(guān)鍵——云端大模型往往比車端模型有著幾十甚至百倍的參數(shù)可以去消耗。
“作為Scaling Law的忠實(shí)的信徒,我們會(huì)去探索其極限,也會(huì)嘗試以更大的模型,更高的算力,更多的數(shù)據(jù)來(lái)實(shí)現(xiàn)極致的智能駕駛的體驗(yàn)。”
李力耘表示,端到端的本質(zhì)其實(shí)是信息的無(wú)損傳輸,以及由數(shù)據(jù)構(gòu)建的網(wǎng)絡(luò)。它具備很強(qiáng)的泛化能力以及擬人性,數(shù)據(jù)中的每一個(gè)像素都可能會(huì)轉(zhuǎn)化為某一種規(guī)則,這樣就能夠做到對(duì)場(chǎng)景和信息不遺漏重點(diǎn)。
相較來(lái)看,規(guī)則方案會(huì)面對(duì)無(wú)法窮盡的問(wèn)題。而在大模型尤其是云端大模型的以及未來(lái)蒸餾在車上的形式下,都能夠使智駕體驗(yàn)實(shí)現(xiàn)質(zhì)變。
對(duì)此,李力耘舉了一個(gè)例子:在規(guī)則時(shí)代,算法團(tuán)隊(duì)需要定義無(wú)數(shù)的限速,包括各種彎道限速、曲率限速、路口限速、紅綠燈的限速,甚至還有逼近其他車輛的限速……但以AI來(lái)賦能之后,幾乎不用任何去定義任何類似的限速了。因?yàn)锳I會(huì)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)到老司機(jī)一樣的經(jīng)驗(yàn),以及防御性減速的方法。
同時(shí)他也指出,支撐云端大模型的離不開高算力:小鵬在2025年會(huì)持續(xù)投入AI相關(guān)的云端算力,預(yù)期將會(huì)達(dá)到10 EFLOPS,相比于2024的規(guī)模會(huì)增加2.6倍。
“在這樣的云端大模型以及海量數(shù)據(jù)的加持下,大模型會(huì)具有更好的時(shí)空的理解能力,也只有具備了這樣的能力,我們才能真正實(shí)現(xiàn)輕雷達(dá)輕地圖,擺脫激光雷達(dá)和高精地圖的依賴,實(shí)現(xiàn)真正的全國(guó)都好開。”
另外,小鵬目前也能做到「一套智駕軟件,標(biāo)配全車系」,也是因?yàn)樾※i能夠用一套軟件來(lái)適配所有的車型,這意味著需要有更強(qiáng)的工程化的平臺(tái)能力,包括數(shù)據(jù)采集、模型,還有算法對(duì)不同車型不同傳感器的適配。
因?yàn)樾※i的產(chǎn)品覆蓋了從MPV到轎跑的多種車型,以及從PRO到MAX的多個(gè)版本,其形態(tài)、底盤尺寸及傳感器的布置都不盡相同。
鷹眼方案的關(guān)鍵技術(shù)
李力耘指出,AI鷹眼視覺(jué)的智駕方案讓感知距離提升了125%,識(shí)別速度提升了40%。這意味著在做出變道繞行以及各種博弈的動(dòng)作中,P7+會(huì)更加敏捷。
他介紹稱,AI鷹眼視覺(jué)采用的是LOFIC技術(shù)(Lateral Overflow Integration Capacitor,橫向溢出集合電容),該方案本質(zhì)上是將攝像頭的光信號(hào)變成電信號(hào)。
“當(dāng)光線過(guò)強(qiáng)的時(shí)候或者光差過(guò)大的時(shí)候,人會(huì)需要適應(yīng),但是在LOFIC方案中,通過(guò)在車載攝像頭上應(yīng)用溝槽電容等技術(shù),可以很好地實(shí)現(xiàn)對(duì)光差的適應(yīng)。”
編者注:LOFIC是一項(xiàng)應(yīng)用于圖像傳感器的技術(shù)——在一般傳感器中,當(dāng)光線照射到光電二極管時(shí),會(huì)被轉(zhuǎn)化為光電子。而多余的光電子一旦溢出,就可能導(dǎo)致圖像過(guò)曝。
而LOFIC會(huì)在每個(gè)光電二極管旁邊增加一個(gè)額外的電容(溝槽電容),多余的光電子會(huì)流入到額外電容中,避免被浪費(fèi)掉,從而捕捉更多光線信息。
目前,小鵬實(shí)現(xiàn)了端到端智駕的第二步,接下來(lái),在明年的年底,小鵬希望借助更大的云端模型,以及對(duì)云端模型的蒸餾上車,以L2的硬件實(shí)現(xiàn)類L3的智能駕駛體驗(yàn)。2026年,小鵬會(huì)逐步推出部分場(chǎng)景的L4級(jí)體驗(yàn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.