4月14日,香港汽車行業(yè)開始進(jìn)入全新的大模型研發(fā)浪潮。4月14日,小鵬汽車在香港舉辦AI技術(shù)分享會,首次披露正在研發(fā)720億參數(shù)的超大規(guī)模自動駕駛大模型,即“小鵬世界基座模型”。未來,小鵬將通過云端蒸餾小模型的方式將基模部署到車端,給“AI汽車”配備全新的大腦。這款模型同時也將賦能小鵬的AI機(jī)器人、飛行汽車等。
小鵬汽車自動駕駛負(fù)責(zé)人李力耘介紹,小鵬基模是一個以大語言模型為骨干網(wǎng)絡(luò),使用海量優(yōu)質(zhì)駕駛數(shù)據(jù)訓(xùn)練的多模態(tài)大模型,具備視覺理解能力、鏈?zhǔn)酵评砟芰蛣幼魃赡芰ΑMㄟ^強(qiáng)大的強(qiáng)化學(xué)習(xí)訓(xùn)練,基座模型不斷自我進(jìn)化,將逐步發(fā)展出媲美甚至超越人類的自動駕駛技術(shù)。
李力耘透露,為了研發(fā)基模,小鵬汽車早在去年就開始布局AI基礎(chǔ)設(shè)施,現(xiàn)已建成國內(nèi)汽車行業(yè)首個萬卡智算集群,用以支持基座模型的預(yù)訓(xùn)練、后訓(xùn)練、模型蒸餾、車端模型訓(xùn)練等任務(wù),小鵬汽車將這套從云到端的生產(chǎn)流程稱之為“云端模型工廠”。目前,小鵬“云端模型工廠”擁有10 EFLOPS的算力,集群運(yùn)行效率常年保持在90%以上,從云到端的全鏈路迭代周期可達(dá)平均5天一次。
小鵬世界基座模型:具備長思維鏈推理能力,參數(shù)規(guī)模高達(dá)720億
早在2024年下半年,小鵬汽車已開始面向L4級別的自動駕駛研發(fā)全新的“AI大腦”,即小鵬世界基座模型。
小鵬研發(fā)團(tuán)隊(duì)利用優(yōu)質(zhì)自動駕駛訓(xùn)練數(shù)據(jù),先后開發(fā)了多個尺寸的基座模型,目前已經(jīng)著手推進(jìn)72B(72 Billion,即720億)超大規(guī)模參數(shù)世界基座模型的研發(fā),參數(shù)量是主流 VLA 模型的35 倍左右。
小鵬世界基座模型的一大優(yōu)勢是具備鏈?zhǔn)酵评砟芰Γ–oT),在充分理解現(xiàn)實(shí)世界的基礎(chǔ)上,能夠像人類一樣進(jìn)行復(fù)雜的常識推理,并將推理結(jié)果轉(zhuǎn)化為行動,例如輸出方向盤、剎車等控制信號,實(shí)現(xiàn)和物理世界的交互。
未來,經(jīng)由基座模型的賦能,智能駕駛系統(tǒng)有望從“模仿人類”進(jìn)化到“超越人類”,最終能夠處理全場景的自動駕駛問題,包括一些模型從來沒在訓(xùn)練數(shù)據(jù)中遇到的問題。
從設(shè)計(jì)之初,小鵬汽車就將基模定位為一個可以泛化到多種具身終端的基座模型。李力耘表示:“小鵬世界基座模型是小鵬自動駕駛真正走向L3、L4的基礎(chǔ),也會是未來小鵬所有物理AI終端的通用模型。”后續(xù),小鵬世界基座模型將全面賦能小鵬AI體系全圖譜,應(yīng)用到小鵬汽車的AI汽車、AI機(jī)器人、飛行汽車上。
從0打造云端模型工廠,開啟AI時代模型生產(chǎn)新范式
為了開發(fā)小鵬世界基座模型,小鵬汽車打造了一座“云端模型工廠”,工廠“車間”涵蓋基座模型預(yù)訓(xùn)練和后訓(xùn)練(強(qiáng)化學(xué)習(xí)訓(xùn)練)、模型蒸餾、車端模型預(yù)訓(xùn)練到部署上車的完整生產(chǎn)鏈路。“云端模型工廠”采用強(qiáng)化學(xué)習(xí)、模型蒸餾的技術(shù)路線,能夠高效生產(chǎn)“小身材、大智商”的端側(cè)模型,甚至為不同需求的汽車定制不同的“大腦”,讓“千人千面”的模型研發(fā)成為可能。
小鵬汽車從2024年開始搭建AI基礎(chǔ)設(shè)施(AI Infra),當(dāng)前已建立起萬卡規(guī)模的智能算力集群,是目前國內(nèi)汽車行業(yè)最大的自動駕駛算力集群。小鵬汽車的算力儲備達(dá)到10EFLOPS,集群利用率常年高達(dá)90%以上,高峰時期的運(yùn)行效率甚至達(dá)到98%。
小鵬世界基座模型負(fù)責(zé)人劉博士介紹,多模態(tài)模型訓(xùn)練的主要瓶頸不僅是 GPU,也需要解決數(shù)據(jù)訪問的效率問題。小鵬汽車自主開發(fā)了底層的數(shù)據(jù)基礎(chǔ)設(shè)施(Data Infra),使數(shù)據(jù)上傳規(guī)模提升22倍、訓(xùn)練中的數(shù)據(jù)帶寬提升15倍;通過聯(lián)合優(yōu)化 GPU / CPU 以及網(wǎng)絡(luò) I/O,最終使模型訓(xùn)練速度提升了 5 倍。目前,小鵬汽車用于訓(xùn)練基座模型的視頻數(shù)據(jù)量高達(dá)2000萬clips,這一數(shù)字今年將增加到2億clips。
依托強(qiáng)大的AI基礎(chǔ)設(shè)施和數(shù)據(jù)基礎(chǔ)設(shè)施,小鵬開啟了全新的基座模型研發(fā)范式,從云端模型預(yù)訓(xùn)練到車端模型部署,整個“云端模型工廠”的迭代周期達(dá)到平均5天一次。
時隔一年,小鵬汽車在物理世界AI領(lǐng)域取得三大階段性成果
2024年是汽車行業(yè)的“端到端”之年,在率先量產(chǎn)端到端大模型一年之時,小鵬汽車又在物理世界大模型研發(fā)上再進(jìn)一步。小鵬汽車在分享會上披露了基模研發(fā)的三個階段性成果:
· 階段性成果1:驗(yàn)證規(guī)模法則在自動駕駛領(lǐng)域持續(xù)生效;
· 階段性成果2:在后裝算力的車端成功實(shí)現(xiàn)基模控車;
· 階段性成果3:啟動72B參數(shù)基模訓(xùn)練,搭建針對強(qiáng)化學(xué)習(xí)的模型訓(xùn)練框架。
規(guī)模法則(Scaling Law)揭示了大模型的性能如何隨著模型的計(jì)算量、訓(xùn)練數(shù)據(jù)量和參數(shù)量的提升而提升,被視為AI領(lǐng)域的“摩爾定律”。規(guī)模法則在大語言模型(LLM,Large Language Model)領(lǐng)域已被充分驗(yàn)證,但自動駕駛基座模型復(fù)雜得多,它的訓(xùn)練數(shù)據(jù)遠(yuǎn)不止單模態(tài)的文本數(shù)據(jù),還包括攝像頭信息、導(dǎo)航信息等關(guān)于物理世界的多模態(tài)數(shù)據(jù),本質(zhì)上,它要求模型對物理世界形成認(rèn)知和理解。利用駕駛數(shù)據(jù)訓(xùn)練基模,尤其是參數(shù)規(guī)模逐步擴(kuò)大到百億級別之后,規(guī)模法則是否還持續(xù)生效?此前行業(yè)內(nèi)不曾有過充分的驗(yàn)證。
小鵬團(tuán)隊(duì)首次驗(yàn)證了規(guī)模法則在自動駕駛領(lǐng)域持續(xù)生效,劉博士表示:“過去一年,我們做了大量實(shí)驗(yàn),在10億、30億、70億、720億參數(shù)的模型上都看到了明顯的規(guī)模法則效應(yīng):參數(shù)規(guī)模越大,模型的能力越強(qiáng)。同樣的模型大小,訓(xùn)練數(shù)據(jù)量越大,模型的能力也會越強(qiáng)。”
不久前,小鵬汽車將理論變?yōu)楝F(xiàn)實(shí),在后裝算力的車端上用小尺寸基模實(shí)現(xiàn)了控車。盡管只是非常早期的實(shí)車測試,全新基模已經(jīng)展現(xiàn)出令人驚喜的基礎(chǔ)駕車技能。
小鵬汽車去年就已開始研發(fā)強(qiáng)化學(xué)習(xí)技術(shù),用以提升基座模型的性能天花板。劉博士表示,強(qiáng)化學(xué)習(xí)能夠幫助模型自我進(jìn)化,學(xué)會處理訓(xùn)練數(shù)據(jù)中沒有的長尾問題,做到極致安全的自動駕駛。只有足夠強(qiáng)大的基座模型,才能被強(qiáng)化學(xué)習(xí)不斷激發(fā)出能力上限。這也是小鵬汽車選擇云端蒸餾路線的原因之一:在云端不計(jì)成本地訓(xùn)練出足夠聰明且泛化能力強(qiáng)的模型,將其蒸餾到適配車端算力的小尺寸模型上,最終可讓車端模型的性能超越車端算力“一畝三分田”的限制。
值得一提的是,強(qiáng)化學(xué)習(xí)、云端蒸餾等技術(shù)方案,在今年爆火的DeepSeek論文中都得到了驗(yàn)證。
基模研發(fā)是小鵬汽車“AI化”轉(zhuǎn)型的重要一步,不過,即便來到“大模型時代”,過去“規(guī)則時代”的領(lǐng)先經(jīng)驗(yàn)仍在發(fā)揮作用。在開發(fā)強(qiáng)化學(xué)習(xí)的獎勵模型(Reward Model)時,研發(fā)團(tuán)隊(duì)基于規(guī)則經(jīng)驗(yàn)設(shè)計(jì)了獎勵函數(shù),將規(guī)則時代的沉淀轉(zhuǎn)化為了訓(xùn)練基座模型的生產(chǎn)力。
同時,小鵬汽車已經(jīng)著手開發(fā)世界模型(World Model),作為“云端模型工廠”的重要一環(huán),支持基座模型的性能優(yōu)化。劉博士介紹,小鵬的世界模型是一種實(shí)時建模和反饋系統(tǒng),能夠基于動作信號模擬出真實(shí)環(huán)境狀態(tài),渲染場景,并生成場景內(nèi)其他智能體(也即交通參與者)的響應(yīng),從而構(gòu)建一個閉環(huán)的反饋網(wǎng)絡(luò),幫助基座模型不斷進(jìn)化,逐漸突破過去“模仿學(xué)習(xí)”的天花板。
關(guān)于小鵬世界基座模型研發(fā)和訓(xùn)練成果更多的細(xì)節(jié),今年6月小鵬汽車將會在計(jì)算機(jī)視覺國際頂會CVPR上進(jìn)一步分享,敬請期待。
關(guān)于小鵬汽車
小鵬汽車致力于通過探索科技,引領(lǐng)未來出行變革,做“未來出行探索者”。公司總部位于廣州,在北京、上海、深圳、肇慶、揚(yáng)州等地設(shè)有研發(fā)中心,并在肇慶和廣州布局智能制造基地。同時,小鵬汽車面向全球進(jìn)行研發(fā)和銷售布局,已在美國設(shè)立研發(fā)中心、在歐洲多地設(shè)立分公司。小鵬汽車堅(jiān)持全棧自主研發(fā)智能輔助駕駛軟件和開發(fā)核心硬件,為用戶帶來卓越的智能駕乘體驗(yàn)。2020年8月27日,小鵬汽車正式登陸紐交所,募資規(guī)模打破當(dāng)時全球新能源汽車行業(yè)IPO紀(jì)錄,股票代碼為“NYSE:XPEV”;2021年7月7日,小鵬汽車掛牌香港聯(lián)交所,股票代碼“9868.HK”,成為首個在中國香港和美國紐約兩地雙重主要上市的中國造車新勢力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.