AGI時代下,未來汽車出行會是怎么樣的?在2025上海車展開幕之際,新民晚報記者采訪了商湯科技聯合創始人、首席科學家、商湯絕影CEO王曉剛。商湯絕影是最專注于汽車行業領先的AI公司,旨在推動智能汽車加速駛入通用人工智能時代。
在他看來,“未來汽車”要實現更為自然的、有溫度的人車交互體驗,讓智能汽車從出行代步工具,進化為有情感的家庭新成員;同時它還能結合世界模型,持續提升輔助駕駛的性能,讓駕駛安全更有確定性。
商湯科技聯合創始人、首席科學家、商湯絕影CEO王曉剛
新民晚報:AGI賦能下,會給智能汽車帶來哪些主要變革?
王曉剛:我認為主要在三方面:第一是通過原生流式多模態大模型帶來的人機交互體驗的變革;第二是通過端到端智駕技術的升級,帶來極致自動駕駛安全和效率;第三是艙駕融合驅動智能汽車往超級智能體方向演進,極大拓展了人與物理和數字世界的連接。
在智能汽車的應用部署上,絕影制定了端云協同的部署策略,通過意圖分流來進行任務在端云兩側的協同,當前場景任務有80%是在端側處理。端云協同的方式可覆蓋廣泛的場景交互,保證安全可靠、實時響應,并充分保障個人隱私安全。
新民晚報:在“艙—駕—云”三方面,絕影提供了哪些被業界廣泛認可的解決方案?
王曉剛:在智能駕駛領域,我們在2022年發布了行業首個感知決策一體化的輔助駕駛通用模型UniAD,這是和特斯拉FSD一樣的一段式端到端方案,獲得2023年國際計算機視覺與模式識別會議的最佳論文,引領行業的潮流。今年,我們又發布了行業首個與世界模型協同交互的端到端智駕技術方案R-UniAD,讓世界模型和強化學習框架相結合,構建生成式智駕新范式,這也是今年行業都非常認可的技術方案。
面向智能座艙,我們打造了新一代座艙情感引擎New Member“家庭新成員”,能夠察言觀色、無時不在、與你心有靈犀,讓每一輛車擁有“有趣的靈魂”,這個產品得到很多認可,不少車企也在之后發布了類似的概念,這款產品已經在知名車企量產交付了,今年車展我們也進一步升級,發布行業首個專為車載AIOS打造的AI內核“絕影千機”,助力New Member實現突破性技術升級。
我們還有更多的AI產品也都是創新性的,比如我們有一個全場景健康管家產品,3月份量產上車了星途攬月,是行業首個量產上車的醫療AI大模型產品。
新民晚報:現在是大模型的時代,大模型為智能汽車的發展帶來了哪些助力?
王曉剛:絕影打造了世界模型“開悟”——它可以理解真實世界中的“物理法則”和“交通規則”,并在此基礎上,能夠生成“準確”的場景。具體來說,生成的視頻是11V時空一致的,時間最長可以達到150秒,分辨率能夠達到1080P;同時,“開悟”生成的場景也是可控的,能細微到“元素級別”,生成場景非常精細,完全滿足端到端模型訓練和仿真對于數據質量的高要求。
“開悟”生產數據的效率很高。對比行業平均水平,我們進行過測算,基于1張 A100 GPU,“開悟”世界模型平均每天的數據生成量,相當于100臺路測車的數據采集能力,比得上500臺量產車的效率。
世界模型“開悟”
上海車展上面,“開悟”世界模型也升級到了2.0版本,結合強化學習框架,能夠實現端到端算法和世界模型的協同交互,打破數據瓶頸,讓輔助駕駛的安全更有確定性。
New Member(家庭新成員)背后則離不開多模態大模型的支持,絕影的原生流式多模態大模型讓世間萬物都可被感知、被理解、被交互。商湯最近發布了日日新V6多模態大模型,我們也實現了端側部署,New Member也有突破性的技術升級,能夠做到多模態識人,汽車不僅能夠認識你,還可以理解你,不再是被動響應,而是成為一個懂你、會揣摩你心思的“聰明搭子”,能夠真正參與到座艙內的多人多輪對話當中,既不過度打擾,但又能時刻陪伴。
我們的New Member是通過集成了大語言模型、多模態大模型還有記憶框架等AI能力,才能實現察言觀色、無時不在、與你心有靈犀的交互,讓每一輛車擁有“有趣的靈魂”。
原標題:《新民·科技前沿|商湯絕影CEO王曉剛:智能汽車如何駛向AGI時代》
欄目編輯:馬丹 圖片來源:采訪對象供圖
來源:作者:新民晚報 郜陽
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.