采訪 | 周長賢 張祥威 撰文 | 張祥威 編輯|馬青竹
王曉剛與沈邵劼、周光等偶爆“金句”的友商技術高管不同,這位商湯絕影一號位,言辭樸實。做過香港中文大學電子工程系教授的他,被人稱作王老師。
2017年,在智能駕駛還比較蠻荒的時代,王老師曾帶隊拿下本田長達5年的智駕合作。僅依賴攝像頭,且未搭載激光雷達和高精地圖。
之后幾年,自動駕駛領域大事不斷,但智駕公司的商業化戰績并不突出。商湯絕影也埋頭前行,與母公司商湯科技業務上協同推進。
現在,商湯科技在上海臨港建立的AI智算中心,云端算力已從700P增至25000P,商湯絕影則基于豐沛的算力,2022年底,推出感知決策一體化的自動駕駛端到端通用模型UniAD。
OpenAI帶火ChatGPT后,商湯科技推出流式多模態“日日新5o”,商湯絕影基于此推出一系列智能座艙人交互方案。
近兩年,商湯絕影才進入量產期,與超30家國內外車企達成合作,覆蓋100余款車型。
其中,智駕方案分別在廣汽、合眾、一汽等共6款車型量產上車。
智能座艙大模型產品,主要在小米SU7(參數丨圖片)、吉利翼真L380、蔚來樂道L60上搭載,累計交付40多款車型,量產規模約120萬輛。
王曉剛預計,今年底量產交付將突破350萬輛。商湯絕影團隊約1000人規模,智駕是重心。
但在高階智駕一戰中,時下熱門的端到端賦能方案,商湯絕影量產略慢。規劃中,基于端到端的智駕方案,明年四季度量產。這比華為等頭部大概晚一年。
于是就在11月27日,商湯絕影帶來全新一代產品。“2024絕影實力AI DAY”上,王曉剛一口氣發布三款產品:
一段式端到端智駕UniAD量產解決方案、“開悟”世界模型、以及面向車端的情感AI引擎——"A New Member For U",中文名為“你的家庭成員”。
在華為、Momenta等各路合圍下,商湯絕影能順利殺出嗎?聽慣了端到端,商湯絕影會有什么不同?世界模型能否為下階段的自動駕駛帶來新氣象?
近日,《出行百人會/AutocarMax》專訪商湯絕影王曉剛,談及對技術、量產、合作模式的見解。
智駕敢開白盒
提及量產,表達一直內斂的王曉剛,用了“戰斗”一詞。
“中低階,我們要快速結束戰斗。現在,中低階智駕方案的市場在迅速增長,我們要能夠抓住時間窗口,有較好的市場份額。”
王曉剛說,之后商湯絕影會將重心放在端到端量產。
“過去兩年,絕影經歷了一個痛苦的過程,因為第一批量產項目交付過程中,工程化能力是不足的,缺少量產意識、交付意識。”王曉剛不避諱問題,直言基于地平線J5芯片的方案最終未能量產。
他解釋,這和主機廠規劃有關,基于地平線J5研發時,可以先熟悉計算平臺、工具鏈,某種意義上是為J6做準備。
這一過程,讓商湯絕影推動了組織架構的調整,接下來將面向量產交付,更加聚焦。與此同時,還積累了車企的信任,不止有上面提到的廣汽、合眾、一汽三家,還有后面的大客戶——奇瑞大卓、東風。
今年10月,奇瑞尹同躍喊出“智能化不客氣了”,同日,奇瑞旗下大卓智能與商湯絕影達成戰略合作。
商湯絕影與大卓的合作,正是緣起地平線的新一代芯片平臺J6。彼時,基于J6,大卓的感知團隊與商湯絕影均在進行研發,雙方接觸后,看到各自資源和能力上的短板,決定合作。
來自技術、體系、文化等維度的挑戰,是大多AI公司要面臨的挑戰。曾有智駕高管直言,跟著項目駐場開發時,由于工程化問題,挨罵是常態。
與大卓合作,王曉剛基本上每周會去一趟蕪湖,到了先試車,再和客戶開會。
王曉剛說,“自動駕駛對質量的要求非常高,量產交付后,車企會做壓力測試,偶爾出現一個BUG,我們就要全力找原因,反復做各種測試,沒日沒夜。”
與主機廠合作,中后期重點在于體驗。商湯絕影建立了體驗群,各條線研發負責人都會親身上車體驗,看實車表現究竟如何,而不單是解決數據集的問題,或看看性能曲線。
王曉剛準備迅速結束中低階的戰斗,他認為,“中低階方案,接下來半年左右是關鍵窗口期。”由于中低階方案對體驗的要求已經明確,商湯絕影將基于地平線J6平臺,降低成本,形成快速復制的能力。
雙方的合作模式也頗為大膽,許多智駕公司將算法視為至寶,商湯絕影卻敢于白盒交付。
“大卓類似廣汽研究院的角色。我們幫奇瑞建立自有的智駕能力,會交付白盒方案。”一位商湯絕影人士向《出行百人會/AutocarMax》透露。
白盒交付,相當于算法團隊直接供車企調用。智駕公司通常擔心團隊被挖,核心算法被車企學去。據了解,一些如卓馭級別的頭部智駕供應商,甚至因拒絕車企的白盒交付需求,錯失大客戶定點。
但上述商湯絕影人士認為,“開白盒,可以讓車企感到供應鏈可控,不擔心被卡脖子。相當于教給了車企方法,車企掌握后,可以基于方案開發一些定制化的功能。”
商湯絕影不擔心白盒交付的風險。
“敢于交付白盒的核心原因是,雙方合作基于算力。我們可以向車企提供全棧算法,最終目的是建立數據閉環體系,把云端算力用起來,模型的能力就會越來越強。”上述商湯絕影人士稱。
與擅長算法的自動駕駛公司相比,商湯絕影長于算力,母公司商湯擁有20000P算力,也就是20E FLOPS。雖然商湯的算力并非專為汽車而設,但資源充足。
王曉剛說,“將來AI公司跟主機廠合作,是一個趨勢,不再是標準化黑盒的交付,更多的是研發體系對齊、共創共建的過程。”
如今,商湯絕影和大卓的合作也跳出具體項目,擴展至中低階、高階、端到端方案等多維度。
絕影實力AI Day上,王曉剛公布高階智駕量產節點,全場景高階智駕方案將在2025年Q2量產;基于UniAD的端到端方案于2025年Q4量產。
全場景高階智駕,包含兩種方案:
AD Pro,基于地平線J6 E(80 TOPS),搭載7VnR,最高可實現城市記憶行車;
以及AD Max,基于地平線J6 M(128 TOPS),搭載11VnR,最高實現城區領航。
此外,基于UniAD的端到端方案,又被稱為AD Ultra,將基于NVIDIA Orin/Thor(200+TOPS),搭載11VnR,最高實現端到端城區領航。
上述產品和節點,基本上可以理解為給大卓的量產定制方案,以及量產承諾。
若能按時推進,奇瑞百萬級新車的大門將為其打開。更重要的是,商湯的云端基礎設施,將有用武之地,趕赴端到端、大模型的下一站。
量產端到端,商湯絕影的硬仗
拋開蔚小理等全棧自研派,自動駕駛生態圈如今呈現一種格局:車企掌握數據,智駕供應商掌握算法、算力。
這就意味著,算法能力,車企難以短時間具備。算力,由于投入巨大,車企也會謹慎投入。
所以,雙方彼此需要合作。
如前文所說,商湯絕影愿意白盒交付。更深遠的意義,是為與車企建立背靠背信任關系,獲取數據,從而基于自身算力等基礎設施,完善自動駕駛大模型,比如絕影實力AI Day上發布的「開悟」世界模型。
世界模型,圖靈獎得主楊立昆是最早提出這一概念的專家之一,后被特斯拉、毫末智行、蔚小理、華為等引用。
當下,車企、自動駕駛公司推出的端到端,遠非終點,業內研發人士習慣稱其為端到端1.0時代。下一代演進方向,指向更好地理解物理世界。
商湯絕影的“開悟”世界模型,文藝點的說法是,在云端為端到端智駕再造時空,給機器呈現一個“賽博世界”。可以用于端到端模型的訓練,也可以滿足仿真需求。
王曉剛解釋,“端到端類似人的小腦,接到信號以后,自然反射做出駕駛行為。多模態大模型類似人的大腦,能夠做出分析。今天的量產數據是不夠的,可以依靠世界模型去生成各種視頻,比如特定的Corner Case,做好模擬數據的仿真。”
據悉,“開悟”世界模型,可生成150秒時長的Clips級數據,以及1024類場景。這將用于仿真、泛化,對理解真實世界,以及理解車輛運動規律和交通規則發揮重要作用。
對于主流的11V方案,“開悟”世界模型則做到了視角時空對齊,以及克服魚眼視角畸變、可靈活滿足行泊場景需求。
于世界模型,各家用法類似,就看能否順利落地,以及愿意買單。
“隨著高階自動駕駛和無人駕駛的到來,智能輔助駕駛技術不可能以單一軟件功能的方式售賣,智駕會帶來高昂的數據費用,在大模型領域里面甚至很難有Tier 1。”何小鵬認為。
他提到,“原來的?動駕駛,可以?Tier1和整??合作的方式進?PK。但是,在從?腦到?腦到整?,全部軀體都可以?AI驅動的情況下,Tier1不可能全域AI都做。所以,Tier1在未來的3-4年會迅速有變化。”
王曉剛承認,一體化趨勢對Tier1和主機廠原有的合作模式提出挑戰。
“嚴格來說,商湯并不是傳統意義上的Tier1。系統分成各個模塊,不同供應商完成其中一塊,Tier1負責最終的系統集成和兜底。AI大模型出現后,各模塊之間的邊界逐漸模糊,甚至消失。自動駕駛大模型,需要將各個模塊都串起來,需要Tier1有更強的AI能力。”
同時,他也提出反問,主機廠是否要把所有的事兒都做了?
“既然所有的東西都是在一起的,是不是主機廠要做所有的事情?從算法、軟件一直到芯片,什么都自己做完。我覺得也不是。這樣的話,主機廠負擔就會變得非常的重,因為投入還是非常大的。”
不是所有車企都有全棧自研的決心和能力,但也有車企已經開啟自研之路。在正確答案塵埃落定前,商湯絕影等智駕供應商們要盡快完成自證。
結語
最近,王曉剛被問到平時有什么愛好,他直言,“愛好比較少了。這幾年在業務上投入的精力非常多,跟以前當老師時就非常不一樣。”
量產關鍵期,帶隊打仗壓縮了個人生活空間,應該是常態。
本田、一汽等項目之后,奇瑞的大卓等將是商湯絕影的新試卷,成了就是樣板,能帶來更多客戶,留在牌桌。王曉剛也知道,越往后競爭會更激烈,時間稀缺。
—THE END—
出行百人會 | AutocarMax
追蹤汽?出行產業鏈進化,關注新產品、新科技、商業邏輯與商業人物,影響圈層中有影響力的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.