撰文 | 張祥威 編輯|馬青竹
幾個月前,黑芝麻(參數丨圖片)智能上市,創始人兼CEO單記章告訴投資人,那天相當于“抵達延安”。
他還有更長遠的行軍計劃,“2030年在中國做到市場占有率領先,2040年在端側做到全球第一。”
聽起來很難,英偉達就像大山擋在前面。單記章也認同,英偉達最厲害的是訓練。但他希望,在端側,黑芝麻智能是更有優勢。
眼下,黑芝麻智能和英偉達的下一次交鋒就要開始,華山A2000家族對決Thor系列。
交鋒的背景,是一場新的芯片戰將要到來。
智駕人的2024年非常熱鬧。“無圖NOA”“全國都能開”“端到端”“大模型”“去激光雷達”“車位到車位”……隔一陣兒,就搞點兒新名詞。
熱鬧中,高階智駕下探到15萬元級新車,全系標配漸成趨勢。
即將告別2024,明年智駕人大概率仍不會放松,另一場AI大模型之戰要來了。
智駕芯片供應商更不會放松,英偉達那款熱門芯片Thor要解決設計缺陷盡快量產,幾家國產智駕芯片廠的新一代產品,也來到上車關鍵期。更好地支持大模型,是智駕芯片接下來的重頭戲。
黑芝麻智能入局大模型之戰的船票A2000家族,在年底剛正式推出。這一專為AI模型設計的芯片平臺,包含A2000 Lite、A2000、A2000 Pro三款產品,最高算力相當于4顆行業旗艦芯片,意味著達到上千TOPS的水平。
能否順利通過大模型考驗,黑芝麻智能相比對手又有哪些底牌?從A2000家族芯片上能窺得一斑。
自研NPU和ISP,原生支持大模型
黑芝麻智能數據顯示,A2000家族的三款芯片,算力分別相當于1顆、2顆和4顆行業旗艦芯片,不難看出,行業旗艦芯片應該指的是Orin X。
作為對比,蔚來神璣NX9031相當于4顆,小鵬圖靈AI芯片相當于3顆。
這意味著,A2000家族的算力分別約為250TOPS、500TOPS和1000TOPS。最高算力與英偉達Thor一致。
三款芯片,除面向智駕,支持實現NOA,且可以應用于Robotaxi,A2000家族還支持機器人和通用推理計算等多個領域。
賬面算力上,黑芝麻智能A2000家族是夠的。挑戰在于,能否適配最新的算法模型。
據《出行百人會/AutocarMax》了解,部分上一代國產智駕芯片在支持BEV算法時存在問題。主要由于芯片設計階段,BEV算法尚未提出。導致在適配BEV算法時,拖慢上車進度,讓部分車企對國產智駕芯片產生顧慮。
此次推出A2000家族,黑芝麻智能表示,芯片多合一集成了CPU、DSP、GPU、NPU、MCU、ISP和CV等,單芯片能多任務處理。最重要的是,架構設計原生支持Transformer大模型。
拆開看,A2000家族的CPU為16核,采用ARM Cortex-A78處理器。MCU為6顆ARM Cortex R52。
而核心部件NPU和ISP,均為黑芝麻智能自主設計。NPU又稱神經網絡處理加速器,支持卷積、矩陣乘、非線性計算等。自上一代華山A1000芯片,黑芝麻智能便自主設計。
此次,黑芝麻智能推出自研NPU新架構——“九韶”,采用獨立大核架構,而非傳統的小核心堆疊。
小核心堆疊是將大量小計算核集成,軟件看到的是多個核。優勢是容易實現,也容易獲得理論算力的提升,比如單個核的算力去乘以核數量。但事實上軟件要調度好這些小核的使用,達到線性的多核性能表現,幾乎是不可能的,所以說只是“紙面”的理論性能提升。除了導致軟件復雜外,還有額外開銷大、延遲、不穩定等問題。
基于大核架構,軟件只看到一個核,省去了大量核間調度的工作,開發重心可以放在算法本身,而非硬件使用上,同時,還具有實際性能高、低延時,能效高2倍以上等優勢。缺點是芯片實現難度高。
黑芝麻智能表示,大核架構能簡化算法多任務并行處理的難度,支持智駕大模型的實時推理,降低計算延遲,支持優先級搶占機制,滿足復雜計算任務需求。
于智駕芯片而言,這相當重要。
當下,基于英偉達Orin X,智駕芯片支持的VLM模型參數可達到2B規模。基于下一芯片,參數規模將大幅提升。以小鵬圖靈AI芯片為例,可支持30B大模型參數規模,為提升神經網絡處理效率,小鵬還自研設計了2個NPU。
何小鵬甚至判斷,“當前量產車的算力水平在500TOPS,未來需求水平則要達到1萬TOPS。”
“1萬TOPS有些不太現實,要考慮功耗、成本等。幾千TOPS應該是有的,”另一智駕人士判斷。
綜合算力、CPU核、NPU架構等信息,合理推測A2000家族采用了制程工藝更高的5nm,與蔚來、小鵬的自研芯片處于同一檔。
不過,決定芯片水平高低的遠不止賬面算力等指標,還涉及開發部署便利性、安全等級等。
據悉,九韶架構支持包括INT8/FP8/FP16在內的混合精度計算,既可針對高精度進行精細量化,又可節省資源,提高速度,實現Transformer的硬加速,簡化開發者的量化和部署。
九韶架構還具備高安全等級,能避免模型推理過程中的隨機錯誤和失效,實現訓練與部署一致性,確保自動駕駛系統的高安全性和確定性。
此外,九韶架構采用低延時和高吞吐的三層內存架構,包括大容量高帶寬的NPU專用緩存、核心模塊片內共享緩存,以及對稱的雙數據通路和專用DMA引擎,提升了性能和有效帶寬。
通過以上設計,黑芝麻智能A2000在迎戰大模型時,或將能與智駕算法供應商更順利地協同,完成量產上車。
芯片制勝的其它因素:ISP、量產經驗與成本
除了計算能力,其它因素同樣影響著車企的判斷。
其一,ISP圖像處理能力。
即便800萬像素前視攝像頭已經上車,采集回來更清晰的圖片,但車企仍對智駕芯片的ISP有著強烈需求。
蔚來神璣NX9031、小鵬圖靈AI芯片,均圍繞ISP能力進行了布局。蔚來自研ISP技術,小鵬采用2個獨立圖像ISP,通過AI降噪算法,以及更高的處理位寬,讓芯片在黑夜、逆光、雨天等暗光場景下,獲得更清晰的圖片數據。
自研ISP是華山系列研發歷代產品的慣例。單記章認為,新一代ISP技術基于自研,讓車輛看得更清更遠。
據悉,A2000家族的ISP具備4幀曝光和150dB HDR,提升了隧道、夜間等場景的圖像處理能力。能夠在暗光及明暗變化環境下,更好的對鏡頭中的小目標物體進行探測,以及檢測道路障礙物、交通標志和行人。
其二,量產經驗。
“智駕方案上車不是憑空出現的能力,一定有車企前期為其買單。部分智駕供應商之所以發展不順,還是在于缺少量產落地經驗。”一位新勢力智駕研發人士告訴《出行百人會/AutocarMax》。
量產驗證,考驗算法供應商,也考驗芯片供應商。
黑芝麻智能的A1000芯片,在智駕上車一戰中完成了量產驗證,分別在領克08 EM-P、東風奕派eπ007、合創V09等車型實現量產搭載。
這些案例,將讓黑芝麻智能積累了豐富的量產經驗,跑通量產后,同時搭建成熟生態,有助于后續芯片,收縮上車適配周期。
其三,成本控制能力。
蔚來、小鵬之所以自研芯片,一方面由于市面上通用芯片的算力無法最大化利用,另一方面,也因成本過高。
“新勢力自研芯片并不是特別難的事情。很多公司都是去買芯片的IP,自己主要做軟件工具鏈的配套。總體上,要比打造一顆通用芯片的成本少很多。”一位智駕供應商人士說。
他告訴我們,單顆英偉達Orin X芯片售價約500美金,成本約100美金,“賣500美金不是成本就那么貴,而是因為它沒有對手。”
A2000的NPU存算架構,不僅提升性能和有效帶寬,還降低對外部存儲帶寬的依賴,在性能、帶寬和成本間取得平衡。
黑芝麻智能提出“極限成本”,稱A2000家族將實現BOM成本、導入成本和迭代成本的多重目標。
在成本維度,國產智駕芯片通常低于海外芯片,這是它們搶客戶的一大優勢。接下來就看黑芝麻智能們,能否贏得智駕算法研發團隊的關鍵一票。
結語
回顧黑芝麻智能芯片歷程,從華山A500到A1000系列,再到主打艙駕融合的武當C1200,以及今天面向大模型的A2000家族,基本上緊貼智駕技術趨勢。這相當不易。
時下,造車新勢力已經上車VLM,VLA也很快被頭部確定為下一方向。新勢力自研芯片、英偉達Thor、國產智駕芯片,明年又是一場硬仗。
—THE END—
出行百人會 | AutocarMax
追蹤汽?出行產業鏈進化,關注新產品、新科技、商業邏輯與商業人物,影響圈層中有影響力的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.