【摘要】2025年1月7日,陣量科技完成A輪融資,三一集團、聯(lián)創(chuàng)集團等機構入局。
在AI算力需求井噴的背景下,這家成立僅4年的企業(yè)以Chiplet技術為矛,瞄準GPGPU芯片賽道,對標AMD MI系列。
其申請專利“芯粒通信方法”。Chiplet技術通過模塊化設計打破傳統(tǒng)芯片的良率與成本瓶頸。
事實上,陣量科技做的就是人工智能芯片相關的業(yè)務。
GPGPU突破了GPU僅用于圖形渲染的局限,賦予其通用計算能力。陣量的產(chǎn)品有關GPGPU(通用GPU),對標AMD的MI芯片。
傳統(tǒng)CPU如同全能小能手,能處理各類任務,但面對大規(guī)模并行計算時,效率欠佳。而GPGPU芯片擅長并行處理海量數(shù)據(jù),在計算密集型任務上優(yōu)勢顯著。
GPGPU 廣泛應用于人工智能領域、商業(yè)計算和大數(shù)據(jù)處理領域。科學研究領域也離不開GPGPU芯片的助力。
AMD的MI系列芯片應用于人工智能領域,如深度學習模型的訓練和推理。在處理大規(guī)模數(shù)據(jù)集和運行復雜算法時表現(xiàn)出色,適用于大語言模型的訓練與推理。
陣量科技同樣瞄準人工智能領域,迅速切入GPGPU芯片領域。
然而,臺積電封裝技術壟斷、美國芯片禁令下的供應鏈風險,以及英偉達CUDA生態(tài)壓制,讓這場國產(chǎn)替代之戰(zhàn)充滿變數(shù)。陣量能否在巨頭的陰影下殺出血路?答案或許藏在Chiplet的“碎片化優(yōu)勢”與政策紅利中。
以下是正文:
01
陣量新獲投資,押注Chiplet技術
2025年1月7日,陣量科技獲得A輪融資,三一集團、聯(lián)創(chuàng)集團、粵民投慧橋廣晟貳號(深圳)投資合伙企業(yè)三家機構投資陣量。陣量科技注冊資本為50366.3003萬人民幣,成立于2020年5月6日。
當前AI生產(chǎn)力大爆發(fā),根據(jù)AGI時代的“二八定律”,80%的軟件功能將由人工智能自動生成,僅有20%需要人工手動調試。大模型的飛速發(fā)展對芯片算力的需求越來越高,給芯片行業(yè)帶來了挑戰(zhàn),但也有機遇。
陣量科技CEO王勇曾指出:從AI1.0到AI2.0,AGI之路的重大里程碑就是大模型。
他認為:在AI2.0時代,GPU會代替CPU成為行業(yè)最重要的IP;Chiplet,3D IC等會成為趨勢;工藝仍然會往2nm演進,GAA、CXL、背面供電、垂直供電、存內(nèi)計算、光電共封等技術會落地。
2024年6月26日,陣量科技申請了一項名為“一種芯粒通信方法及裝置、芯粒、芯片、存儲介質”的專利,并與同年10月11日公布。
芯粒,即Chiplet,是一種新興的半導體設計和封裝技術。
Chiplet 技術將復雜的芯片功能分解成多個小型、獨立且可復用的模塊。這些模塊可以是處理器核心、內(nèi)存芯片、傳感器或其他類型的集成電路,它們通過高速接口或連接器相互連接,形成一個完整的系統(tǒng)芯片。
Chiplet 允許使用不同的工藝節(jié)點制造不同的模塊。這意味著某些模塊可以使用先進的制程工藝,而其他模塊則可以使用較舊的、成本較低的工藝。這種靈活性有助于平衡性能和成本。
同時,由于Chiplet 模塊被設計為標準化的組件,可以在不同的系統(tǒng)中重復使用。允許添加或移除模塊,以調整系統(tǒng)的功能和性能。
這種模塊化方法使得系統(tǒng)更容易適應市場變化和技術創(chuàng)新。降低了設計復雜度和成本,同時提高了設計效率。
和傳統(tǒng)的SoC相比,Chiplet的良品率高,顯著降低了成本。
實際上,芯片越“大”,晶圓區(qū)域出現(xiàn)瑕疵的概率就越大,相應的良品率就越低。
而每個小芯片的制造和測試過程簡單可靠,晶圓區(qū)域出現(xiàn)瑕疵的概率低。因此Chiplet技術有助于提高良品率,進而降低生產(chǎn)成本和提高產(chǎn)品質量。
Chiplet 技術在帶來諸多優(yōu)勢的同時,也面臨著一些問題。首先,散熱和力學問題是 Chiplet 架構的一大挑戰(zhàn)。由于芯片堆疊,功耗顯著增加,導致散熱困難。
其次,封裝和成本問題也不容忽視。Chiplet 之間的互連需要高密度、低延遲的封裝技術。如果封裝技術不過關,可能導致 Chiplet 之間的互連不穩(wěn)定,影響芯片性能。
最后,信號傳輸和延遲問題也是 Chiplet 技術需要面對的難題。與傳統(tǒng)的單芯片 SoC 相比,Chiplet 之間的互連帶寬有限,且存在更高的延遲。這可能會影響芯片的整體性能,特別是在高性能計算、人工智能等需要高帶寬和低延遲的領域。
02
Chiplet架構重塑GPGPU
按照使用場景劃分,當前 Chiplet 架構主要應用于服務器處理器芯片、人工智能加速芯片、通信芯片、移動與桌面處理器芯片、晶圓級處理器芯片。
事實上,陣量科技做的就是人工智能芯片相關的業(yè)務。
隨著人工智能技術的發(fā)展,大模型的訓練和推理對人工智能加速芯片提出了更高的峰值算力和能耗要求。因此,采用Chiplet 架構設計芯片并集成HBM芯粒是一種非常流行的做法。
目前典型用于神經(jīng)網(wǎng)絡的訓練和推理的芯片可以分為3類:神經(jīng)網(wǎng)絡專用的加速器芯片、GPGPU芯片和 FPGA芯片。
GPGPU,即通用圖形處理單元,突破了GPU僅用于圖形渲染的局限,賦予其通用計算能力。
在 GPGPU 芯片中,國外企業(yè)采用Chiplet 設計的典型代表是 Intel Ponte Vecchio 芯片、AMD MI系列芯片、NVIDIA Corporation的 H100。
AMD首席執(zhí)行官蘇姿豐在Computex主題演講上表示最新的MI325X加速器將于2024年第四季度上市。
即將推出的MI350芯片系列,預計將于2025年上市。與現(xiàn)有的MI300系列人工智能芯片相比,MI350在推理方面的性能預計將提高35倍。
而陣量的產(chǎn)品有關GPGPU(通用GPU),對標AMD的MI芯片。
目前國內(nèi)企業(yè)的代表主要是壁仞、燧原。
其中壁仞B(yǎng)R100采用2片基于7 nm工藝的完整功能芯粒組合使用,再封裝 4片HBM2E。這款芯片獲得了世界人工智能大會的SAIL獎,標志著其在全球市場上獲得認可。
燧原DTU1.0則主要是在其GPGPU芯片封裝里集成了HBM內(nèi)存芯粒。
03
禁令下的國產(chǎn)GPGPU替代機遇
傳統(tǒng)CPU如同全能小能手,能處理各類任務,但面對大規(guī)模并行計算時,效率欠佳。而GPGPU芯片擅長并行處理海量數(shù)據(jù),在計算密集型任務上優(yōu)勢顯著。
GPGPU 廣泛應用于人工智能領域、商業(yè)計算和大數(shù)據(jù)處理領域。在人工智能領域,機器學習、深度學習模型訓練需要進行海量矩陣運算,GPGPU芯片憑借其強大的并行計算核心,能在短時間內(nèi)完成復雜計算,大幅縮短訓練時間。GPGPU可以用于深度學習模型的訓練和推理,加速圖像識別、語音識別、自然語言處理等任務。
科學研究領域也離不開GPGPU芯片的助力。在計算化學中,模擬分子結構和化學反應過程,數(shù)據(jù)量巨大且計算復雜。GPGPU芯片能夠高效處理這些數(shù)據(jù),幫助科研人員更快地探索新的藥物分子、材料特性,加速科研進程。
AMD的MI系列芯片主要應用于人工智能領域,如深度學習模型的訓練和推理。這些芯片在處理大規(guī)模數(shù)據(jù)集和運行復雜算法時表現(xiàn)出色,適用于大型語言模型的訓練與推理。
陣量科技同樣瞄準人工智能領域,迅速切入GPGPU芯片領域。
當前,GPGPU領域仍面臨著壟斷和渠道受限。高端2.5D/3D封裝技術仍被臺積電CoWoS壟斷,國內(nèi)長電科技、通富微電的工藝成熟度落后1-2代。
美國芯片禁令導致7nm以下代工流片渠道受限,壁仞科技BR100芯片被迫采用成熟制程組合,性能僅為英偉達A100的70%。
美國的芯片禁令主要限制英偉達、AMD向中國出售GPGPU。此舉導致中國高算力芯片供應不足,一定程度上限制了中國人工智能業(yè)的發(fā)展。不過同時也刺激了中國GPGPU的國產(chǎn)替代,為GPGPU國產(chǎn)打開了市場大門。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.