(文/觀察者網(wǎng) 呂棟)
近日,美國不再限制英偉達H20芯片對華出口的消息引發(fā)關注,也再度凸顯外部算力供給的不穩(wěn)定性。事實上,在大模型催生的巨大算力需求下,中國企業(yè)高價購買“閹割版”英偉達芯片并非長久之際,如何獲取持續(xù)穩(wěn)定夠用的算力供給,已成為保證業(yè)務連續(xù)性的關鍵。
4月10日,國內(nèi)云計算領域的兩場大會成為行業(yè)焦點。
一個是2025中國移動云智算大會。中國移動董事長楊杰表示,以數(shù)智化為主要特征的新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展,數(shù)據(jù)成為新生產(chǎn)要素,算力成為新基礎設施和基礎能源,人工智能成為新生產(chǎn)工具,推動經(jīng)濟社會從“互聯(lián)網(wǎng)+”、“5G+”向“AI+”加速轉變,為算網(wǎng)基礎設施演進帶來新機遇、提出新要求。
他提到,未來3年,中國智能算力規(guī)模增長將超過2.5倍,年均復合增速近40%。同時,推理算力需求將超過訓練算力需求,推理算力年復合增速將達到訓練算力的近4倍,到2028年,推理算力規(guī)模將超過訓練算力規(guī)模。中國移動將建設超大規(guī)模的“算力工廠”,推動萬卡級、千卡級智算中心的倍增擴容,積極開展十萬卡智算中心前瞻研究。
一直以來,由于芯片制造工藝受限,國產(chǎn)芯片的單卡算力比不上英偉達,這也是國內(nèi)行業(yè)產(chǎn)生算力焦慮、大量囤貨英偉達的關鍵原因。但事實上,隨著大模型的快速迭代,計算系統(tǒng)也在發(fā)生結構性變化,需要的更多是系統(tǒng)算力,而不僅僅是單芯片的算力。這些結構性變化,為中國企業(yè)通過架構性創(chuàng)新,開創(chuàng)出一條自主可持續(xù)的計算產(chǎn)業(yè)發(fā)展道路,提供了機遇。
同日,在華為云生態(tài)大會2025上,華為常務董事、華為云CEO張平安公布了AI基礎設施架構突破性進展,推出CloudMatrix 384超節(jié)點,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
觀察者網(wǎng)了解到,去年英偉達NVL72的發(fā)布,為萬億參數(shù)的大型語言模型推理提供了30倍實時速度提升,引發(fā)大量關注。而作為國內(nèi)首個商用級別的大規(guī)模超節(jié)點,華為CloudMatrix 384在規(guī)模、性能和可靠性上全面超越了英偉達NVL72。它的核心意義在于實現(xiàn)了AI算力資源從服務器級供給到矩陣級供給的轉變。基于CloudMatrix的昇騰AI云服務,大模型訓練作業(yè)可穩(wěn)定運行40天,互聯(lián)帶寬斷點恢復只需10秒級別。
英偉達NVL72系統(tǒng)
并且,超節(jié)點架構對于混合專家模型(MOE)天然親和,拿DeepSeek來說,以前在傳統(tǒng)8卡英偉達服務器上,得搞一堆復雜的工程創(chuàng)新。但華為超節(jié)點憑借獨特架構,天生支持“大規(guī)模專家并行”。
華為云超節(jié)點是如何實現(xiàn)的?通俗地講,就是通過將傳統(tǒng)單節(jié)點(如8卡昇騰服務器)通過新型高速總線緊耦合互聯(lián),形成一個單一邏輯計算單元(即“超節(jié)點”)。這種架構突破物理服務器邊界,實現(xiàn)資源池化與對等互聯(lián),使算力規(guī)模提升50倍(單超節(jié)點達300 Pflops)。華為云將這一技術轉化為昇騰云服務,大幅降低了企業(yè)獲取高性能計算資源的門檻。
突破單卡瓶頸,打造系統(tǒng)化算力,是華為一直以來的策略。華為輪值董事長徐直軍去年曾表示,華為的戰(zhàn)略核心就是,充分抓住人工智能變革機遇,基于實際可獲得的芯片制造工藝,計算、存儲和網(wǎng)絡技術協(xié)同創(chuàng)新,開創(chuàng)計算架構,打造‘超節(jié)點+集群’系統(tǒng)算力解決方案,長期持續(xù)滿足算力需求。
在此次生態(tài)大會上,張平安表示,面向智能世界,華為云致力于做好行業(yè)數(shù)字化的“云底座”和“使能器”,依托昇騰AI云服務推動各行各業(yè)AI快速開發(fā)落地。“我們耐得住寂寞,盤古大模型將會堅定走行業(yè)AI的道路,幫助各行各業(yè)的客戶打造屬于自己的大模型。華為并不發(fā)布面向C端的大模型應用,我們更關注的是怎么能讓行業(yè)客戶真正落地AI。”
當前,中美備受關注的不只是貿(mào)易爭端,還有技術競爭。根據(jù)斯坦福最新的2025年AI指數(shù)報告,中美頂級AI模型的性能差距已縮小到了 0.3%,而在2023年差距是20%,中國模型正在快速追趕美國的領先地位。更明顯的趨勢是,如今大模型的性能已經(jīng)趨同。在2024年,TOP1和TOP10的模型的差距能有12%,如今差距已經(jīng)越來越小,銳減至5%。
這種競爭態(tài)勢下,中國各行各業(yè)如何高效利用國產(chǎn)算力,推動AI應用快速落地亦是關鍵。在4月9日的2025阿里云AI勢能大會上,阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光表示,2025年AI應用爆發(fā)沒有最快,只有更快,應該推動基礎模型、推理服務、開發(fā)工具三要素全速演變,為AI應用提速蓄力。
他認為,過去一年,很多企業(yè)都在積極擁抱大語言模型,從簡單的文生圖、文生視頻、創(chuàng)作文檔到數(shù)據(jù)應用等,均涌現(xiàn)出一批令人興奮的應用,阿里云大語言模型API調(diào)用量增長接近100倍。未來,AI會和很多產(chǎn)業(yè)進行有機融合,爆發(fā)出更多嶄新商業(yè)模式和生產(chǎn)路徑。從深度推理模型到多模態(tài)能力,中國基礎模型能力大幅提升,讓很多產(chǎn)業(yè)有了強化學習的想法,也讓更多AI應用的落地成為可能。
但不可否認的是,讓快速演進的AI技術賦能各行各業(yè),中國企業(yè)仍然需要合力。正如張平安所說:“在AI時代,并不是一家企業(yè)就能解決千行萬業(yè)的問題,需要整個生態(tài)合力,比如AI算力提供商、技術提供商、大模型提供商等協(xié)同在一起,以開放的心態(tài)互相支持,才能夠加速迎接AI時代,盡早享受到AI時代的紅利。”
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉載。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.