DeepSeek熱潮將在預訓練、后訓練(二次訓練)和推理三大細分市場都帶來巨大改變。
文|周享玥
編|趙艷秋
DeepSeek狂潮下,2025年的智算市場正在發生巨變。
業界觀察,不同于DeepSeek剛出來時,一些人士對于“其算法優化可能導致智算市場需求下降”的猜測,在經歷了連續幾周的發酵后,市場上的算力需求正呈現短期內的快速爆發趨勢。
“最近兩個禮拜,來找我們咨詢購買能夠完整運行671B DeepSeek R1模型的AI服務器的客戶數正在直線上升。”2月13日,在IDC與浪潮信息聯合發布《2025年中國人工智能計算力發展評估報告》(簡稱《報告》)的現場,浪潮信息高級副總裁劉軍告訴數智前線。
在這次《報告》中,市場分析機構IDC和智算Infra大廠浪潮信息一起,對DeepSeek給智算市場帶來的變化、當下最新的智算市場格局進行了深入解讀,并分享了今年智算市場發展的一些重要趨勢。
01
DeepSeek狂潮下,2025年智算市場如何變?
DeepSeek是條鯰魚,正在將市場重新調動起來。
C端用戶熱情高漲,即便是老人、小孩兒,知道DeepSeek的也不在少數,B端和G端的應用探索大幅提速,每天都有新一波企業和機構官宣接入DeepSeek。
算力需求在短期內激增。春節后第一周,國內外芯片廠商都在緊鑼密鼓加緊適配工作,據行業人士預測,推理端的適配將會優先完成,訓練端的工作則將持續一段時間。服務器廠商們也在最近接到不少咨詢和采購訂單。
而從中長期來看,多位行業人士均告訴數智前線,這波DeepSeek熱潮將有望在預訓練、后訓練(二次訓練)和推理三大細分市場都帶來巨大改變,帶動智算市場的進一步發展。
在預訓練端,去年市場上一度彌漫著一股悲觀情緒,Scaling Law(規模法則)被懷疑即將失效,一些大模型企業也逐漸放棄預訓練。但隨著DeepSeek的故事范本生效,這種趨勢即將扭轉,一些玩家可能有信心重返戰場。
“如果DeepSeek通過算法優化,用一萬張卡搞出了別人十萬張卡的模型,就會有人想,我用十萬張卡,用DeepSeek的這種工程模式和技術架構會訓練出什么。”IDC中國副總裁周震剛說,這對全球所有大模型玩家,都是一種激勵。
2月13日,OpenAI首席執行官薩姆·奧爾特曼在社交平臺X上公布,OpenAI將在未來幾個月內推出名為GPT-5的模型,該模型將整合OpenAI的大量技術。幾天后的2月18日,馬斯克正式發布了Grok 3大模型。
而在后訓練端,DeepSeek帶來的效率提升,正在讓這個市場被加強。《報告》顯示,目前Scaling Law正在從預訓練擴展到后訓練和推理階段,基于強化學習、思維鏈等算法創新在后訓練和推理階段更多的算力投入,可以進一步大幅提升大模型的深度思考能力。
“Hugging Face上,最近每天都有基于DeepSeek去做微調、蒸餾出來的各種新版本出來。”周震剛舉例說,這將對整個智算市場產生巨大推動。
推理端,則被業界認為是一個極具潛力的市場。“DeepSeek相當于瓦特時刻。瓦特把蒸汽機改良之后,實現了一個穩定的動力輸出,蒸汽機得以進入各個行業。”一位行業人士說,“大模型就是蒸汽機,被改良后,可以進入各行各業。”
“DeepSeek點燃了企業客戶對于大模型在企業內部做業務部署和業務結合的熱情,客戶大量嘗鮮,經歷自我試用PoC階段后,就會思考如何在業務場景中實現更加批量的部署和應用。”劉軍告訴數智前線,他們預計,后面一輪的推理算力采購需求,會比這一輪的采購量來得更大,持續時間更久。
《報告》中也對此做了總結——基于杰文斯悖論的現象表明,DeepSeek帶來的算法效率的提升并未抑制算力需求,反而因更多的用戶和場景的加入,推動大模型普及與應用落地,重構產業創新范式,帶動數據中心、邊緣及端側算力建設。
數據顯示,2024年中國人工智能算力市場規模達190億美元,2025年將達到259億美元,同比增長36.2%,2028年還將進一步增加至552億美元。
智算服務市場也將高速增長。2024年,中國智算服務市場整體規模已達50億美元,到2028年將增至266.91美元,2023-2028年五年年復合增長率為57.3%
其中,智算集成服務市場(即私有化部署市場)及GenAI IaaS市場是未來重要的兩個增量市場,五年年復合增長率分別達到73%和79.8%,預計至2028年智算集成服務市場規模占比可達47%,GenAI IaaS市場規模占比達48%。
02
從追求量,到追求一個更高效的系統
《報告》中另外一個值得業界關注的關鍵點是,要想解決大模型落地過程中高性能算力供不應求及算力利用率低等問題,不止要“擴容”,還得“提效”。
擴容很好理解,即提升算力供給能力。在這一點上,去年,業界已經興起過一波智算熱潮,各地智算中心建設熱情高漲,涌現出了不少智算大單。據數智前線不完全統計,2024年的公開招投標市場,涌現出了超460個智算中心相關項目,其中,億元以上大單至少有62個。
而從整體市場來看,《報告》預計,2023至2028年,中國智能算力規模和通用算力規模的五年年復合增長率將分別達46.2%和18.8%,較上一版本預期值33.9%和16.6%有顯著提升。
而“提效”方面,除了降低算力成本,也是為了降低能耗,這對于大模型能否落地、能否跑通商業閉環,至關重要。
《報告》中提出了“提效”的四大關鍵舉措。
第一,以用定建,以應用為導向,進行AI基礎設施建設規劃,避免資源浪費。這不僅適用于企業私有化部署自己的人工智能基礎設施,也十分契合于當下的智算中心建設。
此前,不少智算中心都存在利用率不高的問題,從去年開始,一些智算中心在規劃初期,已經主要考慮各地的產業結構,以應用為導向來進行資源規劃。比如不同的地方,可能有制造、動漫、機器人、無人智駕、低空經濟等不同產業,它們對智算規模的需求不盡相同,不同芯片之間的配比也有可能不同。
最近幾周,全國各地的多個智算中心都在官宣DeepSeek的部署上線,如河南空港智算中心、無錫太湖億芯智算、南京智算中心等。DeepSeek帶動的應用潮,有可能給智算中心帶來新機會。
“但這也需要做出不小努力,不是簡單說跑個DeepSeek的API上去就可以了。”劉軍告訴數智前線,行業企業要將AI變成生產力,一定要和它自己的行業和業務數據去結合,而這個過程中,需要大量的工具和服務來進行針對性的優化,“比如人家用了一下發現吐一個字要兩秒鐘,就很難接受。”
第二,提升模算效率,降低算力開銷。在這一點上,DeepSeek做了一個很好的示范。其通過創新性融合FP8、MLA(多頭潛在注意力)和MoE(混合專家)架構,大幅提升了性能和效率。
其中的一些思路,也是業界此前在大模型的發展中遇到困難后,所共同去探索的方向。
“去年開始,大家發現,基于Dense架構的模型,再往前去演化到要訓練一個超過五千億、一萬億參數模型時,所需的算力、時間、數據量,都是當前技術條件下實現不了的。“劉軍回憶,他們做過一個評估,這種情況下,需要20萬張卡訓練一年,才能把一個萬億的Dense模型高質量訓練出來。
為此,從去年開始,業界就已經不約而同轉向探索以MoE的方式,通過更高效算力投資的方式來實現更高質量的模型。比如DeepSeek從V2開始就采用的MoE架構,海外的Mistral此前也曾發布MoE架構模型。
去年5月,浪潮信息發布的源2.0-M32,同樣采用了MoE的思路,通過提出和采用“基于注意力機制的門控網絡”技術,構建包含32個專家的混合專家模型,大幅提升模型算力效率,單Token下訓練和推理所需的算力資源僅為Llama-70B的1/19。
“業界此前已經在做類似工作,但DeepSeek給了我們更加明確的信號。”劉軍說,”下一階段,大家會從原來單純追求量的增長,買了多少卡,變成追求如何變成一個更高效的系統。”
第三,優化算力基礎設施架構。如采用先進的計算架構,提升單計算節點性能,提高計算效率。優化內存層次結構,減少數據傳輸延遲,增強數據處理速度。利用智能調度算法合理分配計算任務,優化集群管理方面,確保資源高效利用。
第四,增強數據支持,減少無效計算。比如可以通過建立高質量的數據集,并構建統一的數據存儲和訪問接口,簡化數據流動與共享,為AI模型訓練提供強有力的支持。
《報告》也顯示,未來18個月內,為了將大模型引入生產,除了硬件的升級會是企業的首要投資目標外,軟件和服務方面的支出也會是企業生成式AI項目的主要支出方向。
“2024年開始,用戶在軟件方面的投資增長越來越快,隨著DeepSeek帶來的應用嘗鮮潮的持續奔騰,相應的軟件和服務、定制化解決方案的開發會越來越多。”IDC中國副總裁周震剛說。
在這種背景下,客戶需要更全棧化的支持。針對這些需求,浪潮信息目前已提供全鏈條、全棧化的人工智能技術服務,從AI server計算的硬件、“源”大模型、AI station算力調度平臺到EPAI大模型落地工具。
03
推理市場爆發,2028年推理工作負載占比將達73%
《報告》中還提出一個重要的趨勢,推理算力有望迎來大爆發,2025年推理的工作負載占比將達到67%。“當前我們接到的所有購買需求,幾乎都是推理的。”浪潮信息高級副總裁劉軍告訴數智前線。
目前42%的中國企業已開始進行大模型的初步測試和重點概念驗證,17%的企業已將技術引入生產階段,并應用于實際業務中。
與之相對應的是,2024年,國內推理與訓練的工作負載占比已分別達到65%和35%。《報告》預計,到2028年,推理工作負載占比還將進一步達到73%,遠超訓練算力27%的占比。
面對這一趨勢,公有云市場的各云計算大廠和運營商們都已摩拳擦掌,火速宣布支持DeepSeek模型調用或部署,并卷起價格戰,爭奪市場。
而在私有云或者說私有化部署方面,業界觀察,這一市場預計將成為推動推理算力增長的一股重要力量。“企業將要建設自己的小型智算中心,部署1~10臺服務器(百卡之內),或10來20臺服務器(百卡規模)。”一位智算領域人士表示。
劉軍也告訴數智前線,1~20臺的區間,會是企業客戶未來一段時間采購私有化算力比較適合的規模。
“但這應該會經歷一個過程,大家不會特別盲目,一上來就不顧一切,上好多機器。”劉軍說,在早期,企業應該會先購買一定數量的AI服務器回去構建環境,去針對自己的業務開展PoC,驗證對自己的業務很有幫助后,才會上一個比較大的量。
IDC副總裁周震剛則預測,在這種背景下,開源+一體機的模式,“很可能是未來一段時間內一個非常爆發性的需求。”
“過去幾年這種需求相對較少,因為一體機做推理還可以,做訓練可能沒有那么大的算力,而推理又可以直接通過service解決,也不一定本地部署這么一個推理機。但DeepSeek出來后,市場上對一體機的需求在大幅度上升。最近有很多企業都在跟我們溝通,希望了解一下這個市場規模是什么樣的。”周震剛告訴數智前線。
浪潮信息2月11日剛推出的元腦R1推理服務器,也在最近受到不少企業關注。據悉,該產品通過系統創新和軟硬協同優化,單機即可部署運行DeepSeek R1 671B模型。
“為什么要強調單機就能把它跑下來?因為現在有好多方案是比較麻煩的,模型尺寸大了后,如果你不得不用四臺機器才能裝下這樣一個模型,對客戶去適用這個環境就是一個很大的門檻,而如果你一臺機器,回去開機把模型裝上,馬上就能用上Chatbox、CherryStudio,就會極大方便大家去嘗試滿血版671B的模型。”劉軍說。
無獨有偶,天翼云、聯想百應等也都在最近推出了基于DeepSeek等技術的一體機。一場關于推理算力的競爭已經開始。
“真正到了推理場景,大家關心的是我的用戶體驗好不好,在保證用戶體驗的情況下,每元錢能有多少Token。”劉軍告訴數智前線,體驗和性價比將決定算力廠商在推理市場中的生存能力。
在他看來,推理目前要重點解決兩方面的問題,一個是怎么用更少的機器把模型裝進去、跑起來,另一個則是產生Token的速度是不是夠快。
“我們很多工作都在圍繞這兩個方面來開展。”劉軍舉例說,比如他們會通過PD分離的策略,將推理的兩個重要階段——預填充(Prefill)和 解碼(Decode)解耦部署,通過構建分離式算力資源池,縮短計算時間,降低計算成本,提高資源利用率。
不管是推理端,還是訓練端,智算市場作為大模型落地的重要支撐,在未來幾年內將保持高速增長。在應用爆發的臨界點到來之前,保有熱情,但不盲目激進,仍是最適合當下的一個行為準則。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.