杰文斯悖論:從長遠來看,資源利用效率的提高將導致總消耗量的增加,而不是減少。
人類的AI時代可能要加速而來了!!!
最近有沒有使用Deepseek大模型?感想如何?
作為國產的AI大模型,Deepseek在春節前后算是火爆出圈。憑借其開源且低成本高效的特點,不僅在國內引發關注,深度求索這家國產AI大模型公司更是震動了大洋彼岸的硅谷和華爾街。硅谷連夜開會討論,美股納斯達克GPU巨頭英偉達(NVDA.O)在除夕前夜大跌16.97%,一夜市值蒸發5900多億美元(約4萬多億人民幣),同時其產業鏈多股下挫。
更有趣的是,不久前上臺的川普前腳宣布了個千億美元級別以上的人工智能基礎設施投資計劃“星際之門”,其中Arm(ARM.O)、微軟(MSFT.O)、英偉達、甲骨文(ORCL.N)和Open AI都是關鍵的初始技術合作伙伴;后腳我們這邊就出了一個開源且可媲美OA的一款AI大模型。
包括川普上臺后主張的先進制程芯片產業鏈限制以及高關稅等……
你品,你細品!
01Deepseek沖擊了英偉達的溢價,并未沖垮壁壘
從春節前后的A股市場來看,最慘的應該是A股前期漲勢一片大好的英偉達算力產業鏈,比如CPO光模塊概念龍頭的中際旭創(300308.SZ)、PCB代表的勝宏科技(300476.SZ)、液冷服務器供應商英維克(002837.SZ)以及銅纜高速連接的沃爾核材(002130.SZ)等,這些細分領域年前年后兩個交易日都是遭遇跌停甚至超10%的跌幅,市場一度悲觀地認為算力板塊崩塌了。
不過,冷靜來看,目前市場對于AI產業鏈短期內確實存在巨大的分歧。樂觀者大肆宣傳DeepSeek概念板塊,各種概念股層出不窮;而悲觀者則在前期漲勢不錯的算力產業鏈瘋狂踩踏。前者神話DS,認為是顛覆性的技術革命,同時瘋狂看空美股的英偉達及A股相應產業鏈;后者則已經有點慌不擇路,恐慌拋售。事實上,短期情緒已占據主導,與其說是看空國內的算力板塊,倒不如說是在沖擊英偉達以及美股AI頭部廠商的超額利潤;而中長期來看,算力產業鏈并不會崩塌,相反的將迎來一次大爆發,尤其是國產替代環節。只是在這之前,市場需要時間來進行估值及認知的重塑。
借用最近看到的一個比喻:內燃機的高效,只會帶來石油的需求高增。
國內DS的發布,實際上確實沖擊了算力產業鏈,不過并非競爭壁壘,而更多是沖擊了英偉達等高端算力芯片的超額利潤。人類技術發展本就是瞬息萬變。目前市場普遍對于英偉達最大的利空在于算力顯卡的價格和貢獻或將發生巨大變化,而這個預期將蔓延至中長期。
一直以來,英偉達作為高端GPU供應商,在全球長期處于近乎壟斷的市場地位,由于AI的需求爆發,使得英偉達算力芯片的需求高漲。而整個算力芯片市場的競爭態勢也就決定了彼時行業龍頭的超額利潤,也就是英偉達的估值溢價。根據財報來看,2025財年Q3甚至全年預期的業績依舊搶眼(即2024年業績),其中Q3的數據中心業務收入達308億美元,環比增長17%,同比增長112%且創歷史新高,業績增速表明英偉達“曾經”的AI GPU產品的市場需求情況。
分歧就在于此,隨著Deepseek的算力成本曝光,市場開始預期英偉達及產業鏈的超額利潤將受到威脅。要知道,英偉達的產品出了名的貴,2024年全年公司的毛利率和凈利率一度達到了歷史新高,分別在75%和55%以上。這個盈利能力簡直恐怖,包括其業績增速也是市場給予高估值的原因。
DS的橫空出世,等同于昭告天下:AI大模型其實即使沒有使用高端且昂貴的AI算力芯片也能達到預期的領先效果。這或將意味著,全球對高端算力芯片的需求從供不應求轉為產能過剩。而英偉達產業鏈的暴跌,其實也是受到這個邏輯的利空影響:一旦DS的技術路徑沒有被證偽推翻,未來高端芯片需求緩和,英偉達就不得不消化預期“過剩”的產能,對其下游產業鏈的需求和訂單價值將出現較大的波動。
產業鏈的核心風險就在于,A股英偉達產業鏈的這些上市公司2024和2025年的訂單基本都簽完了,短期業績預期也已經反映在股價上。而未來預期,就得看英偉達是否會砍單或降價,這種不確定性對前面概念板塊的公司業績預期造成了巨大的利空影響。那么既然高端的AI芯片供需預期或發生巨大變化,那就看市場如何重新估值、重塑邏輯以及供需。不過可以肯定的是,DS算法上的創新僅僅沖擊了溢價,尚未沖擊到競爭壁壘。由此英偉達的股價只是短期下跌,并不會出現崩盤。
總結來看,DS的出現確實是人工智能大模型的重大突破,也的確擾動了全球AI算力市場,其最重大的意義在于推動了全球的AI平權,短期將抹平英偉達、Open AI等廠商的超額利潤。而且競爭態勢上來看,人工智能也不再是美國一家獨大,這主要體現在一來是開源對Open AI閉源的挑戰;二來是國產算力芯片對英偉達所代表的高端算力芯片霸權的沖擊。
這兩點也是海外資本市場利空核心的邏輯。
02算力需求為何將不減反增?!
算力不會崩塌,而且依舊將是全球各國未來建設的重要方向。
下面一個圖就能說明問題。在工作日的上午10-12點這個時間段,在使用深度思考和聯網的功能時,DS的用戶時常會出現“服務器繁忙,請稍后再試這樣的提示”,包括有些用戶開始發現其推理能力有所下降。
這背后的原因主要是這段時間DS的用戶量激增,硬件有點跟不上。7天用戶就破億,增長了十幾倍。而其推理集群并沒有完善,很多深度推理和聯網都用不了,用戶推理需求增長后DS沒有及時擴容。這就說明一個問題:在DS注冊用戶不斷創新高的同時,其背后的算力和服務器似乎已經有點不堪重負了。足以可見Deepseek未來大概率是要迅速擴容來應對這樣的問題,而對產業鏈來說,也就是AI大模型對背后的算力基礎設施需求還是很高的。
DeepSeek確實很亮眼,且足夠優秀。不過這里還要對DS的“神話論”去個媚,辯證的看待新事物才是一個正常的心態。
首當其沖的就是成本端,約600萬美元這個數字其實并不準確。根據機構調研的情況來看,這個“600萬美金”僅僅是V3模型的訓練成本,而V3模型是通過迭代出來的,如果將前期模型的投入加起來的話,成本至少是目前的3-5倍,千萬美金的成本還是有的,據了解約是Meta Llama 3成本的四分之一。總結來看,降低AI的成本是肯定的,但絕對沒有網傳那么玄乎;
其次,DS依舊需要巨大的算力硬件支持。比如生態方面,雖然DS的出現沖擊了英偉達的超額利潤,但DeepSeek暫時還是無法繞過對英偉達CUDA生態的依賴,據了解DS是雖然是通過直接調用PTX進行性能的優化,但PTX也是英偉達GPU的中間指令,其代碼復雜且移植性差,難以適配其他GPU架構。
事實上,英偉達之所以能夠壟斷市場,核心壁壘在兩點:一個是硬件之間的NVLink,另一個是CUDA的軟件生態;前者為GPU之間提供高速、低延遲的數據傳輸通道,提高了系統的計算能力和數據處理效率,而后者的CUDA生態憑借軟硬件協同、豐富的工具鏈和行業滲透率構建了難以撼動的競爭優勢。
盡管競品也在高速發展,比如硬件連接端技術相對成熟的PCIe和CXL(Compute Express Link),以及軟件生態端的國產華為CANN生態以及摩爾線程MUSA,這些方案確實在開放性和國產化方面展現了潛力,但其成熟度和硬件性能暫時仍無法對NVLink與CUDA造成較大影響。
再者,DeepSeek確實更像“東方人”,在硬件算力跟不上的情況下,另辟蹊徑在算法上進行優化,在架構上使用獨立的新MoE,且針對該技術路線,在編譯器中間表示層面對算子框架進行了深度融合優化,進而提升了算力的利用率。比起“西方人”對算力的直線思維,我們確實更會轉彎。
不過,低成本投入的弊端也很明顯,DeepSeek V3專注了文本生成和邏輯推理任務,相對缺乏多模態能力,不久前DS也發布了多模態模型,能夠做圖像生成,這樣的模型出來之后加快了多模態速度,不過成本好像沒有公開數據,按理來說大模型多模態的算力消耗是文本模型的10倍左右,推理算力消耗是此前的好幾倍。
03Deepseek如何推動AI大模型的降本增效?
DS最大的意義是打開大模型的發展思路,并且帶領AI進入平權時代,那降本增效就是它的核心。所以還是要分析下下DS是如何降低成本,沖擊美股AI產業超額收益的。在這之前,需要先了解下訓練和推理的成本。
首先是訓練端,這個方面對硬件需求較大且成本高。目前來看,高端的算力芯片依舊是無法被替代的,因為大模型訓練依賴高帶寬顯存、高算力密度及成熟的軟件生態,英偉達的GPU短期內仍占主導地位。即使算法優化可以減少單次訓練成本,但隨著頭部企業對大模型性能的競爭加劇,這會驅動更大規模訓練,高端算力芯片需求會被維持。只不過DS在算法優化的成就可以一定程度上緩和大模型訓練時的投入占比,也就是后面會提到的“預訓練”和“后訓練”;
這里根據Deepseek的優化路徑的特點來看:DS通過稀疏計算、模型蒸餾等方式,顯著降低了對高端GPU的依賴;而且DeepSeek-R1采用的核心技術是“后訓練”,這也是降低成本的一個關鍵點。相比于西方重視“預訓練”,希望大模型能成為一個“六邊形戰士”,所以需要囤卡、堆算力來“喂”海量的全行業數據;但我們的DS通過預訓練后,則選擇重點進行后訓練,也就是“因材施教”,大模型在哪個行業,就只“喂”單一行業的數據,使其成為行業的垂類大模型,也就是我們常說的“專才”。(比如將一個自然語言預訓練后的大模型應用于能源領域時,會使用能源領域的文本數據進行后訓練)
在重構訓練端占比的同時,DeepSeek的這種算法優化路徑也重新對訓練和推理的投入占比進行了重新分配,即正在推動行業從 “以訓練為中心”轉向“推理優先”的模式。根據機構調研這個比例大致在訓練30%,推理70%(不一定準確,但是個趨勢參考)。而資本市場預期的核心變化也基于此:占比的變化給國產專用芯片帶來了巨大的需求潛力。
因為在大模型的推理端,對高端芯片的需求就那么高了。
DeepSeek帶動下,這種輕量化模型的增加會將推理場景向邊緣轉移,進而帶動專用AI芯片(如ASIC芯片和FPGA等)的需求增加,不過ASIC也有明顯的痛點:軟件支持不足,且硬件壁壘較弱,且短期內高端算力芯片在云端推理(如批量處理、復雜任務)中依然還是存在巨大優勢,但DeepSeek發布已經創造了一定的需求空間和彈性,算是給國產芯片等算力產業鏈“殺”出了一條路。
04結語
DeepSeek的橫空出世意義重大,更像給AI產業安上了“另一條腿”。
不過DS的興起并不代表另一方的衰敗,這種算法結構優化,確實能提升單次的任務效率,降低大模型的成本。然而多模態、復雜推理、通用人工智能等這些AI能力的邊界擴展卻依舊需要更大規模訓練和算力支持,算力和算法從不是相生相克,而是相輔相成。兩者并行才會使得AI大模型“如虎添翼”。
更大的意義在于:DeepSeek的降本增效,在沖擊英偉達等高端芯片超額利潤的同時,也給國內算力產業帶來了巨大的需求潛力,降低了發展大模型的門檻。可以這樣理解:
在DS發布之前,只有全球頭部的大型數據中心可以搞算力和數據中心,為了頭部競爭,這些都是斥巨資屯了上萬張高端顯卡來堆算力,那時候的中小型數據中心是沒有機會,畢竟成本過高;
而在DS之后,門檻降低了。頭部的大型數據中心依舊會繼續屯,畢竟預期高端算力芯片需求變化,價格趨勢走低,而頭部的預算充足(比如字節、阿里),他們要進行殘酷的頭部競爭。但是更顯著的好處在于中小型數據中心不再需要“萬卡”規模,而是“千卡”甚至更小的規模就能實現大模型的預期效果,比如高校、科研等這類預算相對不充足的需求方。
由此來看,對于算力的需求短期走低后,中長期依舊是向上放量增長的,而且需求更大。畢竟DS的出現為中小型數據中心的算力成本降了一個數量級。
最后呢,不必“神話”大模型。預期這些AI大模型的壁壘終究還是會被打破的,而“算力基建”依舊是重要競爭壁壘。因此,那些A股能擠進英偉達算力產業鏈的頭部供應商,一定程度上也會在軟硬件國產化中獲得不錯的機會。而且從大模型的歸途來看,還是要與終端AI的應用場景相結合,比如人形機器人、智能駕駛、可穿戴產品、大金融、醫療醫藥等行業,由此推斷這些板塊中低估的細分領域或個股標的預期走強的概率將大幅增加!
畢竟我們有最好的AI落地的沃土。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.