“皮衣教主”絕口不提DeepSeek。
文|《中國企業(yè)家》記者 閆俊文
編輯|張曉迪
頭圖來源|視覺中國
一年一度的“AI春晚”來了,北京時間3月19日凌晨,英偉達CEO黃仁勛出現在2025 GTC開幕主題演講的舞臺上,一上臺,他說:“今天是人工智能的超級碗(Super Bowl),區(qū)別是,每個人都能獲勝,都是贏家。”
贏家有大有小,黃仁勛屬于大贏家,在AI時代,他成了創(chuàng)業(yè)者膜拜的CEO,英偉達一度成了世界上市值最高的公司。
只是世界上沒有永遠的贏家。
2025年1月,來自中國的DeepSeek公司開源R1模型,用少量英偉達芯片就實現了堪比OpenAI o1的推理能力,一度讓英偉達市值跌去6000億美元。
所以,在當天的圣何塞主場,黃仁勛至少提到了5次“R1模型”,但未提及DeepSeek的公司名稱。
看起來,當晚更像是黃仁勛的一次答卷,出題人是DeepSeek以及模仿DeepSeek方式來征服AGI的大公司,比如Meta的創(chuàng)始人扎克伯格說,Meta將繼續(xù)學習DeepSeek等技術,并發(fā)布自己的開源免費Llama AI模型,這也能推動行業(yè)發(fā)展。
此前的2024年,美國前四大云廠累計采購130萬顆Hopper架構芯片,2025年,這一數據預計還會飆升。他們將采購360萬顆Blackwell GPU。黃仁勛預計,2030年以前,英偉達的數據中心的建設將達到1萬億美元。
算力是永恒需求,并且需求會越來越大,這是黃仁勛構筑的圖景。黃仁勛一會兒像一個教授,預測AI的需求曲線,一會兒像抖音直播間的主播。他在演講中從省電費開始算起,不斷推銷這樣一個理念:“買得越多,省得越多,甚至,買得越多,賺得就越多。”
《中國企業(yè)家》詢問DeepSeek,“滿分100分,給黃仁勛在2025 GTC的主題演講打分”,DeepSeek給出了“85分”,DeepSeek解釋說,在技術深度和前瞻性上拿到了40分,但在商業(yè)轉化和演講內容呈現這兩項,扣去了15分。
截至3月19日美股收盤,英偉達股價為115.43美元,比前一交易日跌去3.43%,總市值為2.82萬億美元,今年前3個月,英偉達股價曾達到153美元的高點,以3月19日為基準,已跌去24.5%。
一切為了計算
在黃仁勛勾勒的世界里,在AI時代,英偉達GPU硬件以及之上的軟件生態(tài),是像空氣、水、電一樣的AI基礎設施。
世界AI的重心,正在從預訓練轉向推理。訓練大模型被證明是“大力出奇跡”的結果,是典型的Scaling Law(尺度法則)。黃仁勛在演講中自證,在推理階段,推理大模型更需要GPU,更需要英偉達。
他說,在計算機科學和數據工廠里,延遲、響應、時間和吞吐量之間存在根本的緊張關系。“一方面,你希望服務客戶的質量盡可能好,聰明的AI是速度超級快的。另一方面,你試圖讓數據中心為盡可能多的人生產token,這樣你的收入可以最大化”。
最優(yōu)解是擁有一臺計算速度快,內存大以及支撐大模型數據調用的GPU和服務器,黃仁勛可以提供這些。
重頭戲是硬件產品的更新,黃仁勛公布了英偉達GPU生態(tài)的路線圖。
在2024年Blackwell芯片架構基礎上,英偉達發(fā)布了GB300超級芯片——Blackwell Ultra芯片,并推出Blackwell Ultra NVL72平臺,預計在今年下半年出貨,它的帶寬是前代GB200的兩倍,內存速度是前代的1.5倍。
來源:視覺中國
以滿血版671B參數DeepSeek-R1為例,基于H100產品可實現每秒100 tokens,而采用Blackwell Ultra NVL72方案,可以達到每秒1000 tokens,這意味著用戶的需求可以更快得到響應。
此外,英偉達公布了路線圖,下一次芯片升級是Vera Rubin,Vera Rubin將于2026年下半年推出,Vera Rubin NVLink 144的性能將是Blackwell Ultra NVL72的3.3倍。
這樣激進的技術宣言很符合黃仁勛的風格,每年進行一次架構更新,每兩年進行一次整體架構升級,每年推出一條新的產品線,實現X因素的提升。
此外,黃仁勛還宣布英偉達發(fā)布兩款AI電腦,分別名為DGX Spark和DGX Station,稱它們是“AI時代的計算機”。這兩款電腦都使用Blackwell架構的芯片。DGX Spark外形類似Mac mini,DGX Station則是體積更大,它們將能夠運行諸如Llama或DeepSeek等大模型。
在主題演講中,黃仁勛重點提及了英偉達的CUDA生態(tài)以及各類軟件棧,這些軟件棧可以有效提升硬件性能,加速計算,比如一個名為cuDSS的稀疏求解器,它實現了EDA和CAE庫的加速。
他還發(fā)布了一款用于加速和擴展AI工廠中AI推理模型的開源軟件NVIDIA Dynamo,黃仁勛指出,“它本質上是AI工廠的操作系統(tǒng)”。通過Dynamo,可以讓DeepSeek等推理模型,在相同架構和使用相同數量GPU的條件下,將性能提升30倍。
AI的下一個階段則是Agent AI,不僅能說、能答,而且還能提供解決問題的決策和行動,比如機器人。
黃仁勛展示了一個名為“Blue”的機器人,并與之互動,這是英偉達與Google DeepMind、迪士尼合作開發(fā)名為Newton的機器人平臺成果之一,此外,英偉達推出了專為機器人設計的通用基礎模型GR00T N1。這是世界上第一個開放、完全可定制的通用人形推理和技能基礎模型。
缺席的中國玩家與“在場”的DeepSeek-R1
今年,英偉達的朋友圈更多向美國本土公司開放,黃仁勛展示了和通用汽車在自動駕駛方面的合作,與迪士尼研究公司和谷歌DeepMind合作創(chuàng)造的機器人,還計劃與海外眾多運營廠商開發(fā)AI原生6G網絡。
黃仁勛的主題演講中,來自中國玩家的展示變少了。在2024年的GTC主題演講中,黃仁勛展示了與騰訊的游戲合作,展示了宇樹科技和小鵬鵬行等機器人公司的產品。
但有一家中國公司,黃仁勛至少提到了5次,那就是R1模型,但關于其母公司DeepSeek,“皮衣教主”絕口不提。
這是因為DeepSeek正在引發(fā)美國從商界到政界的震動。
比如OpenAI CEO奧爾特曼向美國政府提交了一份報告,報告指控DeepSeek“非法抓取1.2萬億網頁”,同時還建議特朗普政府建立“三級許可制度”,允許美國盟友使用美國AI技術,同時限制中國等國使用。
難怪Meta首席科學家楊立昆在社交平臺上說:“OpenAI的指控暴露了封閉模式的傲慢。”
對于AGI的前景,OpenAI以及奧爾特曼都在說沒那么快,需要降低預期,微軟CEO納德拉說,“我們自己宣稱達成某個AGI的里程碑,對我來說,那只是一些無意義的基準修改。真正的基準是:全球經濟增長10%。”
目前,英偉達正在馬力全開,Blackwell已全面投入生產,黃仁勛笑稱“這可能會影響Hopper(H100和GH200)系列芯片的銷售,但這就是技術的發(fā)展”。
對于中國的大公司而言,只能戴著鐐銬起舞。
來自中國的互聯網大公司得不到H100,更遑論Blackwell的GB200和GB300了,它們只能大量購入H20,這是一款閹割版的H100,H20的GPU核心數量比H100減少了41%,性能降低了28%。
據《財經》雜志報道,騰訊正在加速大模型應用的推進,近期已經向英偉達采購一批新的AI芯片,訂單金額約合幾十億元量級。
在2025年初,騰訊積極接入DeepSeek的R1大模型,并讓搜一搜、騰訊元寶等產品接入,這讓本地的算力需求急劇提升。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.