99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

粉碎摩爾定律后,黃仁勛又要打破 Scaling Law 的墻

0
分享至

剛剛擊破摩爾定律的英偉達,卻要撞上 scaling laws 的墻?

相當一部分評論家和分析師是這么認為的。即便你不同意,也不能怪他們,畢竟在英特爾的身上,大家剛剛目睹了摩爾定律似乎「失效」了。

在最近兩次財報電話會議(25Q3、Q4)中,每次都有不止一位分析師向英偉達 C-level 拋出同一類問題:神經網絡的 scaling law 是否不再起到作用了?

他們真正想問的是:英偉達還能否續寫連續兩個財年的瘋狂增長?


這就是在業界甚囂塵上的 scaling law 撞墻猜測。簡而言之,機器學習的 scaling law 的指的是隨著模型大小(參數量)、數據集、訓練成本這三大要素的提升,大模型的性能也會有所提升(具體細節不展開)。

而許多分析師看到 DeepSeek 震驚世界的成果之后,得出一種新的猜測,認為進一步訓練天量參數和超大數據集的大語言模型的意義沒那么大了,蒸餾現有超大模型的性能也很不錯,完全事半功倍。

而放在英偉達的語境下,考慮到它是 GPT 技術催生和領導的大語言模型爆發的最大受益者,最近連續幾個季度的收入又過分嚴重依賴數據中心;現在大模型的蒸餾新玩法出現,似乎不再需要那么多 Hopper、Blackwell,以及英偉達早已畫好路線圖的新架構顯卡,進而直接導致英偉達圖形計算方案產品的市場需求從高位滑落,最近兩個財年的瘋長神話不再續寫。

CEO 黃仁勛理解這種「恐慌」,畢竟公司股票在過去一年里給太多人賺了太多錢。但他不理解人們為什么會有 scaling law 不再適用的想法。

在和軟銀創始人孫正義的談話中,黃仁勛提到,只要投入足夠的計算資源,采用更復雜的算法,AI 的智能水平還能夠繼續提升。上一財務季度的電話會議里,黃仁勛又提出了一個關于 scaling law 的新思考框架,具體來說有三個部分:預訓練 scaling、后訓練 scaling、推理 (包括模型推理 inference 和思維推理 reason)scaling。

而在 上,他進一步闡釋了這個新的 scaling law 框架:


通過 DeepSeek,人們用上了能夠推理 (reason),具有思維鏈的 AI。這和 ChatGPT 有本質的區別。ChatGPT 回答很多復雜問題的時候答案都是錯的,因為答案是一次性生成的,token 是一個接一個吐出來的。

而現在 AI 能夠推理,每個 token 都返回到上一步重新處理,一次又一次的重復,最終形成一個思維鏈 (chain of thought)」

「我們不只是 token 吞吐量提升了 10 倍,同時也需要 10 倍更快的計算(注:中和更多 token 消耗的時間)。最后的結果是,我們需要 10 x 10 = 100 倍更多的算力!」

事實上在黃仁勛看來,任何人如果理解計算機科學領域的最基本悖論——延遲和吞吐量——就不會說出 scaling law 不再適用那些話。

在基于強化學習,具有思維鏈 (chain of thoughts) 能力的大模型的推理過程中,每個新 token 都會在產生之后不斷地被送回上一步重新處理,用黃仁勛自己的比喻叫做「token 的自我懷疑」。他說,「如果你想要聰明的 AI,你就需要高效率地生成 token。如果你花了太長的時間去生成這些 token,你的客戶最后就不用你了。所以你的 token 速度很重要。」

為了證明自己的觀點,黃仁勛拿出傳統大語言模型代表 Llama 3.3 70B 和 DeepSeek R1 671B(37B 激活),讓它們回答同一個復雜問題。

前者生成了 439 個 token,但給出的答案根本沒法用,黃仁勛說「400 多個 token 白白浪費了」。后者打開了標志性的「深度思考」模式,結果生成了高達 8559 個 token,得到的答案令人滿意。


但和所用算力相比,答案滿意與否已經沒那么重要了:

具有思維鏈的 R1 推理模型的 token 吞吐量是傳統模型 20 倍,現場演示的用時也比傳統模型長了兩倍,即便如此都要用到 150 倍的算力。如果換做消費級使用場景下,想要在足夠快、能留住用戶的時間窗口內,輸出經過深思熟慮的可靠結果,需要的算力只會成倍增加。

怎么訓練的模型也不太重要了。模型想要在真正的商業和消費應用中高效地進行推理/思考,同樣需要大量的算力。早在之前的財報會上黃仁勛就說過,人們目前看得見和用得上的消費級產品,比如搜索、生成、推薦功能,還只是大模型能力的九牛一毛。未來的推理/思考型模型將要消耗掉的算力,將令人難以置信。

他不得不在自己的主場 GTC 上,完整展現自己對于這件事的「思維鏈」,甚至在臺上瘋狂做數學題,算 token 秒速、單機架功耗,再把它們合到一起算出每兆瓦秒 token 吞吐性能,推導出新架構產品能讓客戶多賺多少錢。發布會兩個多小時的觀感,70% 說服分析師,30% 面向開發者和企業伙伴。


黃仁勛的技術前瞻性的確獨一無二,特別是帶領公司研發 CUDA 技術走上 GPGPU 道路,使得基于圖形計算架構的通用加速計算成為可能。而我們也看到了早年的這些決策,在最近兩年里以數據中心業務的形態貢獻了英偉達高達 90% 的收入,幫助公司實現高達 56% 的凈利潤。

但歸根結底,黃仁勛是圖形加速計算布道者,更是顯卡銷冠。他需要繼續不遺余力地抬高英偉達驅動的 GPU 數據中心——2025 年已經換了一個新名字,叫做 AI 工廠——在企業客戶心目中的價值認知和必要性心智,才能續寫英偉達的股價神話。

本屆 GTC 上發布了很多核彈級的新 AI 加速計算方案,軟硬兼施,包括最新 Blackwell Ultra 架構 + NVLink72 互聯技術的服務器機架產品和超算集群產品、Dynamo 分布式推理大模型環境部署軟件、AI 超算單機 DGX Spark/Station、數字-光纖調制解調模組等、Groot N1 人形機器人基礎模型等。

這些產品和技術的意義很大,對于不同規模場景的企業建設自己的 AI 工廠,訓練自己垂直領域的獨家超大模型和機器人,能帶來很可觀的效能提升,最終帶來更高的收入。

但現場黃仁勛反復采用的一種敘事邏輯,有些耐人尋味:

英偉達在大量的企業級 AI 大模型訓練和部署展示中,一而再、再而三地強調大量預先模擬和測試的必要性。

具體來說,未來的千行百業在應用 AI 技術的過程中,需要做大量的、反復的模擬和測試工作。比如一個在工廠流水線工作的機器人,在真人教會他如何擺弄工具之前或者同時,他可以在大模型里跑成百上千次模擬,包括動作模擬、物理引擎模擬,甚至 GPU 虛擬出的不同環境場景下的重復模擬。

而這些模擬測試的內容,毫無意外,也是在英偉達圖形計算方案驅動的服務器里進行的。英偉達的 Omniverse 機器人 AI 操作系統和 Cosmos 真實世界基礎大模型,正是專為這些模擬測試背后的大模型訓練和部署工作而生的。


也就是說,在英偉達看來,不止訓練大模型,部署和推理大模型,在現實世界的千行百業應用大模型之前,還要進行大量的訓練-推理-再訓練-再推理……不斷循環往復的強化學習過程。每多強化一點,需要的算力都呈指數級提升。

黃仁勛打的大概就是這個算盤:從 Hopper 架構升級到 Blackwell,token 吞吐效率已經幾何提升,轉換到客戶的每 token 收入翻了 40 倍。而如果再升級到 2027 年的 Rubin 架構,甚至 2028 年的 Feynman 架構,想都不敢想。

The more you buy, the more you save?
The more you buy, the more you(we) make!

好在黃仁勛還算有良心,直接把這些未來 2-3 年內的新架構的命名、技術細節、預估提升水平都提前告訴好大家了。這樣客戶在籌劃修建自己的 AI 數據中心的時候,可以充分考慮預算、需要性能、工期等客觀因素,來準確地選購自己需要的英偉達顯卡。

毋庸置疑的是,英偉達需要持續炒熱 GPU 架構革新的意義,加快新架構發布的節奏,甚至在幾乎一己之力打破了英特爾的摩爾定律之后,又創造了自己每年一升級的 tick-tock 規則。

只有客戶的心智被規訓成「永遠認為自己需要更好的顯卡」,就像每年總忍不住換新 iPhone 那樣,英偉達才能有希望保持收入繼續增長,即便最近兩年的增速已經如此瘋狂。

就像大會開場前的暖場對談里所說的: 在任何經濟里,賣水的永遠會成功

最后,有一個疑惑縈繞在腦海里:

順著英偉達的邏輯,總有一天,而且應該不會太久,這個世界上被用于訓練和優化所有大模型的數據,全都來自于別的大模型甚至這個大模型自己。

機器都 scale up 了,人是不是就該 out 了?

我們正在招募伙伴

簡歷投遞郵箱
hr@ifanr.com

?? 郵件標題
「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
半場僅2分,36歲老將遭粵蜜怒噴!網友看不慣:忘了他是第4外援?

半場僅2分,36歲老將遭粵蜜怒噴!網友看不慣:忘了他是第4外援?

弄月公子
2025-04-17 07:48:12
明星夫妻堅持26年不吃肉不生子,就為不變老,如今59歲近照不敢認

明星夫妻堅持26年不吃肉不生子,就為不變老,如今59歲近照不敢認

山河月明史
2025-04-14 23:54:27
千萬遠離寶媽群,每一句都是炸裂的程度,看的我小腦一縮又一縮

千萬遠離寶媽群,每一句都是炸裂的程度,看的我小腦一縮又一縮

特約前排觀眾
2025-04-17 00:10:06
直擊關稅風暴下的廣交會:客商熱情擋不住,首日6.4萬采購商再創新高

直擊關稅風暴下的廣交會:客商熱情擋不住,首日6.4萬采購商再創新高

華夏時報
2025-04-16 16:40:02
二十年前的“洋垃圾”手機,頂級ASV屏幕+CCD鏡頭,無敵的存在!

二十年前的“洋垃圾”手機,頂級ASV屏幕+CCD鏡頭,無敵的存在!

科技拌飯
2025-04-15 17:30:03
網紅小貓“悟空”去世后續:意外殞命,未做絕育,主人發聲遭網暴

網紅小貓“悟空”去世后續:意外殞命,未做絕育,主人發聲遭網暴

南南說娛
2025-04-16 18:25:22
浙江1月花80萬歐簽布彭扎,球員330萬歐中超第3身價&現已清零

浙江1月花80萬歐簽布彭扎,球員330萬歐中超第3身價&現已清零

直播吧
2025-04-16 23:09:11
關稅戰越打越兇,潛伏在我國多年的美國貨,卻靠中國人大賺特賺

關稅戰越打越兇,潛伏在我國多年的美國貨,卻靠中國人大賺特賺

億通電子游戲
2025-04-14 19:52:07
臺媒:彰化縣前縣長卓伯源宣布參選國民黨主席,稱將揚棄“臺獨”主張

臺媒:彰化縣前縣長卓伯源宣布參選國民黨主席,稱將揚棄“臺獨”主張

環球網資訊
2025-04-16 16:57:26
林高遠無緣世界杯16強!連丟4分遭逆轉提前出局 日本名將倒地慶祝

林高遠無緣世界杯16強!連丟4分遭逆轉提前出局 日本名將倒地慶祝

環太平洋老正太
2025-04-16 19:19:22
新版人民幣已經發行!腐敗分子要失眠了?

新版人民幣已經發行!腐敗分子要失眠了?

平說財經
2025-02-19 23:30:44
48小時內,藍營多位被捕!朱立倫扛下全責!臺媒:朱已別無選擇!

48小時內,藍營多位被捕!朱立倫扛下全責!臺媒:朱已別無選擇!

時尚的弄潮
2025-04-17 07:15:39
湖南省將迎2025年養老金調整,養老金1000元漲幅要比5000元高嗎?

湖南省將迎2025年養老金調整,養老金1000元漲幅要比5000元高嗎?

暖心人社
2025-04-16 22:09:06
金價飆漲!不少人排隊賣金變現

金價飆漲!不少人排隊賣金變現

魯中晨報
2025-04-16 15:39:02
VAR介入達5分鐘!賴斯對姆巴佩犯規送點,裁判看VAR后判越位在先

VAR介入達5分鐘!賴斯對姆巴佩犯規送點,裁判看VAR后判越位在先

直播吧
2025-04-17 03:36:12
外媒再批中國足球:丑聞!布彭扎離世,可他隊友卻像沒事人在慶祝

外媒再批中國足球:丑聞!布彭扎離世,可他隊友卻像沒事人在慶祝

風過鄉
2025-04-17 08:12:17
“世界是個草臺班子”!B站何同學翻車事件,撕開精英階層遮羞布

“世界是個草臺班子”!B站何同學翻車事件,撕開精英階層遮羞布

占理兒
2025-04-14 22:44:41
兩美女和郭艾倫吃飯!穿低胸裝身材妙曼,艾倫笑得開心將參加綜藝

兩美女和郭艾倫吃飯!穿低胸裝身材妙曼,艾倫笑得開心將參加綜藝

老吳說體育
2025-04-17 00:55:19
6.5萬億美債將到期,中方已下最后通牒,美國這次大禍臨頭了

6.5萬億美債將到期,中方已下最后通牒,美國這次大禍臨頭了

上觀韜略
2025-04-16 17:57:48
縣委書記被雙規后,45歲副縣長約書記19歲女兒爬山,說有要事相談

縣委書記被雙規后,45歲副縣長約書記19歲女兒爬山,說有要事相談

秋風專欄
2025-04-15 17:16:42
2025-04-17 08:31:00
AppSo incentive-icons
AppSo
讓智能手機更好用的秘密
5272文章數 26565關注度
往期回顧 全部

科技要聞

OpenAI發新模型!首次實現“圖像思維”

頭條要聞

特朗普聲稱1天能征20億美元關稅 美國海關:只有2.5億

頭條要聞

特朗普聲稱1天能征20億美元關稅 美國海關:只有2.5億

體育要聞

對著木板踢球的小鎮姑娘 成了皇馬第一人

娛樂要聞

娛樂圈的“現實”在岳云鵬身上應驗了

財經要聞

增長5.4% 一季度GDP增速為何超預期?

汽車要聞

又帥又快超實用 極氪007GT獵裝車才是完美的車?

態度原創

時尚
親子
藝術
本地
游戲

《我的后半生》,70歲正是純愛的好年紀!

親子要聞

身著古風裙的萌娃靈動起舞,似精致小手辦躍動,超可愛!

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

本地新聞

云游湖北 | 七仙女都愛的山水,雙峰米酒一口上頭

夢幻西游4月仙族門派調整:魔天宮首回合秒6 凌波被削清寵能力

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 达拉特旗| 富阳市| 建湖县| 嘉义县| 井冈山市| 武鸣县| 历史| 塔河县| 江山市| 高唐县| 涟源市| 娄底市| 潜江市| 阳东县| 监利县| 大冶市| 中牟县| 浙江省| 中阳县| 库伦旗| 武川县| 个旧市| 汉阴县| 屏山县| 招远市| 通化市| 株洲县| 太和县| 南投县| 施秉县| 新郑市| 澎湖县| 平武县| 晋中市| 柯坪县| 安化县| 和田县| 十堰市| 宕昌县| 资阳市| 鹤岗市|