網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

干翻英偉達，總共分幾步？

2025-04-16 10:49:24　來源: AI全球總部

北京舉報

分享至

上周，谷歌發(fā)布了自家最新（第七代）TPU芯片Ironwood。圈里又冒出來一堆炸裂體的文章，講這顆芯片如何干翻英偉達…

實際情況怎么樣呢？先說結論：毫無機會。

今天我們就來簡單分析下，谷歌要想在AI芯片領域干翻英偉達，總共分幾步？

雖然是掛谷歌舉例子，但也同樣適用于圈里所有玩家，包括悄悄發(fā)力、躍躍欲試甚至希望遙遙領先的國產(chǎn)廠商們↓

干翻英偉達，只需要五步

?搞定芯片性能：

單拼芯片本身，Ironwood確實有點兒東西，尤其在FP8推理、內存容量和功耗效率上，與Blackwell旗鼓相當。

但僅僅看推理場景，英偉達在低精度（FP4）和混合精度任務中的優(yōu)化，以及集群互聯(lián)技術的成熟度，仍然優(yōu)勢明顯。更不用說高精度和訓練場景。

當然，僅僅是谷歌這一小步，對國產(chǎn)芯片廠商已經(jīng)很有難度了。不過Ironwood的思路值得借鑒，那就是鎖定推理場景，提升能效比，爭取局部領先。

另外，只要我們的芯片性能超過閹割版，就算是成功的第一步。

?打破生態(tài)壁壘：

即便芯片性能過關，這一步更難。

英偉達的CUDA和軟件棧是AI開發(fā)的行業(yè)標準，谷歌的TPU生態(tài)（JAX、TensorFlow）覆蓋面有限，短期內難以吸引大量開發(fā)者遷移。

國內芯片同樣存在這樣的尷尬，計算平臺、AI框架、開發(fā)工具鏈都需要慢慢積累。

?消除市場慣性：

英偉達的GPU已在80-90%的AI工作負載中占據(jù)主導，客戶切換成本高，Ironwood的云端專屬模式進一步限制了其吸引力。

谷歌的困境也是國產(chǎn)AI芯片的困境，畢竟客戶不愛吃螃蟹，對國內利好的一點是芯片禁運和信創(chuàng)需求，可以推動客戶切換。

?解鎖全棧能力：

英偉達的GPU全面覆蓋訓練、推理和邊緣計算，適用場景更廣；Ironwood主要在推理上優(yōu)化，無法對抗英偉達的全棧優(yōu)勢。

從未來趨勢看，推理是大需求，訓練是小需求，國內AI芯片如果能主攻推理（FP8/FP6/FP4），不追求訓練核彈，未嘗不是更好的出路。

當然低精度高速度反而對器件和工藝的要求更高，更難做。所以千萬不要小看N家的低精度推理優(yōu)勢。

?持續(xù)迭代創(chuàng)新：

英偉達已明確從兩年一次的架構更新轉向每年推出一款新芯片的節(jié)奏。

2025年下半年將推出Blackwell Ultra，2026年推出Vera Rubin，2027年推出Rubin Ultra，性能預計比Hopper架構提升數(shù)十倍，目標支持萬億參數(shù)模型的實時推理和訓練。

這種節(jié)奏，谷歌跟不上，業(yè)內也沒有廠商跟得上，不過N記的多芯片設計和先進制程依賴TSMC，有一定供應鏈風險（當然，國產(chǎn)芯片供應鏈風險更大，即便已經(jīng)正在慢慢破局）。

總而言之，雖然英偉達AI芯片面臨AMD Instinct MI系列、Intel Gaudi 3和谷歌TPU等競品在性能和成本上逐步追趕，客戶可能轉向多元化采購。

國內廠商也在不斷蓄力，力求局部替代，但綜合性能、生態(tài)、市場、場景、可持續(xù)性來看，每一步都任重道遠。

太長不看的分界線，以下為詳細分析

第一戰(zhàn)：性能戰(zhàn)

Ironwood是谷歌首款專門針對推理優(yōu)化的TPU，旨在滿足生成式AI和復雜推理模型（比如MoE模型）的計算需求。關鍵技術亮點如下：

單芯片峰值性能為4,614 TFLOPs（FP8精度），集群規(guī)模可擴展至9,216個芯片，提供42.5 Exaflops的計算能力。

谷歌聲稱這一性能是全球最強大超級計算機El Capitan（1.7 Exaflops，F(xiàn)P64精度）的24倍以上。聽起來很NB吧，但谷歌這里玩了數(shù)字游戲，拿FP8與FP64的比較，有點不講武德。

Ironwood相比前代Trillium（第六代TPU），每瓦性能提升2倍，跟第一代TPU比，更是提升3,600倍，功耗效率提升近30倍。

每芯片配備192GB高帶寬內存（HBM），是Trillium的6倍，帶寬達7.2-7.4 TB/s。

增強的芯片間互聯(lián)（ICI）帶寬達1.2 Tbps（雙向），比Trillium提升1.5倍，支持大規(guī)模同步通信。（ICI相當于谷歌的NVlink）

單項PK，英偉達的比較：

Ironwood單芯片4,614 TFLOPs@FP8與英偉達B200（4,500 TFLOPs@FP8）性能相當，但B200在FP4精度下可進一步提升吞吐量（適合低精度推理）。

Ironwood的9,216芯片集群（42.5 EFLOPs）在理論峰值上領先，但英偉達的NVL144集群可以提供更高FP4性能。

同時，英偉達的NVLink和NVSwitch互聯(lián)技術在高密度集群中表現(xiàn)出色，在分布式任務中優(yōu)于谷歌的ICI。

顯存方面，Ironwood的192GB HBM和7.2 TB/s帶寬領先于B200（141GB HBM3e，4.8 TB/s帶寬），對內存密集型推理任務（如長上下文LLM）更有優(yōu)勢。

但英偉達在HBM3e技術上更靈活，支持Micron等供應商，在供應鏈穩(wěn)定性上占優(yōu)。

Ironwood的能效比優(yōu)于B200，尤其在FP8推理任務中，但英偉達在FP4和稀疏計算優(yōu)化上仍有領先。

不過，英偉達的Blackwell平臺整體功耗偏高（單卡約700W），堪稱電老虎，可能在超大規(guī)模部署中面臨電力瓶頸。

而Ironwood在能效比上，還是占據(jù)了一定優(yōu)勢。

小結一下↓

從技術角度看，Ironwood在FP8推理性能、內存容量和功耗效率上與英偉達Blackwell系列旗鼓相當，甚至在特定場景（如內存密集型推理）略有優(yōu)勢。

英偉達在低精度（FP4）和混合精度任務中的優(yōu)化，以及集群互聯(lián)技術的成熟度，仍使其在多樣化AI工作負載中更具競爭力。

純看推理，谷歌這款芯片還比較能打，這一局算是基本打平吧。

第二戰(zhàn)：市場與應用場景戰(zhàn)

Ironwood的定位是推理優(yōu)先和云端專屬。

Ironwood是谷歌首款專為推理設計的TPU，針對生成式AI的實時響應需求。推理正成為AI工作負載的主導部分，谷歌這波操作很應景。

同時，Ironwood僅通過Google Cloud提供（256或9,216芯片配置），不對外銷售硬件，鎖定云服務生態(tài)。

從目標客戶看，支持Gemini、AlphaFold等前沿模型，同時吸引生成式AI初創(chuàng)企業(yè)和需要超大規(guī)模推理的客戶，比如蘋果曾用8,192個TPU v4訓練其基礎模型。

英偉達的定位則是全棧覆蓋，硬件銷售+云服務并舉，其GPU同時支持訓練和推理，覆蓋從云端到邊緣的廣泛場景。

銷售模式不僅提供GPU硬件，還與云大廠合作，提供GPU實例，市場覆蓋更廣。比如云頭牌AWS，就推出了英偉達GPU實例全家桶。

而國內云，只要不受限的，也都會把英偉達GPU作為首選。

Ironwood高度集成于谷歌生態(tài)，適合依賴Google Cloud的客戶，但靈活性太低。

而英偉達的開放生態(tài)支持多種框架（TensorFlow、PyTorch）和部署環(huán)境，適應性更強。

所以，這一局，谷歌完敗。

第三戰(zhàn)：生態(tài)與軟件支持戰(zhàn)

Ironwood與谷歌Pathways運行時、JAX和Vertex AI深度整合，支持Gemini、Llama等模型。Pathways可高效分布式計算、跨數(shù)萬TPU協(xié)同工作。

但是，TPU生態(tài)相對封閉，嚴重依賴谷歌的TensorFlow和JAX框架，PyTorch支持有限。（雖然vLLM近期宣布支持TPU）

谷歌云提供一站式AI服務，對初創(chuàng)企業(yè)吸引力較大。

反觀英偉達，CUDA、TensorRT、Triton Inference Server和NAIE套件支持幾乎所有主流AI框架，開發(fā)者體驗更優(yōu)。

同時有龐大開發(fā)者社區(qū)和第三方優(yōu)化，模型遷移成本低，跨平臺兼容性強。

從靈活性看，英偉達的GPU可在幾乎所有云服務上部署，以及本地部署，客戶選擇余地更大。（買不起和買不到的另當別論）

這一局，谷歌仍然毫無取勝機會。

第四戰(zhàn)：成本與價格戰(zhàn)

谷歌并未公開Ironwood的定價，但TPU歷來以高性價比著稱，尤其在Google Cloud上運行大規(guī)模推理任務時。同時，Ironwood的能效比很不錯。

可是這一切的前提是：客戶需完全依賴Google Cloud，初期遷移成本（如模型優(yōu)化、框架適配）可能較高。

英偉達GPU價格較高，就不用說了，賊貴。

但其性能通用性、易用性和生態(tài)優(yōu)勢抵消了部分成本劣勢，可以大大降低客戶踩坑成本，畢竟填坑的隱形成本更高。

還有一點，英偉達現(xiàn)在開始推FP4推理優(yōu)化了，有機會進一步降低推理成本，尤其在邊緣場景中。

這一局，仍然是英偉達的優(yōu)勢局。

第五戰(zhàn)：產(chǎn)品迭代能力戰(zhàn)

谷歌的優(yōu)勢在于自研生態(tài)垂直整合（從芯片到模型再到云服務的全棧），優(yōu)化深度推理任務。

同時自有數(shù)據(jù)中心規(guī)模巨大，自己吃狗糧就ok，同時目前大規(guī)模需求都是推理，Ironwood的定位恰好精準。

但是英偉達的客戶基礎和開發(fā)者社區(qū)難以撼動，短期內Ironwood難以引發(fā)大規(guī)模切換。

更重要的是，英偉達的產(chǎn)品迭代能力，猶如已經(jīng)提速的跑車，后來者很難追趕。

比如，英偉達已明確從兩年一次的架構更新轉向每年推出一款新芯片的節(jié)奏。

所以，谷歌的Ironwood更適合在推理領域切分市場份額，但其云端專屬模式很難與英偉達直接精準。

其他玩家（如AMD的MI300X、AWS的Trainium、Intel的Gaudi、以及菊廠的昇騰910）雖然也在挑戰(zhàn)英偉達，但短期內很難形成足夠威脅。

所以，干翻英偉達只需要五步，但是每一步都堪比登天路。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

巨頭入場，硅光芯片迎來機遇

鈦媒體APP 2025-04-25 09:34:16
0 跟貼 0
成功干出中國芯那天，他說，走，我們向毛主席報喜去

鈦媒體APP 2025-04-06 12:04:18
0 跟貼 0

生成式AI的架構設計需確保支撐十萬至千萬級DAU

量子位 2025-04-23 17:09:24
0 跟貼 0

今年車展，那些正在崛起的中國芯片

EEWorld電子工程世界 2025-04-25 08:04:28
0 跟貼 0
Deepseek的隱喻：GPU失其鹿，ASIC、SOC們共逐之

鈦媒體APP 2025-02-06 16:19:11
1 跟貼 1

AI Phone：先是芯片，再是模型，最后才是手機廠商

鈦媒體APP 2024-11-08 19:44:25
3 跟貼 3

Switch 2芯片曝光！英偉達T239上身，DLSS真香警告，值得期待嗎？

小8說科技 2025-04-24 13:34:19
5 跟貼 5
任天堂 Switch 2 游戲機芯片曝光，為英偉達定制款 Tegra T239

IT之家 2025-04-24 22:14:19
2 跟貼 2

偉大誕生于解決不可能的問題——黃仁勛簡史

尚曦讀史 2025-04-25 09:14:12
0 跟貼 0
雙AI引擎引領艙駕融合！聯(lián)發(fā)科天璣C-X1攜手英偉達炸場上海車展

車東西 2025-04-25 09:46:23
0 跟貼 0
中國車企，首顆自研5nm芯片上車，4倍英偉達Orin-X性能

互聯(lián)網(wǎng).亂侃秀 2025-04-24 10:41:04
37 跟貼 37
獨家｜三星回應DDR4存儲芯片停產(chǎn)傳聞：不評論業(yè)界傳言，生產(chǎn)在按序進行

鈦媒體APP 2025-04-22 12:31:07
2 跟貼 2
黑芝麻智能推出新一代芯片平臺和跨域融合方案

全球TMT 2025-04-24 10:53:04
0 跟貼 0
起底AI算力新黑馬：手握45萬塊GPU，年營收將超70億，獨家承包“星際之門”

智東西 2025-04-23 18:25:47
56 跟貼 56
蔡正元：華為升騰芯片920，能取代H20了

虎悅事記 2025-04-22 13:54:55
0 跟貼 0
楓葉漫談：痛苦的新生·還是幸福的滅亡

楓葉漫談 2025-04-24 14:54:02
1414 跟貼 1414
傷亡人數(shù)是機密，谷歌泄密恐致俄軍心渙散，普京最怕的事要來了？

宋忠平 2025-04-23 16:31:59
16 跟貼 16
詳解具身智能算力需求，英特爾推大小腦融合方案

智東西 2025-04-22 19:23:16
6 跟貼 6
“搶跑”下一代架構，英特爾為了車載市場“拼了”

三易生活 2025-04-23 21:33:38
4 跟貼 4
專訪英特爾汽車業(yè)務副總裁：我們不需要單獨設計智駕芯片

電動星球News 2025-04-24 22:06:42
2 跟貼 2
出貨超800萬片，芯馳發(fā)布全新汽車AI座艙處理器和智控芯片｜鈦媒體直擊2025上海車展

鈦媒體APP 2025-04-24 08:25:09
0 跟貼 0
聯(lián)合英偉達布局汽車行業(yè)，MediaTek發(fā)布多款天璣汽車平臺產(chǎn)品 | 2025上海車展

鈦媒體APP 2025-04-24 18:53:25
12 跟貼 12
美國搞芯片封鎖，介文汲：中國大陸科技發(fā)展力量會讓他們后悔

海峽導報社 2025-04-23 17:55:11
0 跟貼 0
上海車展看“智”量，這個產(chǎn)業(yè)亟待突破式創(chuàng)新

上觀新聞 2025-04-25 07:02:06
0 跟貼 0
媒體:董明珠稱"海歸派里有間諜絕不會用" 很違背常識

新民周刊 2025-04-24 18:45:08
57952 跟貼 57952
芯馳科技發(fā)布X10，打造全民AI時代座艙處理器新標桿

獵云網(wǎng) 2025-04-25 10:06:31
0 跟貼 0
智能汽車突圍戰(zhàn)：國產(chǎn)芯片的“攻防與加速”

半導體行業(yè)觀察 2025-04-25 09:42:11
0 跟貼 0
“迪拜人工智能周”聚焦前沿技術與產(chǎn)業(yè)落地，微軟、英偉達、OpenAI等科技公司與會

界面新聞 2025-04-22 16:57:18
0 跟貼 0
《上古卷軸4：湮滅重制版》發(fā)布：同時支持NVIDIA DLSS4、AMD FSR4

快科技 2025-04-23 10:47:22
6 跟貼 6
30萬買的新能源，車機卡的要命，芯片竟是驍龍855魔改過來的！

領笑之家 2025-04-21 16:07:17
2 跟貼 2
夫妻慘遭殺害，男人僥幸生還被植入高科技芯片，能力堪比毒液

時光琉影8 2025-04-23 18:55:24
0 跟貼 0
擁抱新能源，別克“逍遙”超級融合架構引領智能化浪潮

電動邦 2025-04-24 11:26:53
5 跟貼 5
DLSS加速6款新游戲，包括《鋼鐵之種》、《塔羅斯法則：重啟》等

3DM游戲 2025-04-23 11:01:07
0 跟貼 0
谷歌篡改南海稱呼，我國外交部堅定回應，解放軍宣布實彈射擊訓練

烽火觀察 2025-04-23 00:05:44
0 跟貼 0
剛篡改南海稱呼，谷歌公司被定罪，動手的不是中國，巨額罰款來襲

權權前哨前沿 2025-04-23 15:05:14
0 跟貼 0
谷歌篡改南海稱呼，菲律賓高呼歡迎，4天過后，中方宣布大動作

權權前哨前沿 2025-04-23 15:05:16
0 跟貼 0
孟繁睿VS王禹博天才少年之戰(zhàn) 超強計算能力比肩王天一

影看 2025-04-23 10:42:10
0 跟貼 0
巴特勒傷退追夢登全美第1熱搜：推倒阿門隔山打牛美媒曬罪行狂批

顏小白的籃球夢 2025-04-24 10:52:28
2625 跟貼 2625
3分鐘解讀！遼寧與北京雙雄的“硬件”，恰好針對廣廈與山西

飛鳥各投林 2025-04-25 05:46:05
3 跟貼 3
亞馬遜與英偉達高管齊聲：AI數(shù)據(jù)中心建設熱度未見放緩

財聯(lián)社 2025-04-25 02:40:13
0 跟貼 0

AI全球總部

全球最新、最酷AI解決方案

996文章數(shù) 717關注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

旅游

房產(chǎn)

游戲

教育

手機 / 數(shù)碼

房產(chǎn) / 家居

干翻英偉達，總共分幾步？

干翻英偉達，只需要五步

太長不看的分界線，以下為詳細分析

這屆上海車展，沒人靠流量活著

媒體：日本又打了個樣 妥協(xié)讓步?jīng)]換來美國的高抬貴手

媒體：日本又打了個樣 妥協(xié)讓步?jīng)]換來美國的高抬貴手

名記:梅西將續(xù)約2年 近10%股權比肩小貝

S家再被打臉！葛斯齊爆料一針見血

王興注定“永無寧日”

純電CLA L及Vision V概念車 奔馳這次玩大了

態(tài)度原創(chuàng)

唇皰疹和口腔潰瘍是"同伙"嗎？

熱聞|清明假期將至，熱門目的地有哪些?

灣區(qū)最美徒步掀起打卡潮！這座世界莊園，解鎖當代美好生活新密碼！

晨報|老滾4RE性別Mod重新上架 Remedy新作6月發(fā)售

媒體：日本又打了個樣妥協(xié)讓步?jīng)]換來美國的高抬貴手

媒體：日本又打了個樣妥協(xié)讓步?jīng)]換來美國的高抬貴手

名記:梅西將續(xù)約2年近10%股權比肩小貝

純電CLA L及Vision V概念車奔馳這次玩大了