99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

干翻英偉達,總共分幾步?

0
分享至



上周,谷歌發(fā)布了自家最新(第七代)TPU芯片Ironwood。圈里又冒出來一堆炸裂體的文章,講這顆芯片如何干翻英偉達…

實際情況怎么樣呢?先說結論:毫無機會。

今天我們就來簡單分析下,谷歌要想在AI芯片領域干翻英偉達,總共分幾步?

雖然是掛谷歌舉例子,但也同樣適用于圈里所有玩家,包括悄悄發(fā)力、躍躍欲試甚至希望遙遙領先的國產(chǎn)廠商們↓

干翻英偉達,只需要五步

?搞定芯片性能:

單拼芯片本身,Ironwood確實有點兒東西,尤其在FP8推理、內存容量和功耗效率上,與Blackwell旗鼓相當。

但僅僅看推理場景,英偉達在低精度(FP4)和混合精度任務中的優(yōu)化,以及集群互聯(lián)技術的成熟度,仍然優(yōu)勢明顯。更不用說高精度和訓練場景。

當然,僅僅是谷歌這一小步,對國產(chǎn)芯片廠商已經(jīng)很有難度了。不過Ironwood的思路值得借鑒,那就是鎖定推理場景,提升能效比,爭取局部領先。

另外,只要我們的芯片性能超過閹割版,就算是成功的第一步。

?打破生態(tài)壁壘:

即便芯片性能過關,這一步更難。

英偉達的CUDA和軟件棧是AI開發(fā)的行業(yè)標準,谷歌的TPU生態(tài)(JAX、TensorFlow)覆蓋面有限,短期內難以吸引大量開發(fā)者遷移。

國內芯片同樣存在這樣的尷尬,計算平臺、AI框架、開發(fā)工具鏈都需要慢慢積累。

?消除市場慣性

英偉達的GPU已在80-90%的AI工作負載中占據(jù)主導,客戶切換成本高,Ironwood的云端專屬模式進一步限制了其吸引力。

谷歌的困境也是國產(chǎn)AI芯片的困境,畢竟客戶不愛吃螃蟹,對國內利好的一點是芯片禁運和信創(chuàng)需求,可以推動客戶切換。

?解鎖全棧能力:

英偉達的GPU全面覆蓋訓練、推理和邊緣計算,適用場景更廣;Ironwood主要在推理上優(yōu)化,無法對抗英偉達的全棧優(yōu)勢。

從未來趨勢看,推理是大需求,訓練是小需求,國內AI芯片如果能主攻推理(FP8/FP6/FP4),不追求訓練核彈,未嘗不是更好的出路。

當然低精度高速度反而對器件和工藝的要求更高,更難做。所以千萬不要小看N家的低精度推理優(yōu)勢。

?持續(xù)迭代創(chuàng)新:

英偉達已明確從兩年一次的架構更新轉向每年推出一款新芯片的節(jié)奏。

2025年下半年將推出Blackwell Ultra,2026年推出Vera Rubin,2027年推出Rubin Ultra,性能預計比Hopper架構提升數(shù)十倍,目標支持萬億參數(shù)模型的實時推理和訓練。

這種節(jié)奏,谷歌跟不上,業(yè)內也沒有廠商跟得上,不過N記的多芯片設計和先進制程依賴TSMC,有一定供應鏈風險(當然,國產(chǎn)芯片供應鏈風險更大,即便已經(jīng)正在慢慢破局)。

總而言之,雖然英偉達AI芯片面臨AMD Instinct MI系列、Intel Gaudi 3和谷歌TPU等競品在性能和成本上逐步追趕,客戶可能轉向多元化采購。

國內廠商也在不斷蓄力,力求局部替代,但綜合性能、生態(tài)、市場、場景、可持續(xù)性來看,每一步都任重道遠。

太長不看的分界線,以下為詳細分析

第一戰(zhàn):性能戰(zhàn)

Ironwood是谷歌首款專門針對推理優(yōu)化的TPU,旨在滿足生成式AI和復雜推理模型(比如MoE模型)的計算需求。關鍵技術亮點如下:

單芯片峰值性能為4,614 TFLOPs(FP8精度),集群規(guī)模可擴展至9,216個芯片,提供42.5 Exaflops的計算能力。

谷歌聲稱這一性能是全球最強大超級計算機El Capitan(1.7 Exaflops,F(xiàn)P64精度)的24倍以上。聽起來很NB吧,但谷歌這里玩了數(shù)字游戲,拿FP8與FP64的比較,有點不講武德。

Ironwood相比前代Trillium(第六代TPU),每瓦性能提升2倍,跟第一代TPU比,更是提升3,600倍,功耗效率提升近30倍。



每芯片配備192GB高帶寬內存(HBM),是Trillium的6倍,帶寬達7.2-7.4 TB/s。

增強的芯片間互聯(lián)(ICI)帶寬達1.2 Tbps(雙向),比Trillium提升1.5倍,支持大規(guī)模同步通信。(ICI相當于谷歌的NVlink)



單項PK,英偉達的比較:

Ironwood單芯片4,614 TFLOPs@FP8與英偉達B200(4,500 TFLOPs@FP8)性能相當,但B200在FP4精度下可進一步提升吞吐量(適合低精度推理)。

Ironwood的9,216芯片集群(42.5 EFLOPs)在理論峰值上領先,但英偉達的NVL144集群可以提供更高FP4性能。

同時,英偉達的NVLink和NVSwitch互聯(lián)技術在高密度集群中表現(xiàn)出色,在分布式任務中優(yōu)于谷歌的ICI。

顯存方面,Ironwood的192GB HBM和7.2 TB/s帶寬領先于B200(141GB HBM3e,4.8 TB/s帶寬),對內存密集型推理任務(如長上下文LLM)更有優(yōu)勢。

但英偉達在HBM3e技術上更靈活,支持Micron等供應商,在供應鏈穩(wěn)定性上占優(yōu)。

Ironwood的能效比優(yōu)于B200,尤其在FP8推理任務中,但英偉達在FP4和稀疏計算優(yōu)化上仍有領先。

不過,英偉達的Blackwell平臺整體功耗偏高(單卡約700W),堪稱電老虎,可能在超大規(guī)模部署中面臨電力瓶頸。

而Ironwood在能效比上,還是占據(jù)了一定優(yōu)勢。



小結一下↓

從技術角度看,Ironwood在FP8推理性能、內存容量和功耗效率上與英偉達Blackwell系列旗鼓相當,甚至在特定場景(如內存密集型推理)略有優(yōu)勢。

英偉達在低精度(FP4)和混合精度任務中的優(yōu)化,以及集群互聯(lián)技術的成熟度,仍使其在多樣化AI工作負載中更具競爭力。

純看推理,谷歌這款芯片還比較能打,這一局算是基本打平吧。



第二戰(zhàn):市場與應用場景戰(zhàn)

Ironwood的定位是推理優(yōu)先和云端專屬。

Ironwood是谷歌首款專為推理設計的TPU,針對生成式AI的實時響應需求。推理正成為AI工作負載的主導部分,谷歌這波操作很應景。

同時,Ironwood僅通過Google Cloud提供(256或9,216芯片配置),不對外銷售硬件,鎖定云服務生態(tài)。



從目標客戶看,支持Gemini、AlphaFold等前沿模型,同時吸引生成式AI初創(chuàng)企業(yè)和需要超大規(guī)模推理的客戶,比如蘋果曾用8,192個TPU v4訓練其基礎模型。

英偉達的定位則是全棧覆蓋,硬件銷售+云服務并舉,其GPU同時支持訓練和推理,覆蓋從云端到邊緣的廣泛場景。

銷售模式不僅提供GPU硬件,還與云大廠合作,提供GPU實例,市場覆蓋更廣。比如云頭牌AWS,就推出了英偉達GPU實例全家桶。

而國內云,只要不受限的,也都會把英偉達GPU作為首選。



Ironwood高度集成于谷歌生態(tài),適合依賴Google Cloud的客戶,但靈活性太低。

而英偉達的開放生態(tài)支持多種框架(TensorFlow、PyTorch)和部署環(huán)境,適應性更強。

所以,這一局,谷歌完敗。



第三戰(zhàn):生態(tài)與軟件支持戰(zhàn)

Ironwood與谷歌Pathways運行時、JAX和Vertex AI深度整合,支持Gemini、Llama等模型。Pathways可高效分布式計算、跨數(shù)萬TPU協(xié)同工作。

但是,TPU生態(tài)相對封閉,嚴重依賴谷歌的TensorFlow和JAX框架,PyTorch支持有限。(雖然vLLM近期宣布支持TPU)

谷歌云提供一站式AI服務,對初創(chuàng)企業(yè)吸引力較大。

反觀英偉達,CUDA、TensorRT、Triton Inference Server和NAIE套件支持幾乎所有主流AI框架,開發(fā)者體驗更優(yōu)。



同時有龐大開發(fā)者社區(qū)和第三方優(yōu)化,模型遷移成本低,跨平臺兼容性強。

從靈活性看,英偉達的GPU可在幾乎所有云服務上部署,以及本地部署,客戶選擇余地更大。(買不起和買不到的另當別論)

這一局,谷歌仍然毫無取勝機會。



第四戰(zhàn):成本與價格戰(zhàn)

谷歌并未公開Ironwood的定價,但TPU歷來以高性價比著稱,尤其在Google Cloud上運行大規(guī)模推理任務時。同時,Ironwood的能效比很不錯。

可是這一切的前提是:客戶需完全依賴Google Cloud,初期遷移成本(如模型優(yōu)化、框架適配)可能較高。

英偉達GPU價格較高,就不用說了,賊貴。



但其性能通用性、易用性和生態(tài)優(yōu)勢抵消了部分成本劣勢,可以大大降低客戶踩坑成本,畢竟填坑的隱形成本更高。

還有一點,英偉達現(xiàn)在開始推FP4推理優(yōu)化了,有機會進一步降低推理成本,尤其在邊緣場景中。

這一局,仍然是英偉達的優(yōu)勢局。



第五戰(zhàn):產(chǎn)品迭代能力戰(zhàn)

谷歌的優(yōu)勢在于自研生態(tài)垂直整合(從芯片到模型再到云服務的全棧),優(yōu)化深度推理任務。

同時自有數(shù)據(jù)中心規(guī)模巨大,自己吃狗糧就ok,同時目前大規(guī)模需求都是推理,Ironwood的定位恰好精準。



但是英偉達的客戶基礎和開發(fā)者社區(qū)難以撼動,短期內Ironwood難以引發(fā)大規(guī)模切換。

更重要的是,英偉達的產(chǎn)品迭代能力,猶如已經(jīng)提速的跑車,后來者很難追趕。

比如,英偉達已明確從兩年一次的架構更新轉向每年推出一款新芯片的節(jié)奏。

2025年下半年將推出Blackwell Ultra,2026年推出Vera Rubin,2027年推出Rubin Ultra,性能預計比Hopper架構提升數(shù)十倍,目標支持萬億參數(shù)模型的實時推理和訓練。



所以,谷歌的Ironwood更適合在推理領域切分市場份額,但其云端專屬模式很難與英偉達直接精準。

其他玩家(如AMD的MI300X、AWS的Trainium、Intel的Gaudi、以及菊廠的昇騰910)雖然也在挑戰(zhàn)英偉達,但短期內很難形成足夠威脅。

所以,干翻英偉達只需要五步,但是每一步都堪比登天路。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國最受歡迎的六大城市,第一名很難超越,去過一半很幸福!

中國最受歡迎的六大城市,第一名很難超越,去過一半很幸福!

艾米手工作品
2025-04-12 13:53:45
勇士官宣:巴特勒盆骨挫傷提前退賽 遭追夢推人間接誤傷重摔

勇士官宣:巴特勒盆骨挫傷提前退賽 遭追夢推人間接誤傷重摔

醉臥浮生
2025-04-24 10:34:46
小古德溫社媒曬與女友合照,極度吸引眼球

小古德溫社媒曬與女友合照,極度吸引眼球

雷速體育
2025-04-24 15:09:27
女子被徹底洗腦,把丈夫掙的100萬打水飄!上海民警苦勸8小時

女子被徹底洗腦,把丈夫掙的100萬打水飄!上海民警苦勸8小時

瀟湘晨報
2025-04-24 15:41:36
千萬不能傷害這3種人,弘一法師警示,后果都是現(xiàn)世報

千萬不能傷害這3種人,弘一法師警示,后果都是現(xiàn)世報

阿鄭的讀書日常
2025-04-07 16:00:11
6250萬英鎊!曼聯(lián)夏窗首簽敲定,巴西國腳接近加盟,5人將被清洗

6250萬英鎊!曼聯(lián)夏窗首簽敲定,巴西國腳接近加盟,5人將被清洗

綠茵舞著
2025-04-25 00:11:26
太慘了!血洗旅游勝地,恐怖分子向莫迪宣戰(zhàn),印軍3天才收拾殘局

太慘了!血洗旅游勝地,恐怖分子向莫迪宣戰(zhàn),印軍3天才收拾殘局

獵火照狼山
2025-04-24 19:45:40
我國最虛弱的20年,如果不是三個小國“幫忙”,恐怕美國早已開戰(zhàn)

我國最虛弱的20年,如果不是三個小國“幫忙”,恐怕美國早已開戰(zhàn)

跳跳歷史
2025-04-24 16:36:48
一個人爬出底層的最快方式:模仿曾國藩

一個人爬出底層的最快方式:模仿曾國藩

洞見
2025-02-18 22:02:09
小S可能面臨退圈,葛斯齊再次炮轟小S,質疑她對大S醫(yī)療處理不當

小S可能面臨退圈,葛斯齊再次炮轟小S,質疑她對大S醫(yī)療處理不當

素素娛樂
2025-04-25 08:57:37
熱聞|中央巡視組入駐一周,“清風中原”官宣九人落馬

熱聞|中央巡視組入駐一周,“清風中原”官宣九人落馬

齊魯壹點
2025-04-24 11:21:16
特朗普一聲令下,29國聯(lián)手圍攻中國,日本沖在最前線,俄已選邊站

特朗普一聲令下,29國聯(lián)手圍攻中國,日本沖在最前線,俄已選邊站

天行艦
2025-04-25 00:05:17
44歲謝霆鋒時隔20年再開演唱會!80多位明星藝人到場助力!舞臺如夢似幻,科技感爆棚

44歲謝霆鋒時隔20年再開演唱會!80多位明星藝人到場助力!舞臺如夢似幻,科技感爆棚

臺州交通廣播
2025-04-25 09:31:29
事不過七?漢堡連續(xù)六個賽季無緣德甲,本賽季89.1%概率前二

事不過七?漢堡連續(xù)六個賽季無緣德甲,本賽季89.1%概率前二

直播吧
2025-04-24 17:17:14
浙江麗水一小區(qū)出現(xiàn)“石頭陣”?多位業(yè)主投訴,物業(yè)報警6次?當?shù)厣鐓^(qū)回應

浙江麗水一小區(qū)出現(xiàn)“石頭陣”?多位業(yè)主投訴,物業(yè)報警6次?當?shù)厣鐓^(qū)回應

封面新聞
2025-04-24 00:23:25
莫迪專機連夜回國,2025年第一次大仗,將在中國鄰國之間打響?

莫迪專機連夜回國,2025年第一次大仗,將在中國鄰國之間打響?

Ck的蜜糖
2025-04-24 17:36:38
長期吃降壓藥的人,如果身體出現(xiàn)這5個變化,建議馬上停藥

長期吃降壓藥的人,如果身體出現(xiàn)這5個變化,建議馬上停藥

DrX說
2025-04-24 12:54:14
劉濤微醺后徹底放飛,穿夾克坐宋佳腿上說話,宋佳一臉寵溺

劉濤微醺后徹底放飛,穿夾克坐宋佳腿上說話,宋佳一臉寵溺

毗那夜迦
2025-03-02 01:00:03
榮昌鹵鵝走紅后當?shù)匚锪髁糠?榮昌區(qū)委書記:一個物流公司每天就穩(wěn)穩(wěn)兩萬單

榮昌鹵鵝走紅后當?shù)匚锪髁糠?榮昌區(qū)委書記:一個物流公司每天就穩(wěn)穩(wěn)兩萬單

封面新聞
2025-04-24 17:58:34
40歲以上中年人失業(yè)都干嘛去了?網(wǎng)友的分享簡直讓我大開眼界了

40歲以上中年人失業(yè)都干嘛去了?網(wǎng)友的分享簡直讓我大開眼界了

智慧生活筆記
2025-04-16 09:57:00
2025-04-25 10:43:00
AI全球總部
AI全球總部
全球最新、最酷AI解決方案
996文章數(shù) 717關注度
往期回顧 全部

科技要聞

這屆上海車展,沒人靠流量活著

頭條要聞

媒體:日本又打了個樣 妥協(xié)讓步?jīng)]換來美國的高抬貴手

頭條要聞

媒體:日本又打了個樣 妥協(xié)讓步?jīng)]換來美國的高抬貴手

體育要聞

名記:梅西將續(xù)約2年 近10%股權比肩小貝

娛樂要聞

S家再被打臉!葛斯齊爆料一針見血

財經(jīng)要聞

王興注定“永無寧日”

汽車要聞

純電CLA L及Vision V概念車 奔馳這次玩大了

態(tài)度原創(chuàng)

健康
旅游
房產(chǎn)
游戲
教育

唇皰疹和口腔潰瘍是"同伙"嗎?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產(chǎn)要聞

灣區(qū)最美徒步掀起打卡潮!這座世界莊園,解鎖當代美好生活新密碼!

晨報|老滾4RE性別Mod重新上架 Remedy新作6月發(fā)售

教育要聞

今晚8點直播|海星程 x Sarah:從占星小白到高手到底有多遠?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 蒲江县| 天镇县| 新安县| 全椒县| 白山市| 霍州市| 大渡口区| 通许县| 蛟河市| 北海市| 晋中市| 东源县| 甘德县| 柘荣县| 高唐县| 东兰县| 长武县| 新闻| 安岳县| 大理市| 武强县| 高尔夫| 拉孜县| 思茅市| 黄龙县| 香格里拉县| 十堰市| 吉首市| 沂南县| 民县| 泰州市| 和林格尔县| 来安县| 孟村| 宣威市| 浦北县| 三明市| 三河市| 临夏市| 恩平市| 巴里|