99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

<mark id="dywpz"></mark>

<abbr id="dywpz"><optgroup id="dywpz"></optgroup></abbr>

<del id="dywpz"></del><kbd id="dywpz"><acronym id="dywpz"></acronym></kbd>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

斥巨資搞的智算中心，虧慘了！

2024-10-21 19:29:48　來源: AI全球總部

北京舉報

0

分享至

老馮升職了！

被集團委派，成為集團智算中心租賃項目的負責人。

這個智算中心，可是集團的最新增長極，也是公司跨界轉型的橋頭堡，被集團寄予厚望。

新官上任，老馮最著急的就是讓改造的智算中心趕緊投產，把租賃業務盡快開動起來。

現在這波大模型風口可不能錯過，時間就是金錢，算力就是Money！

終于，智算中心改造完成，那天，老馮帶客戶參觀，躊躇滿志…

結果，業績慘淡，根本租不出去，好不容易租出去的，到期也沒有續租。

一個季度下來，老板看到慘淡的報表，恨不得揪住老馮破口大罵↓

為什么會鬧成這樣？

原來，老馮和大多數人一樣，只看重了紙面算力，關注核心組件GPU，卻忽略了很多細節。

正是這些細節坑，讓老馮栽了大跟頭。

那么，老馮都踩了哪些坑呢？究竟有哪些細節被老馮忽略了？

01、規劃階段的坑

最開始，老馮所有精力都放在搶卡上，動用了各種資源，結果發現，搞到GPU也沒那么難。

這一塊有了著落，老馮就對其他方面沒怎么上心了。

網絡？隨便搞搞就行了。

因為傳統數據中心組網，老馮以前也搞過，覺得沒啥大不了的，什么400G、800G，稀松平常。

他不知道，現在這種智算中心，網絡規劃不好，簡直就是天坑。

比如兩種技術路線，RoCE和IB，老馮想當然地覺得IB成熟靠譜，所以RoCE的方案商來交流，他都懶得搭理。

殊不知，這半年RoCE的聲勢已經蓋過了IB，無論是性價比、開放性、端口速率、可維護性，開始占據明顯上風。

就在老馮九牛拉不回，篤定要選IB的時候，集團下調了預算，因為IB比RoCE方案貴了一倍，要求老馮必須改方案。

沒辦法，老馮順坡下驢。

工期緊，就隨便選了一家廠商的網絡方案，推進上線。

這一步，棄IB選RoCE，沒錯！老馮錯在沒做功課，RoCE好不代表所有的RoCE都好。

02、部署上線階段的坑

看著各家參數都差不多，其實，RoCE和IB可不一樣，IB只是明坑多，而RoCE則是暗坑多。

設備一到貨，開始部署上線，RoCE那些暗坑立馬來了。

IB基本上即插即用，但RoCE如果選不好，部署上線和優化性能就太麻煩了，嚴重影響工期。

結果，別家都搞完租了半年了，老馮這里才姍姍來遲。

03、開局運營階段的坑

終于，熬到智算中心開張，也好不容易“忽悠”來了客戶。

老馮以為自家卡算力滿滿，結果租戶體驗極差：不是頻繁出錯，就是訓練卡頓。

租戶們都是明白人，搞大模型訓練就要爭分奪秒，提供推理服務也需要高實時性，否則就沒有客戶體驗。

像老馮這種智算中心，太拉了，于是大家紛紛退租…

至此，這個被集團寄予厚望智算中心項目，算是徹底啞火。

老馮也黯然離職，整個智算團隊解散。

如果給老馮重來一次的機會，他一定不會再這么托大。

對智算中心來說，算力卡很標準，大家都大差不差，最大的變數其實是網絡。

好網絡和差網絡，最終呈現的結果，天差地別。

那么，在智算中心建設中，如何避開網絡的那些明坑和暗坑？

首先，RoCE是未來，不選IB是對的，可以一次性避開明坑（性價比、開放性、可維護性…）。

但是，RoCE產品的選型，是很有門道的，要避免重蹈老馮覆轍。

我們先來看一個典型的智算中心組網拓撲↓

重點看左邊智算業務區的拓撲，其中參數網是個大坑，多軌連線復雜，配置量巨大。

以現在非常主流的萬卡場景為例，服務器約1250臺（8卡服務器），網絡設備約140臺，網絡配置項總量約41萬條，服務器配置項總量3萬+條。

而且，還需要跨部門協調，單就一次配置開局，沒幾個周搞不定，更不用說還要優化、變更。

所以在這一環節，必須要選擇支持算網協同智能化組網的。

比如業界就有某大廠推出了智算中心端到端的網絡自動化部署方案，通過控制器實現算網聯動，參數網/存儲網一鍵部署，萬卡規模智算中心天級開局。

組網過程中，該方案可從多視角展示交換機、算力卡、網卡互聯拓撲，快速定位網絡連接錯誤。

不要小看這個功能，超級實用。

比如，萬卡集群的線纜有幾萬條，沒人能一次把連線搞定：交換機線接錯了，服務器網卡線接錯了，網段劃分錯了，服務器內部GPU網卡拓撲異常…

但如果有了這種算網一體可視化拓撲，分分鐘就能找到接線錯誤點（交換機之間、交換機與服務器間、服務器內GPU與網卡間）。

一鍵查錯，快速修正，節省人力成本90%以上↓

在這樣的平臺下，“端隨網動”，端側服務器的配置可以自動化部署：RoCE配置、路由下發、網卡Bond設置均可以自動完成。

如此，GPU服務器上線一氣呵成不擰巴，大大縮短工期。

有了這套叫做“AD-DC”的神器，智算中心的部署和上線，再也不必擔心工期，按天來計算，麻麻利利，絕不脫泥帶水。（注：端網協同功能需要對應智算交換機支持）

接下來，智算中心開局，進入正式運營期，怎么保證租戶的體驗呢？

前面說過，拼算力卡的話，大家都差不多，你有的我也有，你沒有的我也沒有。

其實，網絡層面，單看硬件、端口規格、芯片能力，大家也差不多。

可為啥實際跑起智算任務就天差地別了呢？

有人頻繁報錯，訓練一天中斷好幾次；有人慢如蝸牛，訓練進度看不到頭；而有人卻能穩得一匹，訓練推理嗖嗖快。

這里面的關鍵差異，是智算網絡全局操控和調度的能力。

首先，對于400G、800G速率的鏈路，看起來帶寬足夠，但訓練任務在做All-Reduce等操作時，數據量極大。

傳統逐流負載均衡的模式，很容易把流量調度到一條鏈路上，導致擁塞。

如果按照設備端口粒度逐流，雖然能避免“多打一”，卻需要針對每個下行口指定一個同速率上行口（LBN）。

一一綁定工作量驚人，手工配置難度很大。

此時，我們再次拿出AD-DC神器，通過控制器自動識別連接服務器的交換機下行端口，批量整網部署LBN，大幅簡化工作量。

而且，AD-DC還提供分析器，監控并分析負載均衡的調度效果。

AD-DC在控制器側可以啟用路徑導航算法，通過仿真得到最佳端側參數，并下發配置到服務器。（注：路徑導航功能需要對應智算交換機支持）

同時，控制器還可以與UCCL（集合通信庫）配合，站在全局視角，為智算任務選擇最優鏈路。

這幾波神操作，既可以有效避免智算網絡的擁塞，又省掉了逐包負載均衡方案的保序網卡，大幅降低整網的造價和復雜度。

當然智算業務對網絡時延也很敏感，此時還可以啟用AI ECN動態調優，實時監控入棧流量模型，智能調整擁塞控制窗口，達到最優傳輸效率。

這就完了嗎？不！

這套AD-DC神器，還提供集群健康巡檢、訓前一鍵壓測、訓中作業監控和故障診斷等一系列智算運營運維能力↓

01、一鍵巡檢

跨域全面巡檢，萬卡集群，常規巡檢30分鐘內完成，深度巡檢小時級完成，提效80%。

02、一鍵壓測

萬卡集群環境下，10K網卡、30K設備接口，一鍵壓測小時級完成，提升效率80%。

03、一鍵診斷

交換機、服務器、網卡、GPU端到端的整網全棧數據采集、AI ECN調優及擁塞分析，保障訓練任務的穩定運行。

舉個大家感同身受的例子：在智算中心里，光模塊是故障高發器件。

故障引起的丟包錯報會讓訓練效率下降50%，而故障引起的閃斷會使訓練任務中斷，續訓影響3-5小時。

可是，一個萬卡集群的光模塊數量超過4萬個，平均每天要處理3例以上的光模塊問題，全手工排查的話，平均每個要花費2-4小時。

而采用AD-DC控制器的一鍵診斷工具，一分鐘內就可以定位問題光模塊。且能提前預測、提前發現，提前介入維護。

所以，如果搞智算中心的，早早選對AD-DC加持的智算網絡方案，那么從前期規劃到部署上線，再到運維運營，都會少走太多彎路。

規劃選型不踩坑，部署上線不墨跡，運維運營不拉跨。

這套“為RoCE網絡正名、讓智算中心雄起”的智算網絡解決方案，正是ICT豪門「新華三」的拿手本領。

左手全系列智算交換機，橫跨100G、200G、400G、800G，覆蓋百卡、千卡、萬卡、十萬卡超大規模組網↓

右手AD-DC智能管控析平臺，貫通部署上線、訓前、訓中、訓后智算網絡的全生命周期運維管理能力。

新華三智算網絡解決方案雙劍合璧，AIGC時代智算基礎設施的最強推手，來啦！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

楓葉漫談：痛苦的新生·還是幸福的滅亡

楓葉漫談 2025-04-24 14:54:02
1412 跟貼 1412
媒體:董明珠稱"海歸派里有間諜絕不會用" 很違背常識

新民周刊 2025-04-24 18:45:08
54331 跟貼 54331

巴特勒傷退追夢登全美第1熱搜：推倒阿門隔山打牛美媒曬罪行狂批

顏小白的籃球夢 2025-04-24 10:52:28
2664 跟貼 2664

大瓜？卸任第2天，劉國梁公司版圖曝光，與王楠夫婦共創500億項目

體育有點水 2025-04-24 12:00:15
2101 跟貼 2101
上海車展某品牌請來網紅跳青海搖，現場一群人圍觀拍照

眾橫四海 2025-04-24 11:26:59
7826 跟貼 7826

生于1984年，馬玥已任遼寧錦州北鎮市代市長

澎湃新聞 2025-04-24 21:18:36
451 跟貼 451

不應該！賽后廣廈球迷豎中指，大罵“遼G”，隔空侮辱遼寧隊

南海浪花 2025-04-24 12:02:27
1059 跟貼 1059
何小鵬車展上試乘蔚來螢火蟲，跟李斌說定價太便宜了！

老趙觀天下 2025-04-24 22:00:23
3588 跟貼 3588

網傳河南某國企參加校招，薪資每月0-1000元，遠低于河南最低工資標準

可達鴨面面觀 2025-04-24 11:01:54
4569 跟貼 4569
交通運輸部：7座以下（含7座）小型客車免費通行時間為5月1日0時至5月5日24時

證券時報 2025-04-24 15:14:15
48 跟貼 48
董明珠一句蠢話，震出來4個真相

17譚 2025-04-24 13:25:25
1564 跟貼 1564
無語！泡了幾年的中藥酒海龍海馬全部都是塑料

薪火視點 2025-04-25 07:53:00
587 跟貼 587
餐廳老板出餐時遇孩子亂跑，死死捏住火鍋躲讓：2個孩子沒事，自己被燙傷

星視頻 2025-04-24 20:55:07
706 跟貼 706
生豬：價格上漲飼料成本攀升 15.19元/公斤

和訊網 2025-04-24 17:10:08
625 跟貼 625
萵筍要長老吃不完了，媳婦全部砍回家曬干菜，留著以后燉肉吃

大慶在農村 2025-04-25 08:48:53
7 跟貼 7
丹頂鶴飛上馬路溜達引圍觀救助中心：是保護區的已救助

薪火視點 2025-04-25 08:35:56
151 跟貼 151
董明珠正在發動一場非國民運動，很危險

熊太行 2025-04-24 15:47:49
0 跟貼 0
一周退貨三架！國內航司已暫停接收波音飛機

紅星資本局 2025-04-24 15:05:06
662 跟貼 662
36家上市銀行分紅計劃出爐 "紅包"總額突破6000億元

紅星新聞 2025-04-24 17:42:20
455 跟貼 455
藍佛安出席2025年二十國集團財長和央行行長第二次會議，并舉行多場雙邊會見

界面新聞 2025-04-25 07:42:57
1 跟貼 1
快船“球迷墻”區域準備了馬面頭套，以此來干擾約基奇

雷速體育 2025-04-25 09:15:08
33 跟貼 33
法國選手不滿WTT獎金：報名費要350美元，八強獎金才370美元

懂球帝 2025-04-24 16:02:27
0 跟貼 0
男子端火鍋躲避亂跑的孩子，堅持不松手燙傷自己

觀威海 2025-04-25 10:35:17
0 跟貼 0
造謠者被處罰！傳播“轉基因大豆致癌”等假消息

種業寶典 2025-04-25 10:38:49
0 跟貼 0
“朱雀玄武敕令”到“周天紫薇大帝”，郴州23歲小伙頻頻改名引爭議，當事人回應

瀟湘晨報 2025-04-25 10:38:09
0 跟貼 0
猿輔導武漢公司一員工猝死，死者親屬：他原計劃5月2日舉行婚禮

華商網 2025-04-25 10:39:23
0 跟貼 0

李連杰和利智一張合照，證明歲月催人老，早已活成了普通人的樣子

李連杰和利智一張合照，證明歲月催人老，早已活成了普通人的樣子

史行途

2025-03-25 10:53:38

阿爾瓦雷斯：沒注意到打破了法爾考的紀錄，西甲要爭冠非常困難

阿爾瓦雷斯：沒注意到打破了法爾考的紀錄，西甲要爭冠非常困難

雷速體育

2025-04-25 07:29:54

中國增持235億美債,特朗普松了一口氣,美經濟學家：中國另有目的

中國增持235億美債,特朗普松了一口氣,美經濟學家：中國另有目的

寫了個錘錘

2025-04-24 20:53:13

掘金官方致敬巴頓退役：恭喜你擁有一個偉大的職業生涯

掘金官方致敬巴頓退役：恭喜你擁有一個偉大的職業生涯

雷速體育

2025-04-25 10:28:08

10人排隊9人托，央媒為民除害，怒揭大鍋鹵菜騙局，結局大快人心

10人排隊9人托，央媒為民除害，怒揭大鍋鹵菜騙局，結局大快人心

博學老K雜談

2025-04-11 18:35:03

研究發現：若晚餐經常吃太早，不超半年，胰腺或迎來6種不良變化

研究發現：若晚餐經常吃太早，不超半年，胰腺或迎來6種不良變化

朗威游戲說

2025-04-24 08:20:00

汪俊也沒想到，請了一堆流量大咖，被一個“過氣演員”高鑫搶風頭

汪俊也沒想到，請了一堆流量大咖，被一個“過氣演員”高鑫搶風頭

她時尚丫

2025-04-24 17:01:25

森林狼火箭收到壞消息，湖人勇士奪冠概率聯盟前五，肖華老謀深算

森林狼火箭收到壞消息，湖人勇士奪冠概率聯盟前五，肖華老謀深算

姜大叔侃球

2025-04-25 09:40:59

印控克什米爾恐襲細節曝光：26名游客死亡，遇難者全部系男性

印控克什米爾恐襲細節曝光：26名游客死亡，遇難者全部系男性

封面新聞

2025-04-24 19:14:03

僅播4集，評分9.8，終于有跟《漫長的季節》一較高下的懸疑劇了！

僅播4集，評分9.8，終于有跟《漫長的季節》一較高下的懸疑劇了！

頭號劇委會

2025-04-24 23:45:03

賴清德急了，害怕被“斬首行動”，讓臺各大部門想辦法，不簡單

賴清德急了，害怕被“斬首行動”，讓臺各大部門想辦法，不簡單

不凍港來了

2025-04-24 22:38:13

退伍老兵在家午休，政府人員找上門：別睡了，國防部長正到處找你

退伍老兵在家午休，政府人員找上門：別睡了，國防部長正到處找你

詩意世界

2025-04-24 23:35:02

謝霆鋒演唱會首日，不化妝換裝無嘉賓，奚夢瑤曬現場照表白偶像

謝霆鋒演唱會首日，不化妝換裝無嘉賓，奚夢瑤曬現場照表白偶像

可樂談情感

2025-04-25 02:38:42

中國就是不給特朗普臺階，李顯龍終于站出來，新加坡好日子到頭了

中國就是不給特朗普臺階，李顯龍終于站出來，新加坡好日子到頭了

娛樂督察中

2025-04-25 07:55:39

謝霆鋒香港演唱會現場：英皇全員出動十分壯觀，王嘉爾隔空合唱

謝霆鋒香港演唱會現場：英皇全員出動十分壯觀，王嘉爾隔空合唱

素素娛樂

2025-04-24 22:13:25

董明珠為什么今年敢說“不用海歸”

董明珠為什么今年敢說“不用海歸”

深度財線

2025-04-24 16:31:40

閑魚變“黃魚”，表面賣女生自用自行車，實則做著見不得人的交易

閑魚變“黃魚”，表面賣女生自用自行車，實則做著見不得人的交易

西齋青簡

2024-05-07 11:55:02

缺鉀比缺鈣危險？5個信號證明你缺鉀了，建議吃這4種食物來緩解

缺鉀比缺鈣危險？5個信號證明你缺鉀了，建議吃這4種食物來緩解

奇妙的本草

2025-04-23 17:54:00

一天接3大噩耗，特朗普不吭聲，美財長警告中國：這可不是鬧著玩

一天接3大噩耗，特朗普不吭聲，美財長警告中國：這可不是鬧著玩

紅色鑒史官

2025-04-24 18:55:03

NBA資深記者：東契奇加盟湖人，讓詹姆斯的生涯又能延長幾年了

NBA資深記者：東契奇加盟湖人，讓詹姆斯的生涯又能延長幾年了

仰臥撐FTUer

2025-04-25 10:23:05

全球最新、最酷AI解決方案

996文章數 717關注度

往期回顧全部

財經要聞

王興注定“永無寧日”

頭條要聞

媒體：日本又打了個樣妥協讓步沒換來美國的高抬貴手

頭條要聞

媒體：日本又打了個樣妥協讓步沒換來美國的高抬貴手

體育要聞

名記:梅西將續約2年近10%股權比肩小貝

娛樂要聞

S家再被打臉！葛斯齊爆料一針見血

科技要聞

這屆上海車展，沒人靠流量活著

汽車要聞

純電CLA L及Vision V概念車奔馳這次玩大了

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

時尚

親子

藝術

軍事航空

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

穿了十年仍然心動的裙子，它算一條

親子要聞

盤點2025北京市十大助孕公司,北京成功率比較高的助孕公司！

藝術要聞

故宮珍藏的墨跡《十七帖》，比拓本更精良，這才是地道的魏晉寫法

軍事要聞

紹伊古：不排除俄羅斯恢復核試驗的可能

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：泸州市| 松溪县| 连江县| 景洪市| 漳州市| 呼图壁县| 伊吾县| 晋州市| 宁化县| 沙坪坝区| 巨鹿县| 邢台县| 依安县| 扎鲁特旗| 镶黄旗| 宁晋县| 丹棱县| 武冈市| 六枝特区| 龙川县| 安吉县| 洮南市| 满洲里市| 汉中市| 淅川县| 二连浩特市| 江陵县| 抚顺县| 昭平县| 临泉县| 苏尼特左旗| 武鸣县| 泰兴市| 台中县| 濮阳市| 邯郸市| 仪陇县| 杭锦旗| 梓潼县| 屯留县| 泸定县|

<blockquote id="8y1vw"></blockquote>

<sub id="8y1vw"><p id="8y1vw"></p></sub>