99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從“萬卡集群”到“十萬卡集群”,需要怎么的高速互連技術(shù)?

0
分享至

隨著生成式人工智能功能的日益強(qiáng)大,使得模型訓(xùn)練需求呈現(xiàn)爆發(fā)式增長。在這一背景下,任何單一的圖形處理器(GPU)、異構(gòu)處理器(XPU)或其他人工智能加速器,都已難以滿足人工智能工作負(fù)載的龐大計算需求。

這種需求的激增,有力地推動了人工智能基礎(chǔ)設(shè)施建設(shè)的持續(xù)擴(kuò)張。大模型的Scaling Law(尺度定律)在未來一段時間內(nèi)將保持其有效性。所謂Scaling Law,指的是數(shù)據(jù)量和參數(shù)規(guī)模增加,模型的性能也隨之提升。可以預(yù)見,在不久的將來,成千上萬,甚至數(shù)十萬個人工智能加速器必須協(xié)同工作,并且它們的集群規(guī)模會隨著訓(xùn)練參數(shù)的持續(xù)增加而不斷擴(kuò)大。

全球AI集群建設(shè)持續(xù)擴(kuò)展:從“萬卡集群”到“十萬卡集群”

當(dāng)前,“萬卡集群”被業(yè)界視為這一輪大模型競賽的“入場券”,而如今,“十萬卡集群”正成為科技巨頭們競逐的新高地。

早在去年7月,馬斯克便宣布旗下初創(chuàng)人工智能公司xAI在美國孟菲斯建立了一個超級集群,號稱是“全球最強(qiáng)大的AI訓(xùn)練集群”。該集群由100,000個英偉達(dá)的液冷H100 GPU組成,并在單個RDMA結(jié)構(gòu)(即遠(yuǎn)程直接數(shù)據(jù)存取結(jié)構(gòu))上運(yùn)行。

緊接著,去年9月份的百度云智大會上,百度宣布對作為算力基礎(chǔ)設(shè)施的百舸AI異構(gòu)計算平臺進(jìn)行升級,新升級的百舸4.0也具備成熟的十萬卡集群部署和管理能力。同一時期,阿里云在云棲大會上宣布其單網(wǎng)絡(luò)集群已擴(kuò)展至十萬卡級別。騰訊則基于自研的高性能網(wǎng)絡(luò)星脈,以及新一代算力集群HCC,同樣能夠支持10萬卡GPU的超大計算規(guī)模。

人工智能基礎(chǔ)設(shè)施的Scale Up和Scale Out擴(kuò)展

AI算力集群通常由AI服務(wù)器、高速交換機(jī)構(gòu)成。AI加速器是AI算力的最小單元,一臺服務(wù)器通常會包含多個加速器。為便于管理,多臺服務(wù)器組成一個機(jī)柜,并通過架頂交換機(jī)實現(xiàn)互連。

如前文所述,單芯片的算力和內(nèi)存存在局限性,無法承載大模型的計算任務(wù)。因此,通過多種互連技術(shù)將多顆算力芯片互連在一起,以提供大規(guī)模的算力和內(nèi)存,已成為目前人工智能集群建設(shè)的主要方法。GPU的互連主要分為業(yè)務(wù)互連、Scale Up網(wǎng)絡(luò)互連和Scale Out互連,它們各自承擔(dān)著不同的業(yè)務(wù)流。


圖1:AI算力三種網(wǎng)絡(luò)。

(圖源:網(wǎng)絡(luò))

業(yè)務(wù)網(wǎng)絡(luò)互連承載著諸如需要計算的輸入數(shù)據(jù)、輸出結(jié)果,以及在各類存儲系統(tǒng)中的模型參數(shù)、checkpoint等。由于其需要進(jìn)行極大范圍的互連,并且要與云上的存儲、業(yè)務(wù)接口等互通,所以多采用以太網(wǎng)技術(shù),通常支持各類RDMA。

Scale Up網(wǎng)絡(luò)互連通過將不同GPU互連,在節(jié)點(diǎn)內(nèi)部進(jìn)行擴(kuò)展,即所謂的縱向擴(kuò)展;而Scale Out網(wǎng)絡(luò)互連則通常是將集群橫向擴(kuò)展到更多的GPU機(jī)柜,從而使AI集群的規(guī)模進(jìn)一步擴(kuò)大,即所謂的橫向擴(kuò)展。

新互連標(biāo)準(zhǔn)助力AI基礎(chǔ)設(shè)施無縫擴(kuò)展

目前,以谷歌、博通、亞馬遜、AMD、微軟、Meta、Marvell等為首的北美科技巨頭企業(yè),為了取得AI競爭優(yōu)勢,正紛紛自研AI芯片,并建立新的高速互連標(biāo)準(zhǔn)。

以AMD、博通為代表的AI芯片廠商正逐漸搶占更多市場份額。AMD提供GPU芯片,博通則主要憑借其ASIC定制化芯片服務(wù)能力。此外,OpenAI、微軟等科技巨頭也紛紛投身自研AI芯片領(lǐng)域。

在高速互連領(lǐng)域,對于Scale Up網(wǎng)絡(luò)互連,2024年10月,由AMD、亞馬遜AWS、Astera Labs、思科、谷歌、慧與(HPE)、英特爾、Meta和微軟9家企業(yè)發(fā)起的Ultra Accelerator Link Consortium(UALink聯(lián)盟)正式成立。該聯(lián)盟旨在為AI Pod和集群中加速器與交換機(jī)之間的縱向擴(kuò)展通信定義一種高速、低延遲的互聯(lián)規(guī)范。

對于Scale Out網(wǎng)絡(luò)互連。超以太網(wǎng)聯(lián)盟(Ultra Ethernet,UEC)未來有望成為AI網(wǎng)絡(luò)的主流方案。超以太網(wǎng)聯(lián)盟由AMD、Arista、博通、思科等硬件廠商以及微軟、新思科技和Meta等云廠商牽頭成立,借助以太網(wǎng)的生態(tài)優(yōu)勢,致力于打造滿足AI和HPC網(wǎng)絡(luò)需求的新一代標(biāo)準(zhǔn)。

UALink技術(shù)和超以太網(wǎng)技術(shù)特點(diǎn)

UALink技術(shù)

UALink作為一種Scale Up架構(gòu),能夠在數(shù)十到數(shù)百個專用人工智能加速器之間建立基于標(biāo)準(zhǔn)的、具有極高帶寬連接的網(wǎng)絡(luò)。它將網(wǎng)絡(luò)從臨時的網(wǎng)絡(luò)配置轉(zhuǎn)變?yōu)楦訕?biāo)準(zhǔn)化的網(wǎng)絡(luò),從而能夠構(gòu)建具備更高基數(shù)系統(tǒng)的網(wǎng)絡(luò),并配備專用的超高速加速器鏈路交換機(jī)。


圖2:UALink工作原理圖。

(圖源:HiPChips at MICRO-2024)

UALink構(gòu)建了一個高速、低延遲的網(wǎng)絡(luò),該網(wǎng)絡(luò)可連接一個計算節(jié)點(diǎn)內(nèi)的多個加速器(如GPU)。這使得每個加速器都能夠直接訪問其他加速器的內(nèi)存,從而讓整個計算節(jié)點(diǎn)的功能就如同一塊單一的、大型的GPU。從軟件層面來看,這些相互連接的GPU組就像是一個單一的、大型的GPU塊。


圖3:UALink構(gòu)建Scale Up網(wǎng)絡(luò)。

(圖源:nextplatform官網(wǎng))

UALink具有以下技術(shù)特點(diǎn):

  • 高帶寬:UALink每條通道的帶寬高達(dá)200Gbps,可實現(xiàn)加速器之間的高效數(shù)據(jù)傳輸。

  • 輕量級協(xié)議:該協(xié)議設(shè)計為輕量級,可減少開銷并確保高效通信。

  • 高效性:亞微秒級的延遲提升了推理性能,并且能夠在不分割工作負(fù)載的情況下實現(xiàn)對八個以上GPU的擴(kuò)展。

  • 開放標(biāo)準(zhǔn):UALink是一項開放的行業(yè)標(biāo)準(zhǔn),有助于促進(jìn)互操作性并減少對單一供應(yīng)商的依賴。

  • 內(nèi)存共享:其具備特定的內(nèi)存共享功能,使加速器能夠高效訪問共享內(nèi)存資源。支持在數(shù)百個GPU之間進(jìn)行加載、存儲和原子操作,最大限度地減少端到端延遲并降低功耗。

  • 同步特性:UALink包含同步特性,以確保多個加速器之間的一致性和高效運(yùn)行。、

  • 與UEC互補(bǔ):能與UEC良好協(xié)作,以實現(xiàn)更廣泛的可擴(kuò)展性。

超以太網(wǎng)技術(shù)

超以太網(wǎng)系統(tǒng)由包含節(jié)點(diǎn)和架構(gòu)基礎(chǔ)設(shè)施的集群組成。節(jié)點(diǎn)通過架構(gòu)接口(網(wǎng)卡)連接到網(wǎng)絡(luò),這些架構(gòu)接口可以承載多個邏輯架構(gòu)端點(diǎn)(FEP)。網(wǎng)絡(luò)被劃分為多個平面,每個平面都包含通常通過交換機(jī)相互連接的架構(gòu)端點(diǎn)。


圖4:超以太網(wǎng)集群圖。

(圖源:新思科技)

這些集群可以在兩種主要模式下工作,以處理不同的任務(wù)。

  • 并行作業(yè)模式:系統(tǒng)運(yùn)行任務(wù)直至完成,并允許多個節(jié)點(diǎn)同時進(jìn)行通信。這對于需要大量并行處理的高性能計算任務(wù)來說非常理想。

  • 客戶端/服務(wù)器模式:該系統(tǒng)是為存儲任務(wù)而設(shè)置的。在這種模式下,服務(wù)器持續(xù)處理來自多個客戶端的請求,通信發(fā)生在特定的節(jié)點(diǎn)之間。這種模式非常適用于對于可靠且一致的數(shù)據(jù)訪問和管理。

超以太網(wǎng)技術(shù)具有以下技術(shù)特點(diǎn):

  • 物理層:與IEEE 802.3標(biāo)準(zhǔn)以太網(wǎng)兼容,可基于前向糾錯(FEC)碼字進(jìn)行可選的性能監(jiān)測。諸如不可糾正碼字率(UCR)和平均分組錯誤間隔時間(MTBPE)等指標(biāo),可深入了解傳輸性能和可靠性。

  • 數(shù)據(jù)鏈路層:引入鏈路級重傳(LLR)協(xié)議,實現(xiàn)無損傳輸,且不依賴于優(yōu)先級流量控制(PFC)。這確保了更快的錯誤恢復(fù),消除了不必要的端到端重傳,并減少了尾部延遲。

  • 分組速率提升(PRI):壓縮以太網(wǎng)和IP報頭以提高分組速率,解決因舊有功能和冗余協(xié)議字段導(dǎo)致的效率低下問題。

  • 鏈路協(xié)商協(xié)議:通過協(xié)商功能擴(kuò)展了鏈路層發(fā)現(xiàn)協(xié)議(LLDP),以檢測并啟用鏈路級重傳(LLR)和分組速率提升(PRI)等受支持的功能。

  • 傳輸層:旨在解決傳統(tǒng)遠(yuǎn)程直接內(nèi)存訪問(RDMA)網(wǎng)絡(luò)的局限性,具備選擇性重傳、亂序交付、分組噴射以及先進(jìn)的擁塞控制機(jī)制等特點(diǎn)。它支持多種傳輸模式,包括可靠有序交付(ROD)、可靠無序交付(RUD)和不可靠無序交付(UUD)。

  • 擁塞控制:實現(xiàn)諸如內(nèi)聚流管理、加速速率調(diào)整、基于遙測的控制以及通過分組噴射進(jìn)行自適應(yīng)路由等功能,以最大限度地減少尾部延遲并提升網(wǎng)絡(luò)性能。

  • 安全性:在傳輸層融入基于作業(yè)的安全性,利用互聯(lián)網(wǎng)安全協(xié)議(IPSec)和數(shù)據(jù)包保護(hù)協(xié)議(PSP)功能,最大限度地減少加密開銷并支持硬件卸載。

新思科技業(yè)界首款超以太網(wǎng)和UALink IP解決方案

隨著超大規(guī)模數(shù)據(jù)中心基礎(chǔ)設(shè)施的加速發(fā)展,必須擴(kuò)展到數(shù)十萬個具有高效快速連接的加速器,才能夠支持處理大型語言模型中的數(shù)萬億個參數(shù)。在這樣的背景下,新思科技推出的業(yè)界首款超以太網(wǎng)IP和UALink IP解決方案猶如一場及時雨,滿足業(yè)界對高帶寬、低延遲互連技術(shù)的迫切需求。

新思科技的UALink IP解決方案的領(lǐng)先性能:

  • 垂直擴(kuò)展計算結(jié)構(gòu)的IP解決方案:新思科技UALink IP解決方案由PHY、控制器和驗證IP組成,助力開發(fā)者加快開發(fā),可支持多達(dá)1024個AI加速器的系統(tǒng)的上市時間;

  • 高效、高速的數(shù)據(jù)傳輸:低功耗、高帶寬的新思科技UALink PHY IP專為數(shù)據(jù)密集型AI工作負(fù)載而設(shè)計,每通道可提供200Gbps的傳輸速度;

  • 具有內(nèi)存共享功能的延遲優(yōu)化:新思科技UALink控制器IP通過從加速器到加速器的共享內(nèi)存訪問,幫助緩解AI硬件基礎(chǔ)設(shè)施的關(guān)鍵瓶頸;

  • 內(nèi)置協(xié)議檢查:新思科技UALink驗證IP與新思科技硬件加速驗證解決方案相結(jié)合,為AI硬件提供快速可靠的驗證。

值得一提的是,2025年1月,新思科技、蘋果和阿里巴巴還加入了UALink聯(lián)盟董事會,共同推進(jìn)下一代AI集群互連技術(shù)的發(fā)展。

而新思科技超以太網(wǎng)IP解決方案則具有以下領(lǐng)先性能:

  • 可擴(kuò)展后端網(wǎng)絡(luò)的IP解決方案:新思科技超以太網(wǎng)IP解決方案由PHY、MAC和PCS控制器以及驗證IP組成,為開發(fā)者開發(fā)可在單個網(wǎng)絡(luò)中支持多達(dá)一百萬個端點(diǎn)的系統(tǒng)提供了一條低風(fēng)險途徑;

  • 全球領(lǐng)先的224G以太網(wǎng)PHY IP:經(jīng)過硅驗證的新思科技224G以太網(wǎng)PHY IP支持超以太網(wǎng)協(xié)議,并已在ECOC、OFC和DesignCon等多個行業(yè)展覽上展示其廣泛的互操作性;

  • 獲得專利的糾錯實現(xiàn):新思科技超以太網(wǎng)MAC和PCS控制器IP提供高達(dá)1.6 Tbps的帶寬和超低延遲,可實現(xiàn)AI工作負(fù)載所需的實時處理;

  • 無縫集成:MAC和PCS IP支持與超以太網(wǎng)堆棧更高層的接口,為交換機(jī)、AI加速器和智能NIC提供完整的芯片實現(xiàn);

  • 加速驗證和確認(rèn):新思科技超以太網(wǎng)驗證IP有助于確保協(xié)議符合快速發(fā)展的行業(yè)標(biāo)準(zhǔn),從而更快、更高效地驗證AI和HPC系統(tǒng)。

隨著AI產(chǎn)業(yè)的迅猛發(fā)展,AI算力、運(yùn)力需求大幅提升,這對于網(wǎng)絡(luò)互連技術(shù)也提出了全新的要求。人工智能集群網(wǎng)絡(luò)需要從Scale Up和Scale Out兩方面進(jìn)行擴(kuò)展,以建立基于標(biāo)準(zhǔn)的、具有高帶寬和低延遲的連接網(wǎng)絡(luò)。

新思科技最新的UALink和超以太網(wǎng)IP解決方案,再結(jié)合其PCIe 7.0、1.6T以太網(wǎng)、CXL、高帶寬存儲(HBM),以及通用芯片互連(UCIe)等互聯(lián)IP產(chǎn)品,將進(jìn)一步推動人工智能和高性能計算在性能、可擴(kuò)展性、效率以及互操作性方面達(dá)到新的高度,為AI產(chǎn)業(yè)的持續(xù)繁榮注入強(qiáng)大動力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中紀(jì)委:禁止機(jī)關(guān)事業(yè)單位職工干這6種副業(yè)

中紀(jì)委:禁止機(jī)關(guān)事業(yè)單位職工干這6種副業(yè)

鄉(xiāng)知鄉(xiāng)見
2025-03-24 17:28:08
我賣掉頂樓,換成一樓后才發(fā)現(xiàn):差別不僅僅是房價!

我賣掉頂樓,換成一樓后才發(fā)現(xiàn):差別不僅僅是房價!

裝修秀
2025-04-26 10:55:03
巴薩官方悼念比拉諾瓦逝世十周年,曾率隊12-13賽季100分問鼎西甲

巴薩官方悼念比拉諾瓦逝世十周年,曾率隊12-13賽季100分問鼎西甲

直播吧
2025-04-26 00:26:09
馬拉松比賽亂象叢生,參賽應(yīng)該納入征信

馬拉松比賽亂象叢生,參賽應(yīng)該納入征信

跑者排球視角
2025-04-26 09:43:42
中國股壇第一人坦言:炒股小資金做大的唯一方式,建議散戶深讀!

中國股壇第一人坦言:炒股小資金做大的唯一方式,建議散戶深讀!

股經(jīng)縱橫談
2025-04-15 23:48:46
于正回應(yīng)多名藝人退圈:優(yōu)勝劣汰,這是一個好事情

于正回應(yīng)多名藝人退圈:優(yōu)勝劣汰,這是一個好事情

魯中晨報
2025-04-25 17:04:08
領(lǐng)導(dǎo)說“幫我按電梯”,你說“您下幾層”暴露低情商,高人這樣做

領(lǐng)導(dǎo)說“幫我按電梯”,你說“您下幾層”暴露低情商,高人這樣做

職場火鍋
2025-04-24 06:55:03
美軍現(xiàn)狀:幾乎所有武器項目都研發(fā)失敗,就是總統(tǒng)想打軍隊也不敢

美軍現(xiàn)狀:幾乎所有武器項目都研發(fā)失敗,就是總統(tǒng)想打軍隊也不敢

凱撒談兵
2025-04-20 21:21:12
憤怒至極!中國學(xué)生遭外籍生群毆滿臉是血,網(wǎng)友:學(xué)學(xué)哈工大!

憤怒至極!中國學(xué)生遭外籍生群毆滿臉是血,網(wǎng)友:學(xué)學(xué)哈工大!

侃故事的阿慶
2025-04-26 07:50:36
斯諾克大冷門!11冠王被轟7連鞭,暫2-10,老馬追平,瓦菲被罰8分

斯諾克大冷門!11冠王被轟7連鞭,暫2-10,老馬追平,瓦菲被罰8分

劉姚堯的文字城堡
2025-04-25 19:01:53
今天真的拉!小凱文-波特5中0 僅靠罰球得到1分外加4板6助

今天真的拉!小凱文-波特5中0 僅靠罰球得到1分外加4板6助

直播吧
2025-04-26 10:34:16
湖南4歹徒綁架女富豪,將其監(jiān)禁并強(qiáng)奸,3天后歹徒卻被她嚇到報警

湖南4歹徒綁架女富豪,將其監(jiān)禁并強(qiáng)奸,3天后歹徒卻被她嚇到報警

罪案洞察者
2025-04-08 10:03:59
謝霆鋒演唱會半個港圈來助陣!再唱與王菲定情曲,后爸坐后面沮喪

謝霆鋒演唱會半個港圈來助陣!再唱與王菲定情曲,后爸坐后面沮喪

烏娛子醬
2025-04-25 14:36:53
商務(wù)部:今年消費(fèi)品以舊換新將加力擴(kuò)圍

商務(wù)部:今年消費(fèi)品以舊換新將加力擴(kuò)圍

澎湃新聞
2025-04-25 17:34:14
胡琳娜:是丁嘉麗的女兒,在沒有愛的環(huán)境里帶淚成長37歲仍未婚

胡琳娜:是丁嘉麗的女兒,在沒有愛的環(huán)境里帶淚成長37歲仍未婚

品茗賞娛
2025-04-25 19:50:07
手機(jī)望遠(yuǎn)鏡功能怎么打開?90%人不知道,原來還能看這么遠(yuǎn)!

手機(jī)望遠(yuǎn)鏡功能怎么打開?90%人不知道,原來還能看這么遠(yuǎn)!

CG說科技
2025-04-16 16:00:31
DeepSeek評出國內(nèi)最值得去的十大景點(diǎn),九寨溝第3,三峽無緣上榜

DeepSeek評出國內(nèi)最值得去的十大景點(diǎn),九寨溝第3,三峽無緣上榜

古今小史
2025-04-08 09:34:12
美國工業(yè)生產(chǎn)大幅度下降  1975年1月19日《人民日報》

美國工業(yè)生產(chǎn)大幅度下降 1975年1月19日《人民日報》

那些看得見的老照片
2025-04-24 16:32:48
俄方給中國提了醒:要想拿下臺島,必須摧毀美軍西太平洋基地

俄方給中國提了醒:要想拿下臺島,必須摧毀美軍西太平洋基地

林子說事
2025-04-25 18:02:24
A股:不用猜了!大資金明牌了,下周,大盤指數(shù)繼續(xù)反彈

A股:不用猜了!大資金明牌了,下周,大盤指數(shù)繼續(xù)反彈

郭小凡財經(jīng)
2025-04-26 08:25:04
2025-04-26 15:28:49
TechSugar incentive-icons
TechSugar
做你身邊值得信賴的科技新媒體
4674文章數(shù) 12698關(guān)注度
往期回顧 全部

科技要聞

李斌:對蔚來公司四季度盈利非常有信心

頭條要聞

巴基斯坦防長:我們曾給西方"干臟活" 為此付出了代價

頭條要聞

巴基斯坦防長:我們曾給西方"干臟活" 為此付出了代價

體育要聞

去更大的舞臺追夢 專訪中國男籃國手楊瀚森

娛樂要聞

金掃帚獎出爐,包貝爾意外獲“影帝”

財經(jīng)要聞

韓國的"宇樹科技" 是怎樣被財閥毀掉的?

汽車要聞

充電5分鐘續(xù)航100公里 探訪華為兆瓦超充站

態(tài)度原創(chuàng)

旅游
房產(chǎn)
健康
藝術(shù)
教育

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

房產(chǎn)要聞

逆勢大幅漲價!最高2.8萬/平!長天雲(yún)汀開盤又賣爆了!

唇皰疹和口腔潰瘍是"同伙"嗎?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

網(wǎng)民反映孩子“在華海中學(xué)遭霸凌”,海口市教育局回應(yīng)正核查

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 沾化县| 河源市| 正阳县| 景谷| 东海县| 江安县| 承德市| 德清县| 姚安县| 乌拉特前旗| 柯坪县| 同德县| 麻阳| 平潭县| 丰城市| 永泰县| 佛学| 清丰县| 顺昌县| 洮南市| 扎鲁特旗| 白城市| 伊宁市| 吐鲁番市| 龙泉市| 房山区| 栾川县| 陈巴尔虎旗| 天水市| 个旧市| 马山县| 乌拉特中旗| 波密县| 九江县| 印江| 那坡县| 长宁区| 维西| 政和县| 上思县| 永德县|