人工智能技術的爆發式增長引發算力需求激增,數據中心能源消耗壓力驟增。作為能耗占比近50%的核心設備,服務器節能技術成為破局關鍵。元腦服務器第八代平臺通過五大創新維度——革命性液冷方案、高效能元件配置、智能風道優化、模塊化供電架構、精準溫控策略,實現整機性能跨越式升級,散熱效率飆升85%,綜合能耗直降13%,為數據中心打造PUE極致標桿,構筑綠色算力新范式。
全棧產品“All in液冷”,實現節點級、機柜級、數據中心級三維解決方案
實現綠色降碳、降低PUE的關鍵路徑在于液冷技術的落地。元腦服務器第八代平臺延續 “All in 液冷” 戰略,憑借全棧液冷能力,為數據中心提供全方位的液冷整體解決方案。
■在服務器節點方面,創新性導入Closed-loop內循環散熱器,無需CDU即可在傳統風冷機柜內部署液冷設備。相比較傳統冷板散熱器依賴冷板被動傳導熱量,Closed-loop內循環散熱器通過集成熱源、液體/冷媒循環管路、熱交換器、回流系統等形成完整的封閉散熱回路,采用主動式泵驅循環,冷媒熱傳導效率顯著高于金屬被動導熱,尤其適用于高功率密度設備。其全封閉設計大幅降低液體泄漏風險,能適應更復雜的工作環境。同時,Closed-loop內循環散熱器精巧的體積設計減少對主板區域的占用,模塊化架構支持靈活擴展,可通過增加散熱器面積、升級泵/介質的流量提升散熱能力,靈活適應更高熱負載。這一創新設計在保持傳統風冷機柜兼容性的同時,實現了散熱效率的顯著提升。
Closed-loop液冷散熱器工作原理
■ 針對機柜級液冷,全新一代元腦液冷整機柜服務器ORS6000G8基于OCP開放標準設計,可同時兼容19/21英寸節點,面向未來架構演進,實現全平臺多元算力兼容。ORS6000G8支持供電、供液雙盲插,極大簡化安裝與運維流程,還可根據客戶數據中心實際條件,提供一體化或組合交付方案,滿足不同場景需求。
19英寸節點(左) 21英寸節點(右)
■面向數據中心液冷,元腦服務器第八代平臺可搭配智能CDU(冷量分配單元)控制系統,實現冷量和電量的實時按需分配,有效降低CDU的耗電量,助力液冷數據中心實現PUE無限接近1。同時,借助AI技術,該方案能對能耗展開實時監測,通過實時采集服務器運行時的電能消耗數據,結合數據中心內的溫度、濕度、氣流等多方面因素,進行綜合分析與動態優化,結合碳足跡管理技術,可節省約15%~20%的能耗。
此外,該方案支持模塊化數據中心和預制化數據中心架構,可高效搭載液冷散熱系統。通過冷源預制化、管路標準化及三重防漏機制,實現液冷系統的快速部署與安全可靠運行。在滿足快速交付、高密部署和彈性擴容需求的同時,助力數據中心提升能效、降低碳排放。
高效鈦金電源提升電力轉化效率,5年節省千萬運維成本
算力的盡頭是電力,元腦服務器第八代平臺還創新性地導入了自研氮化鎵(GaN)鈦金電源,相比市面傳統碳化硅(SiC)的鈦金電源,具備更高的功率密度、耐溫性、耐壓性和可靠性,電源峰值轉換效率可達98%以上,并已率先通過80PLUS認證。
氮化鎵(GaN)鈦金電源
據測算,在一個1萬臺服務器規模的數據中心場景中,模擬客戶側處于30%~50%的典型業務負載狀況下,針對單臺功耗為2kW的服務器,若采用鈦金電源替換鉑金電源,五年運維期內可節省約1000萬元成本,為客戶創造極為可觀的經濟價值。同時,鈦金電源還導入了更精準的故障診斷系統,通過新增計時系統以及BMC時間同步策略,確保電源內部時間與系統時間一致。此外,該電源還可對自身溫度、電流等信息實時監控,實現提前預警和精準定位故障,為系統穩定運行提供有力保障。
優化風冷散熱風道及風扇,散熱效率提升85%
隨著芯片功耗升高,整機散熱面臨更嚴苛的挑戰。為滿足傳統風冷數據中心客戶的需求,元腦服務器第八代平臺對散熱風道及風扇系統進行了全面升級。例如,針對關鍵核心部件、高功耗零件設計獨立風道,配合單風扇的散熱調控,通過系統導流結構設計,聚集風流,減少部件熱量累積,達到最高效利用系統風流的目的。
同時,還創新性驗證和導入了PCIe標卡風扇部件,配置于OCP上方slot槽位,出風口位置正對OCP光模塊,有效解決OCP光模塊等熱敏部件的關鍵散熱問題,通過不斷改良風扇充磁方式、改進扇葉曲面設計,經過上百次形狀修正和實際驗證,最終選定高效能渦流風扇,大幅節省整機系統風扇功耗。
PCIe標卡風扇部件
如下圖所示,比對200G OCP網卡的散熱情況,整機系統在idle、70%load和100%load分別節能40.5W、116.5W、200.5W,最多可降低85%系統風扇功耗。
整機系統不同業務負載下節能效果對比
全面解耦與按需供電架構創新,供電效率提升3%
元腦服務器第八代平臺采用風扇板、管理板與主板完全解耦的全新架構,一方面,極大降低了因風扇板及管理板故障導致計算主板更換的概率,減小業務異常中斷風險;另一方面,相較于上一代產品,在相同空間布局下,與上一代產品相比,在相同空間布局上可以設計部署更高散熱效率、更大散熱面積的異形散熱器,以支持性能不斷升高、功耗也不斷攀升的處理器平臺,優化整機散熱效率。
在供電設計上,元腦服務器第八代平臺首創按需供電架構,將3V3/5V供電接口從主板遷移至riser或者背板,實現主板和riser、背板的供電解耦,最大程度減少了線纜中的電能損耗。主板上POL電流從30A降至10A級別,極大簡化供電設計,在CPU滿載時可提升3%供電效率,能夠依據客戶存儲及擴展需求,精準按需進行電能供給,實現整機系統降本增效的雙重目標。
新舊方案對比
精細化散熱策略全面升級,整機功耗降低13%
元腦服務器第八代平臺在全局部件溫度監控策略上實現了全面優化,實現在性能翻倍的同時,整機功耗降低13%。針對普通網卡、NVME、M.2、智能網卡、GPU 等關鍵部件,增設了更多溫度監控傳感器,能夠依據部件 ID 進行精準的信息識別和差異化風扇控制。
針對本身不支持溫度讀取的部件,根據部件的風量需求特點,區分為高、中、低風險三個等級,區分調用不同的風扇控制策略,保證部件正常運行、性能穩定的同時,大幅度降低風險部件配置運行時的功耗;根據服務器不同狀態下部件的發熱特點,細化出部件在不同運行狀態下的監控需求,保證對核心部件在待機、開機過程、開機完成等狀態進行全面監控。
精細化散熱策略
在分區調控策略方面,平臺將原本的分區調控進一步細化為單風扇級的精細化調控。系統分區從 2 區精細擴展至 6 區或 8 區,通過更細致的區域劃分,能夠精準控制單風扇轉速,有效避免所有風扇同時提速的情況。單個風扇根據不同區域需求設置不同轉速,使系統散熱更加貼合實際情況。此外,散熱策略還完善了部件識別機制,通過判定部件位置與類型,設置差異化風扇控制參數及溫度閾值。通過這種更為精準的風扇調控策略,整體可降低 13% 的系統功耗。
元腦服務器第八代平臺構建全生命周期節能體系,從研發設計到生產交付形成綠色閉環。通過碳足跡追蹤技術和模塊化架構設計,實現產品全鏈條節能減排。未來將持續深耕綠色計算領域,以創新散熱解決方案與智能供電系統雙輪驅動,賦能千行百業搭建低碳算力基礎設施,推動數字經濟可持續發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.