根據Synergy Research Group的報告顯示,截至2024年底,超大規模運營商運營的數據中心數量達到1136個,較2019年第四季度的不到600個大幅增加,意味著全球超大規模數據中心數量在過去五年中幾乎翻了一番。
此外,未來幾年規劃中的數據中心項目數量自2022年3月以來增長了60%,從314個增加到2025年3月的504個。這些設施不再是過去單棟10兆瓦(MW)的數據中心,而是占地數百英畝、包含多棟建筑的100兆瓦以上大型園區。
今年年初,日本軟銀集團、OpenAI和甲骨文三家企業宣布將投資5000億美元,打造“星際之門”項目,用于在美國建設支持AI發展的基礎設施。
但與此同時,市場也有不同意見?!按笮涂萍脊?、投資基金和其他機構正紛紛從美國到亞洲各地倉促建設服務器基地,這種投資顯得盲目,很多服務器基地在建設時并未明確考慮客戶需求?!?月25日,據港媒報道,在2025年匯豐全球投資峰會上,阿里巴巴集團董事長蔡崇信指出,目前全球數據中心建設速度超出人工智能(AI)的初始需求,警告可能出現泡沫風險。
另外,微軟取消的歐美數據中心項目總發電能力約2千兆瓦,這可能預示著"數據中心供應已超出當前需求預期"。
不過無論如何,大規模數據中心為支撐高強度的 AI 運算,其能源消耗在近年來呈幾何倍數增長,這已經成為了不爭的事實,部分超大型數據中心的年度耗電量甚至堪比一座小型城市。這不僅導致運營成本大幅增加,還對全球能源供應與可持續發展構成嚴峻挑戰。
電源管理作為優化芯片功耗、提升能源利用效率的核心技術,以及功率密度提升所代表的芯片性能與空間利用的高效化追求,已然成為當下 AI 芯片領域的研究焦點與競爭高地。芯片公司也正在努力提升功率密度,應對未來 AI 產業發展需求。
以下節選了幾家芯片公司發表的針對AI服務器的白皮書和最新見解,無論哪家公司都認為,未來硅不會消失,同時寬禁帶半導體的需求將會越來越多。
安森美:SiC MOSFET 如何提高 AI 數據中心的電源轉換能效
安森美產品線經理 Wonhwa Lee表示,散熱是數據中心面臨的一個重大挑戰。據估計,當今大多數數據中心散熱系統的電力消耗占比超過 40%。實際上,對于電源效率,浪費的能源主要以熱量形式散失,而這些熱能又需要通過數據中心的空調系統排放出去。因此,電源轉換效率越高,產生的熱量就越少,相應地,在散熱方面的電費支出也就越低。
數據中心內功率密度加速上升,大約十年前,每個機架的平均功率密度約為 4 至 5 kW,但當今的超大規模云計算公司(例如亞馬遜、微軟或 Facebook)通常要求每個機架的功率密度達到 20 至 30 kW。一些專業系統的要求甚至更高,要求每個機架的功率密度達到 100kW 以上。因電源存放及散熱空間有限,高功率密度要求電源設計緊湊且高能效,同時電源還需滿足數據中心行業特定需求,如 AI 數據中心 PSU 需符合嚴格的 Open Rack V3(ORV3)基本規范。近期新型 AC - DC PSU 標稱輸入范圍 200 至 277VAC,輸出 50VDC,ORV3 標準要求在 30% 至 100% 負載條件下峰值效率超 97.5%,10% 至 30% 負載條件下最低效率達 94%。
功率因數校正 (PFC) 級是 PSU 中 AC-DC 轉換的關鍵組成部分,對于實現高能效非常重要。PFC 級負責整形輸入電流,以盡可能放大有用功率與總輸入功率之比。為滿足 IEC 61000-3-2 等法規中的電磁兼容性 (EMC) 標準,并確保符合 ENERGY STAR? 等能效規范,PFC 設計也是關鍵所在。
對于數據中心等許多應用,最好選用“圖騰柱”PFC 拓撲來設計 PFC 級。該拓撲通常用于數據中心 3 kW 至 8 kW 系統電源中的 PFC 功能塊(下圖)。圖騰柱 PFC 級基于 MOSFET,通過移除體積大且損耗高的橋式整流器,提高了交流電源的能效和功率密度。
圖 :圖騰柱 PFC 級
然而,為了實現超大規模數據中心公司要求的 97.5% 或更高的能效,圖騰柱 PFC 需使用基于“寬禁帶”半導體材料(如碳化硅 (SiC))的 MOSFET。如今,所有 PFC 級均采用 SiC MOSFET 作為快速開關橋臂,并使用硅基超級結 MOSFET 作為相位或慢速橋臂。
與硅 MOSFET 相比,SiC MOSFET 性能更優、能效也更高,且穩健可靠,在高溫下表現更出色,可以在更高的開關頻率下運行。
與硅基超級結 MOSFET 相比,SiC MOSFET 在輸出電容中儲存的能量 (EOSS) 較低,而這對于實現低負載目標至關重要,因為 PFC 級的開關損耗主要來源于 EOSS 和柵極電荷相對較高的器件。較低的 EOSS 可大大減少開關過程中的能量損失,從而提高圖騰柱 PFC 快速橋臂的能效。此外,由于 SiC 器件具有出色的熱導率,相當于硅基器件的三倍,因此與硅基超級結 MOSFET 相比,SiC MOSFET 具有更好的正溫度系數 RDS(ON)。
下圖為 650V SiC MOSFET 導通電阻與結溫的關系。(結溫為 175℃ 時的導通電阻比室溫時的導通電阻高 1.5 倍。)
圖:650V SiC MOSFET 導通電阻與結溫的關系
同樣,下圖為 650 V 超級結 MOSFET 的導通電阻與結溫的關系。結溫為 175℃ 時的導通電阻比室溫下的導通電阻高 2.5 倍以上。
圖:650 V 硅基超級結 MOSFET 導通電阻與結溫的關系
比較額定 RDS(ON) 類似的硅基 650 V 超級結 MOSFET 與 650 V SiC MOSFET,在結溫 (Tj) 為 175℃ 時,前者的導通電阻RDS(ON)提高到約 50 mohm,而此時后者的 RDS(ON) 約為 30 mohm。在高溫運行期間,650 V SiC MOSFET 的導通損耗更低。
在圖騰柱 PFC 慢速橋臂功能塊和 LLC 功能塊中,導通損耗占總功率損耗的大部分。SiC MOSFET 在較高結溫下的 RDS(ON) 較低,有助于提高系統能效。
得益于在高溫下 RDS(ON) 增幅較小且 EOSS 出色,SiC MOSFET 在圖騰柱 PFC 拓撲中表現突出,更有助于提高能效并減少能量損失。
意法半導體:混合式TCM/CCM控制策略在交錯TTP PFC中扮演著重要角色
意法半導體表示,AI服務器作為支撐各類復雜AI運算的關鍵硬件,其電源(PSU)的性能表現成為了決定整個系統效能的重要因素。作為大功率AI服務器PSU領域的一項重大革新——混合式TCM/CCM控制策略在交錯TTP PFC中扮演著重要角色。
先進控制策略成為必然選擇,像TCM、CCM及交錯圖騰柱PFC技術,可優化電源性能,讓PSU能快速響應負載變化,實現智能電力管理。模塊化和可擴展性設計也極為關鍵,能滿足多樣化功率需求,便于維護和模塊替換,提升系統可靠性。
此外,AI服務器運行產熱多,高效冷卻和熱管理技術從風冷向液冷升級,保障系統穩定。增強故障容錯和預測性維護功能,減少停機風險,確保電力持續供應,是PSU高可靠性的重要體現。
混合式TCM/CCM控制策略詳解
圖騰柱PFC拓撲結構
圖騰柱PFC拓撲結構在PSU設計中應用廣泛,主要有單通道和交錯式兩種配置。單通道圖騰柱PFC通常適用于4kW以下的功率場合,器件數量少、電路結構相對簡單,控制簡單,易于實現。
交錯圖騰柱PFC則適用于對功率和效率要求更高的大功率場景。它采用兩相或三相交錯的方式,工作模式更加靈活,可以是CCM、TCM,甚至是混合模式。在輕載情況下,通過采用TCM模式和相屏蔽技術,能夠進一步提升效率,減少器件損耗,為高功率AI服務器PSU提供了更可靠的解決方案。
控制模式對比與選擇
在PFC控制策略中,常見的有CCM(電流連續模式)、DCM(電流斷續模式)、CRM(臨界導通模式)和TCM(三角電流模式)。在本次討論的方案中,重點采用了CCM和TCM的混合模式。
CCM的特點是電流連續,開關頻率固定。這種模式在高功率、高穩定性要求的場合表現出色,因為其電流波紋低,能夠提供相對穩定的電流輸出,但其開關損耗較高,輕載時效率會有所下降。
TCM則是一種開關頻率可變的控制模式,電流波形呈三角形。其優勢在于輕載時開關損耗低,效率較高。與DCM和CRM相比,TCM和CCM更適合AI服務器PSU應用。DCM的電流斷續特性導致其工作頻率不穩定,且無法實現零電壓開通,在效率和穩定性方面存在不足。CRM雖然也是變頻模式,但同樣沒有零電壓開通的優勢,因此在本應用場景中未被重點考慮。而TCM和CCM結合,能夠實現零電壓開通,有效提升整體效率,滿足AI服務器在不同負載情況下的需求。
混合控制模式優勢
混合式TCM/CCM控制模式具有多方面的顯著優勢:
優化效率:混合策略可根據負載情況在TCM和CCM之間切換,從而在廣泛的工作點上優化效率。TCM在輕負載時由于開關損耗減少而更高效,而CCM在高負載時由于導通損耗較低而更高效。
減少紋波電流:兩相/三相交錯有助于顯著減少輸入和輸出電流紋波。混合方法可以通過動態調整工作模式進一步優化紋波減少。
增強的熱管理:在兩相之間分配負載并在TCM和CCM之間切換可以帶來更好的熱性能和更均衡的熱量散布。
改善瞬態響應:在TCM和CCM之間切換,使系統能夠快速適應負載變化,提供更好的瞬態響應。
靈活性和可靠性:混合控制策略在設計和應用上提供了靈活性,使其適用于各種工作條件。它可以通過減少元件上的應力和改善熱管理來提高PFC電路的可靠性。
混合控制模式在交錯式TTP PFC中的實現方式
滯環電流控制
在交錯式TTP PFC中,實現混合式TCM/CCM控制模式的關鍵技術之一是滯環電流控制。通過設定電感電流的上下限,讓電感電流在這個設定范圍內波動,從而實現零電壓開通,有效降低開關損耗。這種控制方式響應快,能夠逐周期對電流進行精確控制,且工作模式切換靈活,可以根據實際需求在CCM、TCM或其他模式之間快速切換。但它對電感電流檢測的要求較高。
電流檢測方案
由于滯環電流控制對電感電流檢測的高要求,電流傳感器需要具備多種特性。它必須具備隔離功能,以確保電路的安全性;能夠進行雙向檢測,因為電流存在正負方向;具有低損耗特性,以減少對系統效率的影響;實現快速響應和OCP保護,滿足實時控制需求;具備高帶寬,以適應變頻信號。
ST目前采用的是一種復合方案,即將霍爾傳感器與電流互感器(CT)結合使用。CT主要用于檢測交流高頻成分,即電感電流中的高頻電紋電流部分;霍爾傳感器負責檢測工頻成分。兩者采集的信號疊加后,能夠得到反映實際電感電流的原始信號。此外,ST也在對高帶寬霍爾傳感器進行評估,探索更優的電流檢測解決方案。
在硬件層面,ST方案以STM32G474為核心控制芯片,搭配相關的功率器件,如不同類型的MOSFET等,構建起完整的控制電路。STM32G474具備強大的處理能力和豐富的外設資源,為實現復雜的控制算法提供了硬件基礎。
方案利用STM32G474內部的DAC、快速比較器和高分辨率定時器(HRTIM)實現滯環控制、ZVS(零電壓開關)控制和驅動信號輸出??刂苹芈钒粋€1kHz運行的電壓外環,主要作用是穩定輸出電壓,使其保持在設定值;一個40kHz運行的電流內環,用于精確控制電感電流。同時,還引入了輸入和輸出前饋控制,有效防止輸出電壓波動,提高系統穩定性。
CCM實現方式與仿真測試結果
進入CCM模式有兩種常見的實現方式,即固定紋波帶和固定開關頻率。以固定紋波帶為例,如設定紋波帶為4A,在這種情況下,整個控制過程是變頻操作。另一種方式是固定開關頻率,例如設定為70kHz,此時需要根據輸入電壓(Vin)、輸出電壓(Vout)、周期(T)和電感值(L)來計算電感器紋波。通過仿真,得到了不同方式下的電流波形。目前實際應用中采用的是固定紋波帶的方式。
從測試結果來看,在2000W(純TCM)、3500W(TCM/CCM混合)、4500W(CCM為主)等不同負載條件下,電流波形表現良好。例如,在2000W純TCM模式下,電流波形交錯良好;3500W混合模式時,CCM和TCM的切換區域過渡平穩;4500W以CCM為主時,CCM區間穩定工作。這些結果充分驗證了方案的可行性和有效性,尤其是電流過零部分無明顯畸變,表現理想,對PFC性能的提升效果顯著,為AI服務器PSU的實際應用提供了可靠保障。
由此可見,混合式TCM/CCM控制策略在交錯TTP PFC中的應用,為大功率AI服務器PSU帶來了性能上的巨大提升。ST針對高功率AI服務器電源精心打造了專業設計套件,并提供全面的產品組合,充分滿足多樣化的設計需求,為AI服務器電源的發展注入強大動力。展望未來,該技術體系有望持續優化,為AI領域發展筑牢電力根基。
英飛凌:PSU 架構中需要混合功率半導體的原因
英飛凌表示,未來PSU中需要硅基、碳化硅和氮化鎵的共同方案,從而在不同場景下充分發揮器件優勢。
硅基器件的局限性:硅在功率電子領域長期占主導,但它在處理高電壓、電流和頻率方面存在物理限制,已接近理論極限,難以進一步提升效率和功率密度。
寬禁帶器件的優勢:SiC和氮化鎵GaN具有更高的品質因數(FoM),在效率和功率密度方面表現更優。與硅晶體管相比,GaN 晶體管輸出電荷更低,無體二極管恢復問題,反向恢復電荷低,柵極電荷低,溫度系數低;SiC MOSFET 的反向恢復電荷低,導通電阻隨溫度變化小,輸出電荷低且更線性,柵極電荷低。
混合技術的好處:將 SiC 和 GaN 技術與現有的硅基設計相結合,能在效率、功率密度和整體性能方面帶來顯著優勢。
圖:幾種產品的FOM比較
英飛凌的創新 PSU 解決方案通過結合 Si、SiC 和 GaN 技術的混合組件方法,優化了每個階段,實現了高功率密度和效率,降低了能源損失和提高了熱性能。 這些 PSU 解決方案功率評級為 3kW 至 12kW,基準效率為 97.5%,適用于下一代 AI 數據中心,有助于降低數據中心的碳足跡。
以英飛凌8kW PSU參考設計為例:
無橋圖騰柱 PFC 級:該參考板的無橋圖騰柱 PFC 級采用碳化硅,有助于提高效率和可靠性。無橋圖騰柱 PFC 拓撲能夠減少傳統 PFC 拓撲中橋式整流器的功率損耗,從而提升整體效率。比如在滿足 80 Plus 鈦金認證(要求端到端峰值效率超過 96%,意味著 PFC 級效率必須高于 98.6% )時,傳統 PFC 拓撲因橋式整流器功率損耗難以達到這一標準,而無橋圖騰柱 PFC 拓撲僅需一個 PFC 電感,且能在整個交流周期內進行升壓操作,可實現高功率密度和高效率的 PSU 設計。
高頻 LLC 級:高頻 LLC 級采用了 CoolGaN 開關,其較低的電容特性使得開關速度更快,能夠減少開關過程中的能量損耗。在高頻應用場景下,GaN 晶體管的這一優勢尤為明顯,有助于提高電源的功率密度和整體效率 。在一些高頻電源轉換電路中,GaN 晶體管可以實現更快的開關動作,降低開關損耗,進而提升整個電源系統的性能。
硅功率開關的應用:在 PFC 和 DC - DC 階段的整流環節使用硅功率開關,這是因為在這些環節中開關損耗極小,而硅功率開關具有極低的導通電阻,能夠充分利用這一特性來最小化導通損耗,進一步提升電源的效率。在實際的電源設計中,通過合理選擇硅功率開關,可以有效降低整流過程中的能量損失,提高電源的整體性能。
高效率:達到 97.5% 的基準效率。
低冷卻需求優化:設計優化減少了冷卻工作量。
高功率密度:功率密度達到 100W/in3,是 ORv3 規格的兩倍。高功率密度使得 PSU 在有限的空間內可以提供更大的功率輸出。
納微半導體:碳化硅與氮化鎵混合
納微半導體也表示,硅基電源具有很多局限性。
以 12V、1.5kW 的 CRPS 為例,采用 LLC 拓撲設計需平衡變壓器繞組、同步整流器開關和導通、電源終端等損耗。提高開關頻率可減小磁性元件尺寸,但會增加終端損耗;使用多個變壓器可避免終端損耗,但會增大體積。
頻率限制:市場上 CRPS LLC 轉換器典型開關頻率 100 - 150kHz,1.5kW 服務器 PSU 開關頻率達 600kHz,超出硅功率 MOSFET 實際極限,需用氮化鎵高電子遷移率晶體管作為同步整流器以滿足 80 PLUS Titanium 效率要求。
GaN 技術在電源中的應用與挑戰應用優勢:GaN 晶體管在高開關頻率下性能優越,納微基于此設計出多千瓦 CRPS 參考方案,如 4.5kW、單 54V 輸出、300kHz 開關頻率的設計,滿足 CRPS 185mm 尺寸要求。
不過氮化鎵也會面臨一些挑戰,比如GaN MOSFET 柵極電壓范圍為 - 10V - 7V,閾值電壓 1V - 2V ,相比硅 MOSFET 更脆弱。電壓尖峰、振鈴等異常情況易損壞其柵極,如低側晶體管關斷時會使柵源電壓(VGS)出現負尖峰,柵極回路電感和高 di/dt 共同作用會導致 VGS 振鈴,還存在直通電流風險。
納微的解決方案是將優化的柵極驅動器與 GaN HEMT 集成在同一封裝內,控制驅動器與柵極間的電感和電阻值,降低柵極回路電感,防止峰值電壓過高;利用封裝內集成的保護功能,簡化電源設計。
結合 GeneSiC MOSFET,實現無橋圖騰柱功率因數校正(PFC)在連續導通模式下高效運行,打造出 4.5kW 的 CRPS185 模塊,功率密度達 137W/in3 ,遠超硅基技術。
另外,納微剛剛宣布與兆易創新GigaDevice達成戰略合作伙伴關系,通過將兆易創新先進的高算力MCU產品和納微半導體高頻、高速、高集成度的氮化鎵技術進行優勢整合,打造智能、高效、高功率密度的數字電源產品,并配合兆易創新的全產業鏈的管理能力與納微對系統應用的深刻理解,加速在AI數據中心、光伏逆變器、儲能、充電樁和電動汽車商業化布局。作為戰略合作的重要組成部分,兆易創新還將與納微半導體攜手共建聯合研發實驗室,融合雙方的技術專長和生態資源優勢,驅動智能、高效電源管理方案的創新升級。
德州儀器:氮化鎵一切都能搞定
GaN 可實現高頻開關,這樣可減小無源器件的尺寸,從而增加密度。與硅和碳化硅的相比,GaN 還可降低開關、柵極驅動和反向恢復損耗,從而提高電源設計效率??梢允褂?650V GaN FET 進行 AC/DC 至 DC/DC 轉換,以及使用 100V 或 200V GaN FET 進行 DC/DC 轉換以實現電源供應。
針對650V 電源,德州儀器集成 650V TOLL氮化鎵,可以通過 PFC 和 DC/DC 級將交流電源轉換為直流總線,德州儀器采用 TOLL 封裝的 GaN 器件可在 PFC 級實現超過 99% 的效率,在 DC/DC 級實現超過 98% 的效率。
針對100V至200V GaN,有三個可能的系統:
電源單元 (PSU):開放計算項目的變化正在提升 48V 輸出的熱度;然而,所需 80V 和 100V 硅解決方案的損耗(柵極驅動和重疊損耗)相較于以前的解決方案有大幅增長。諸如 LMG3100 等 GaN 解決方案有助于盡可能減小電感-電感-電容器級(LLC 級)次級側同步整流器中的上述損耗。
中間總線轉換器 (IBC):此系統將 PSU輸出的中間電壓(48V)轉換為較低的電壓,然后傳送至服務器。隨著48V電壓電平的流行,IBC有助于減少服務器子系統中的I 2R損耗,并使匯流條和電力傳輸線的尺寸和成本都得到降低。IBC的缺點是其在電源轉換中又增加了一步,可能會對效率產生影響。因此,除了 OEM 經測試可獲得高效率和高功率密度最佳組合的幾種新拓撲外,請務必充分利用 LMG2100 和 LMG3100 等高效 GaN 器件。
電池備份單元:降壓/升壓級通常將電池電壓(48V)轉換為總線電壓(48V)。當市電線路斷電且電力流為雙向時,您也可以使用BBU進行電池電源轉換。不間斷電源之所以使用此級,是因為它僅通過電池直接執行一次直流/直流轉換,避免了由直流/交流/直流轉換引起的損耗。
英諾賽科——近期與長城電源合作
日前,長城電源表示已在其面向 AI 數據中心的鈦金級電源中采用 Innoscience 氮化鎵 (InnoGaN) 技術,實現了 96% 以上的超高電源轉換效率,超越全球最高80PLUS 鈦金級能效標準。
針對服務器電源的能耗困局,英諾賽科率先推出采用To-247-4封裝,集成柵極驅動和短路保護的E-GaN功率IC(ISG612xTD SolidGaN),耐壓700V,Rdson 范圍為 22~59m?。該系列產品集成精密Vgs柵極驅動器,具備快速短路保護和出色的熱性能,能夠滿足 Titanium Plus 效率的高頻開關,相比傳統方案,功率密度提高一倍以上。
OCTC《高功率密度服務器電源模塊化設計白皮書(2024)》顯示,在占服務器80%運行時間、處于20%-50%的典型負載區間時,氮化鎵鈦金電源轉換效率可穩定在95.5%-96%以上,有效避免了因 “效率斷層” 導致的隱性能耗。長城服務器電源率先采用英諾賽科合封芯片 ISG6122TD和ISG6123TD,與傳統電源相比,其輕中載電能損耗可減少至少30%,在20%-50%典型負載區間較傳統電源提升達4個百分點,實現了超過96%的轉換效率。據測算,采用氮化鎵鈦金電源方案,每萬臺服務器每年可節省電費超200萬元,發熱量減少50%,帶動空調能耗降低18%。有力推動智算中心PUE向1.2以下突破,實現了“節能 + 散熱”的雙重收益。
總結
無論是氮化鎵還是碳化硅,目前在AI服務器領域已經逐步成熟,也將越來越得到市場的青睞,尤其是隨著功率密度、效率、尺寸、轉換頻率等等一系列需求的增長,未來這一市場還將持續火熱。
歡迎將我們設為“星標”,這樣才能第一時間收到推送消息。
關注EEWorld旗下訂閱號:“機器人開發圈”
回復“DS”領取《DeepSeek:從入門到精通》完整版
掃碼添加小助手回復“機器人”
進群和電子工程師們面對面交流經驗
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.