電子發燒友網報道(文/梁浩斌)AI技術在近年快速發展,應用領域越來越廣泛的同時,也帶來了巨大的算力需求,數據中心建設規模不斷擴大,算力芯片功率越來越高,導致數據中心的能耗暴增。
有數據顯示,目前全球正在建設或處于不同開發階段的數據中心有7000多個,是2015年的2倍。而目前全球數據中心消耗的電力大概占總電力消耗的1%至2%,預計到2030年,數據中心電力需求還會增長160%,到本世紀末,數據中心在全球電力消耗占比可能高達4%。
根據國家能源局數據,2022年中國數據中心耗電量達到2700億千瓦時。預計到2030年耗電量將飆升至接近4000億千瓦時,這是什么概念?三峽電站年設計發電量僅882億千瓦時。
因此,解決數據中心電力消耗高的問題,一方面是提高使用清潔能源的比例或增加發電量,另一方面是從數據中心本身著手,提高效率,降低能耗。
為降低數據中心能耗作出的努力
數據中心的能耗主要來自于幾大部分,包括核心的服務器機柜中各種設備;為機房提供恒溫恒濕的精密空調,以及服務器板卡上的散熱風扇,甚至是水冷系統等;供配電系統,比如變壓器、不間斷電源(UPS)、配電柜等,它們在電能轉換和分配過程中也會產生能耗。
當然最關鍵的就是算力芯片,比如英偉達最新推出GB200AI加速卡由2個B200 GPU和一個Grace CPU組成,估算單卡的峰值功率將高達2700W。
而一個用于訓練萬億參數級別大模型的數據中心,過去動輒需要超過上萬塊AI加速卡。以英偉達2017年推出的V100 GPU來看,當時單卡最大熱設計功耗是250W,FP64算力是7TFLOPS,FP32算力是14TFLOPS。
通過在過去幾年工藝制程的提升,以及芯片架構設計上的改進,從V100到A100再到H100,2022年H100的最大熱設計功耗是300W-350W,相比V100提高了20%到40%。但同時它的算力增長幅度更大,FP64算力26TFLOPS,相比V100提升371%;FP32算力51TFLOPS,相比V100提升364%,能效比提升幅度巨大。
而GB200更是采用NVLink-C2C 片上互聯技術,集成兩個GPU和一個CPU核心,構成一個超大芯片,這是封裝和高速互連技術所帶來的提升。
所以在算力芯片上,盡管摩爾定律式微,工藝制程帶來的性能提升越來越小,但英偉達CEO黃仁勛又提出了“黃氏定律”,GPU能效每兩年將增加一倍以上。除了芯片工藝制程之外,芯片架構設計、封裝技術的發展,依然能夠推動GPU能效的持續提升。
在算力芯片之外,數據中心的電源、供配電系統也是能耗大戶。數據中心的電源效率通常用電源使用效率(PUE)來衡量,PUE是數據中心消耗的所有電力與IT設備使用的電力之比。PUE的值越接近1,表示數據中心的電源效率越高,能耗越低。
簡單來說就是,當數據中心的所有電力消耗都被用于真正起到計算和存儲作用的機柜時,PUE就是1。但由于數據中心還有空調、供配電、監控、建筑照明等外圍用電設備,所以在實際應用中PUE遠大于1。
根據2018年的統計數據,全球數據中心的PUE平均值為1.58。一些地區或國家可能有更嚴格的要求,比如在中國,北京和深圳對新建數據中心的PUE要求在1.4以下,上海的要求更為嚴格,要求PUE達到1.3以下。
為了降低PUE,有些企業嘗試在冷卻上下功夫,比如微軟在2018年啟動了一項實驗,在蘇格蘭海岸外 117 英尺的水下安裝了擁有864臺服務器的數據中心,測試利用海水散熱降低數據中心能耗的可行性。2020年微軟公布了測試結果,表示水下服務器的設備故障率僅為陸地數據中心的 1/8,同時海水溫度穩定,可以穩定為服務器散熱。然而有趣的是,微軟今年卻宣布未來不會在世界任何地方建設海底數據中心,耐人尋味。
除此之外,服務器電源轉換效率對于目前功率越來越大的服務器來說,收益更大,因此近年服務器電源效率就受到了更多關注。
第三代半導體,助力服務器電源效率突破
服務器電源需要在服務器機架有限的空間里提供大功率供電,一方面需要更高的功率密度,其次是需要更高的轉換效率。業界對電源有多個等級標準,比如銅牌電源的轉換效率大于等于82%,在50%負載下效率要在85%以上;最高級的鈦金牌電源,在50%負載下轉換效率要達到96%,在10%和100%負載下效率也需要超過90%。
由于服務器需要常年24小時不間斷運行,那么幾個百分點的效率差距,就能產生巨大的成本收益。比如將1000W的服務器上的白金電源換成鈦金級電源,每年可以節省200千瓦時電力消耗。如果在一個十萬臺服務器的超大型數據中心中,一年就可以節省2000萬千瓦時,大大降低數據中心運營成本。
所以結合高效率和高功率密度的兩大需求,第三代半導體開始應用到服務器電源上。比如華為PAC3000S12-T1鈦金級3000W服務器電源,就采用了GaN功率器件,功率密度超過6W每立方毫米,轉換效率超過96%,最高可達98%。
英飛凌今年發布的數據中心電源路線圖上也表示,將推出兩款混合使用硅、GaN、SiC三類晶體管開關以實現100W每英寸立方的高功率密度和97.5%的高轉換效率的服務器電源,采用全數字控制交錯式無橋圖騰柱PFC搭配全橋GaN LLC電路設計。
英諾賽科去年推出了一款2kW的服務器電源方案,功率密度達到76W每立方英寸,效率達到96.5%,采用 InnoGaN 650V 氮化鎵芯片以及圖騰柱無橋 PFC+LLC 結構。
納微半導體去年也推出了一款3.2kW數據中心電源平臺,功率密度接近100W每立方英寸,且效率超過96.5%。按照此前發布的路線圖,納微半導體今年還將發布一款全新的4.5kW電源平臺,將GaN技術和SiC技術結合,功率密度提升至135W每立方英寸以上,效率超過97%。
小結:
隨著數據中心大基建時代加速,數據中心能耗將受到更多關注,從發電端到綠色能源利用再到降低數據中心能耗,或許還將加速更多的新技術發展以及落地。
-
第三代半導體
+關注
關注
3文章
156瀏覽量
6986
發布評論請先 登錄
相關推薦
評論