行業里存在這樣一種說法:全世界的數據中心消耗了大量的能源——事實也確實如此。具體消耗量因來源(和數據中心)而異,但大致上一個數據中心可以消耗 100 兆瓦;該數目來自 Energy Innovation (EI) 的報告《數據中心到底用了多少能源?(How Much Energy Do Data Centers Really Use?) 》。
下方餅圖也出自這份報告,報告中表示,粗略來看,全世界一半的電力用于運行數據中心的設備,另一半用于將電力輸送到建筑內并將熱量排出。
一個很好的例子是位于美國俄勒岡州達爾斯市的谷歌數據中心——因為那里曾建有鋁冶煉廠。鋁是利用大量的電力從鋁土礦中提煉出來的,所以冶煉廠總是位于發電廠附近,如水電大壩。俄勒岡州的鋁冶煉廠關閉了,因此有大量的電力可用,所以谷歌在那里建立了數據中心。另外,該數據中心位于哥倫比亞河上,這為冷卻提供了一個取之不盡的冷水來源。這是我所知道的“熊彼特創造性破壞理論”最好的例子之一:20 世紀的鋁冶煉廠被 21 世紀的超大規模數據中心所取代。
全球數據中心的電力增長幅度是多少?
既然全球各地都在建造越來越多的數據中心,那么可以假設,數據中心的總耗電量正在快速增長。一些推測性的圖表顯示整個世界的電力供應將用于為數據中心(或比特幣礦工)供電:
“
隨著全球互聯網用戶數量的增長,市場對數據中心服務的需求也在增加,這引起了人們對數據中心能源使用增長的擔憂。2010 年至 2018 年間,全球 IP 流量(在互聯網上傳輸的數據量)增加了 10 倍以上,而同時全球數據中心的存儲容量也增加了 25 倍。在同一時期,全球服務器上運行的計算實例數量(托管的總應用數)增加了 6 倍以上。
——Energy Innovation (EI) 報告
”
但事實證明,擔憂這些問題的人對半導體、EDA、摩爾定律以及使芯片的功耗越來越低的解決方案一無所知。目前,全球數據中心的總耗電量約為 200TWh/年,但其實這與十年前沒有什么不同。以下內容來自 EI 報告:
“
然而,從自下而上的角度來看,新的結果表明情況并非如此:盡管在過去十年中,信息服務的需求快速增長,但在 2010 年至 2018 年間,全球數據中心的能源使用可能只增加了 6%。
……
2018 年全球數據中心消耗了約 205 太瓦時 (TWh),占全球電力使用的 1%,這一發現與先前基于外推法的估算數據形成了鮮明的對比——此前估計在過去十年內,數據中心的能源使用迅速上升。
——Energy Innovation (EI) 報告
”
從某種意義上說,這是很了不起的。另一方面,在 2010 年至 2018 年間,半導體工藝技術經歷了幾個節點:2010 年時28nm 還沒有問世,然后到 2018 年時 7nm已然誕生。每前進一個節點都會使功耗降低約 30%,這意味著同樣的功能,2018 年的功耗約為 2010 年的 15%。因此,即便互聯網流量、數據中心、云計算經歷了爆炸式增長,使用的電力僅占全球電力總量的 1%。
測算功耗
2010 年至今的另一個變化是,我們在設計芯片時可以使用更好的工具來測算功耗。曾經除了憑感覺判斷,我們只能使用 Excel 表格來測算功耗。2010 年之前,這幾乎是芯片設計師、服務器設計師和整個數據中心設計師的唯一工作方式。這個方法通常會導致非常悲觀的設計,因為大家無法承受芯片過熱熔化,或者整個機架過熱的后果。
當然,這個問題需要一層一層入手,彼此嵌套。一個數據中心由一排又一排的機架組成。每個機架通常包含大量的服務器,并在頂部配有路由器。這些服務器通常被稱為“披薩盒”,因為其大小和形狀大致如此,并且用處理器、GPU 和其他芯片取代了意大利香腸。這些是所有熱量的來源。因此,要想提高機架(乃至整個數據中心)功耗估算數據的準確性,就要從準確計算每個芯片的耗散功耗入手。
Voltus 和 Celsius
Cadence Voltus IC Power Integrity Solution 和 Celsius Thermal Solver可以在這方面發揮重要作用,深入了解請閱讀文章《免費下載 I 如何在芯片的熱分析中實現2+2=5?》。
Voltus 主要用于計算芯片上各處的 IR 壓降,并同時生成 Voltus 熱模型 (Voltus Thermal Models ,VTM)。VTM 模型包含裸片上的材料特性、金屬密度(因為金屬既導熱又導電)、動態功耗信息以及與溫度有關的泄漏功耗。
以上只是一個起點;芯片裝在封裝里,封裝又裝在電路板上——因此,芯片產生的一些熱量是分散的,因為封裝和電路板在傳導信號的同時也在傳導熱量。同時其周邊還有其他重要的熱源,如散熱器、熱管、風扇等等。此時 Celsius Thermal Solver就派上了用場,它是 Cadence推出的業內首款用于完整電熱協同仿真系統分析的熱求解器,由兩個不同的基礎求解器組成:一個基于有限元方法 (FEM),用于處理通過電路板的傳導及輻射熱;另一個基于計算流體力學 (CFD),用于處理與流體有關的一切,通常是氣流,但也包括水冷所涉及的流體(或實際上通常使用的其他流體)。
經過生產驗證,Celsius Thermal Solver的大規模并行架構可在不犧牲精度的前提下,提供比傳統解決方案加快10倍的性能。
同時,Celsius Thermal Solver 可以和Voltus工具無縫集成、協同工作,對“披薩盒服務器”進行非常精確的分析;然后將這些數據相加,得到一整個機架的數據;再將機架數據相加,得到一整個數據中心的數據。同時,這種分析也可用于決定在哪里放置風扇、擋板和散熱器等部件。
下圖顯示了通過Voltus 和 Celsius的熱分析而發現的“比薩盒服務器”中的問題:
如果想進一步了解Voltus 和 Celsius 之間1+1>2的熱分析,歡迎點擊下圖下載白皮書《使用 Celsius Thermal Solver 對 3D-IC 進行熱和應力分析》,該白皮書詳細講述了Voltus 和 Celsius的協同工作流程:
-
數據
+關注
關注
8文章
7102瀏覽量
89274
發布評論請先 登錄
相關推薦
評論