當前各種AI大模型如火如荼,推動全球算力需求呈現爆炸式增長,伴隨著算力需求的增長,全球電力、功耗方面的成本不斷增加。據相關統計,AI算力下主流芯片功耗正不斷增加,如Intel的多款CPU芯片的TDP已突破350W,NVIDIA的H100系列GPU芯片TDP更是達到700W,B100 TDP或將達到1000W左右。英偉達GTC大會上,英偉達CEO黃仁勛發布了更高性能的GPU芯片——基于Blackwell架構的B200以及超級芯片GB200。由于功耗太高,液冷的散熱方式成為系統的標配。
英偉達還推出了超級計算機機柜DGX GB200 NVL72,擁有18個GB200節點機架,每個節點搭配2個GB200 GPU。黃仁勛表示,一個DGX GB200 NVL72機柜可以訓練27萬億參數的模型。但由于功耗過大,所以也必須要采用液冷的方式進行冷卻。
(圖片來源于網絡)
目前PC行業應用水冷技術越來越多,高端電腦基本上都是采用水冷散熱,相比普通的風冷散熱,散熱效率上最大提升50%-60%,噪音也比普通風冷要低。
液冷以接觸方式劃分的話可分為接觸式液冷和非接觸式液冷,其中浸沒式、噴淋式液冷等終端和載冷液直接接觸的為接觸式液冷,而通過冷板間接和終端連接,利用換熱冷板和終端的熱交換帶走熱量的稱為非接觸式液冷,我們在PC機上應用最多的就是這種非接觸式液冷,冷頭固定接觸在CPU表面,通過水的流動,在冷頭內部跟CPU進行熱交換,帶走CPU產生的熱量。
目前市場上幾乎所有的PC的液冷散熱系統都是被動式的散熱,即散熱系統本身不產生冷量,而是通過冷排端的翅片冷凝器將系統的熱量排出去從而形成散熱,簡單有效,散熱效果比風冷強,但是也強不了太多,因為該系統不能主動產生冷量,當電腦進行超頻時,CPU功率快速增加,發熱量也同步增加被動式散熱很難及時將熱量帶走,一般被動液冷極限也就到300-400W。
為了解決此問題,針對AI芯片開發了壓縮機制冷系統,冷量從300W-2000W,并采用靜音降噪技術,壓縮機可以實現變頻和低冷量運行,適用于各種狀態和模式下工作的CPU或是GPU,保證CPU和GPU長時間處于合理、穩定和最佳工作狀態。
下圖為Q520系列,如圖所示:
外置主機散熱系統Q520圖
基礎版冷量達到500W,進階版冷量達到600W,后續陸續推出1000W以上的機器和設備,用于超頻或是CPU、GPU同時穩定運行。
下圖為1600W的主動降溫系統,實測可以滿足目前最新的CPU(如i9-14900KS)和GPU(如RTX4090)以最佳狀態運行,而噪音也不大,55dB以內,滿足民用的使用環境。
1600W主動降溫系統圖
液冷行業在蓬勃發展的同時也存在一些挑戰,液冷技術在國內外發展已有十余年,但當前生態不完善,各家產品形態各異,產品規范化程度較低。目前業內尚無PC系統一接口規范標準,機柜與服務器深度耦合,各家PC設備、冷卻液、制冷管路、供配電等產品形態各異,不同廠家產品接口不同、不能互相兼容,勢必限制競爭,影響產業高質量發展。
因此,液冷技術標準、產業鏈生態仍有待更進一步的建立與規范,酷凌時代積極參與液冷技術規范的編寫,利用自身在液冷行業的豐富經驗和應用案例,推動液冷行業快速、高效、規范發展。
-
AI芯片
+關注
關注
17文章
1899瀏覽量
35129 -
液冷
+關注
關注
4文章
107瀏覽量
5107 -
AI大模型
+關注
關注
0文章
318瀏覽量
332
發布評論請先 登錄
相關推薦
評論