提到人工智能(AI),大家都知道它的“ABC”三要素——即算法(Algorithm)、數(shù)據(jù)(Big data)和算力(Computing)——誰要是能夠集齊這三張技術(shù)“拼圖”,似乎就可以在AI時代無往而不利了。但是,在諸多設(shè)計創(chuàng)想落地之時,人們逐漸發(fā)現(xiàn),還有一個掣肘AI應(yīng)用的第四要素不容忽視,那就是能耗。
按照主流的體系布局,AI系統(tǒng)的計算和處理資源會根據(jù)需要部署在云端和邊緣端。以云端的數(shù)據(jù)中心為例,作為AI體系的“大腦”,承擔(dān)了海量數(shù)據(jù)的處理工作,包括基于大數(shù)據(jù)的模型訓(xùn)練以及需要較高算力支持的復(fù)雜推理,與之相對應(yīng),數(shù)據(jù)中心的能耗也相當(dāng)可觀。
有數(shù)據(jù)顯示,到2025年數(shù)據(jù)中心能耗將占到全球能耗的33%,位居能耗占比的首席。而在中國,數(shù)據(jù)中心總耗電量在2017年就已達(dá)到1200-1300千瓦時——這個數(shù)字超過了三峽大壩和葛洲壩電廠發(fā)電量之和。預(yù)計到2025年,這個數(shù)字將會攀升至3842.2億千瓦時。
如果對數(shù)據(jù)中心能耗進(jìn)行更細(xì)致的分析,會發(fā)現(xiàn)直接用于數(shù)據(jù)處理的IT設(shè)備能耗會占到總能耗的50%以上。因此,如何將這部分能耗有效地控制和管理起來,也就成了應(yīng)對AI系統(tǒng)能耗挑戰(zhàn)的第一要務(wù)。
AI系統(tǒng)的電源管理挑戰(zhàn)
削減AI系統(tǒng)能耗的思路無外乎有兩個:一個是降低AI系統(tǒng)核心處理器的能耗,另一個則是從優(yōu)化電源管理系統(tǒng)入手,提高AI核心處理器電源管理的效率。
對于前者來講,無論是GPU、CPU、FPGA,還是異構(gòu)計算架構(gòu),對低功耗的追求從來沒有止步,但是由于AI對計算資源的消耗實(shí)在是驚人,加之摩爾定律已經(jīng)越來越接近“天花板”,因此伴隨著總體計算密度和強(qiáng)度的增加,在這方面可騰挪的空間越發(fā)局促。
因此,從電源管理入手,找到一個更優(yōu)的解決方案,就顯得尤為重要。而所謂“更優(yōu)”,具體來講,就是要應(yīng)對以下幾個AI系統(tǒng)中常見的電源管理挑戰(zhàn):
第一,為了支持高性能、高密度的計算,AI機(jī)器學(xué)習(xí)應(yīng)用要使用更多的CPU、GPU和定制ASIC等處理器,相應(yīng)的所需功率和電流水平也越來越高。
第二,所有計算性能的提升,都是要在相同的機(jī)架空間內(nèi)實(shí)現(xiàn)的,功率密度也就相應(yīng)地增加了,因此AI電源管理必須具有更高的效率,以及更佳的熱性能。
第三,AI系統(tǒng)的功率更高、電流也更高,而處理器所需的電壓卻越來越低。在這樣的趨勢下,保持處理器供電電壓穩(wěn)定性的難度也會隨之增大,這就對電源電壓調(diào)節(jié)器的精度提出了更高的要求。
我們將上述的設(shè)計挑戰(zhàn),轉(zhuǎn)化為對一個理想的AI數(shù)據(jù)中心電源管理系統(tǒng)的設(shè)計要求,就不難得出以下幾個關(guān)鍵詞:
高效率
通過一系列先進(jìn)的電源管理功能,來實(shí)現(xiàn)更高的效率,這是首要的目標(biāo),因?yàn)槊鎸薮蟮哪芎模拭刻岣?%,總體節(jié)能成效都是顯著的。
小體積
無論是通過提高電源管理芯片自身的集成度簡化外圍電路,還是通過效率的提升簡化散熱系統(tǒng),都有助于電源系統(tǒng)空間的優(yōu)化。
高可靠性
為了提升性能,新一代的AI處理器都會采用更小的特征尺寸、更低的工作電壓,因此對于外部電路電流、電壓、溫度等擾動也更為敏感,這就使其需要更為完善的保護(hù)功能,以確保系統(tǒng)的可靠性。
靈活性
考慮到AI計算架構(gòu)的多樣化以及應(yīng)用場景的多樣化,用一套可裁剪、方便用戶定制的電源解決方案來滿足不同輸出電流、不同規(guī)格尺寸的設(shè)計要求,也是一個重要的考量要素。
Maxim Integrated(以下簡稱Maxim)新近推出的AI系統(tǒng)多相供電電源芯片組,就是按照這樣的設(shè)計要求打造的。該芯片組包括兩顆芯片:用于AI處理器核供電的雙輸出穩(wěn)壓電源MAX16602和智能電源級IC MAX20790,整體方案支持60A至800A或更大功率的系統(tǒng)設(shè)計,同時能夠提供高于95%的工作效率(在1.8V輸出電壓、200A負(fù)載條件下),此外在輸出電容減小40%的同時仍然可以提供極佳的瞬態(tài)性能。
可以說,這是一款同時具有高效率和小尺寸特性,且各方面表現(xiàn)十分優(yōu)秀的AI系統(tǒng)電源管理解決方案,適用于AI邊緣計算以及數(shù)據(jù)中心云計算等系統(tǒng)的供電設(shè)計。
圖1:Maxim推出的多相AI電源芯片組
AI電源芯片組解析
下面我們就來一起觀察一下這款解決方案的技術(shù)細(xì)節(jié)。
圖2展示了由MAX16602和MAX20790構(gòu)成的完整的AI電源管理系統(tǒng)。其中,MAX16602是一款采用耦合電感技術(shù)和智能功率級的控制器IC;MAX20790則是一款高密度、靈活和可擴(kuò)展的智能功率級IC,內(nèi)置電流和溫度傳感器,動態(tài)響應(yīng)能力出色,所需的外圍元器件數(shù)量也很少。
圖2:MAX16602和MAX20790電源芯片組應(yīng)用電路
MAX16602雙輸出穩(wěn)壓器
我們先來看看MAX16602,它具有四個突出的優(yōu)勢特性。
一是高功率密度和效率。MAX16602在1.8V輸出電壓下,可以實(shí)現(xiàn)95.6%的峰值效率。該器件還集成了1.8V偏置電源,只需要一個很小的外部電感,采用QFM封裝(7mm × 7mm),確保了整個方案的小尺寸。
二是采用了一系列高級電源管理功能。其中包括自主切相,正交電流再均衡(以實(shí)現(xiàn)瞬態(tài)相電流平衡),并且具有低靜態(tài)電流,可提高輕載和待機(jī)效率。
三是通過PMBus進(jìn)行遙測,實(shí)現(xiàn)了輸入電源監(jiān)測。具有數(shù)字可編程配置,輸入電壓、電流和功率監(jiān)控,以及功率級溫度監(jiān)控和報告功能。
四是具有比較完善的保護(hù)特性。這些保護(hù)功能包括輸入和偏置電源欠壓保護(hù)、過流保護(hù),以及關(guān)鍵故障指示引腳等。
此外,特別值得一提的是MAX16602還為設(shè)計開發(fā)提供了極大的靈活性。該控制器可支持兩個獨(dú)立的電源軌:一個電源軌為8個PWM輸出,通過PWM并聯(lián),可控制多達(dá)16個相位;另一個電源軌為單相輸出,可支持1個PWM。也就是說在設(shè)計開發(fā)時,該IC可支持從2相至16相的擴(kuò)展性,以滿足從60A至800A(或更高)的不同輸出電流的要求。
圖3:MAX16602的系統(tǒng)框圖
MAX20790智能功率級IC
Maxim這款A(yù)I電源芯片組中的另一顆關(guān)鍵的器件是MAX20790,這是一款功能豐富的智能功率級IC,與Maxim的控制器(如MAX16602)配合使用,可實(shí)現(xiàn)高密度多相同步降壓轉(zhuǎn)換器功能。
MAX20790的性能優(yōu)勢包括:
緊湊的外形:高集成的單芯片封裝,占板面積僅有24mm2,還支持用于熱平衡的相電流導(dǎo)引(Current Steering)功能。
峰值效率高達(dá)95.6%:得益于單片集成和先進(jìn)的封裝技術(shù),MAX20790支持較高的開關(guān)頻率(300kHz至1.3MHz),與傳統(tǒng)方案相比損耗顯著降低。同時,切相和不連續(xù)傳導(dǎo)模式(DCM)也可在大范圍負(fù)載電流下實(shí)現(xiàn)效率的優(yōu)化。
狀態(tài)監(jiān)測和故障報告:MAX20790通過控制器IC的PMBus提供準(zhǔn)確溫度和每相電流的監(jiān)測數(shù)據(jù)以及故障報告,并可以由Fault_ID指示故障類型。
高級自我保護(hù)功能:包括加強(qiáng)的UVLO保護(hù)、VX短路和超溫停機(jī)、快速過電流保護(hù)等。
圖4:MAX20790的系統(tǒng)框圖
(圖源:Maxim)
完整的AI電源方案
不難看出,MAX16602和MAX20790都是經(jīng)過了專門優(yōu)化的電源管理器件,兩者協(xié)同工作,更是能夠充分發(fā)揮出各自的性能優(yōu)勢,進(jìn)而構(gòu)成一款滿足設(shè)計要求的完整AI電源系統(tǒng)解決方案。
首先,得益于Maixm的耦合電感專利技術(shù),MAX16602能夠?qū)㈤_關(guān)頻率降低50%,從而降低功率損耗,實(shí)現(xiàn)更高的效率。同時MAX20790單芯片集成方案消除了FET和驅(qū)動器之間的寄生電阻和寄生電感,也對效率的提升很有幫助。
其次,MAX20790采用單片集成和先進(jìn)的90nm封裝技術(shù),自身的小型化優(yōu)勢就很明顯;而且與競爭方案相比,芯片組輸出電容的尺寸減小了40%,進(jìn)一步有效降低了總體方案尺寸;此外,與采用分立式電感的競爭方案相比,Maxim的薄型耦合電感設(shè)計允許每相支持較高的飽和電流,有助于減少電源的工作相數(shù),優(yōu)化系統(tǒng)體積并降低總體成本。多因素綜合影響,使得采用MAX16602和MAX20790芯片組實(shí)現(xiàn)的8相PWM方案的電路板布局寬度僅有50mm,而每相的峰值額定電流可高達(dá)88A。
再有,MAX16602可提供內(nèi)部補(bǔ)償和先進(jìn)的控制算法,包括自主切相,以及可以對每一路PWM進(jìn)行精細(xì)地調(diào)整、實(shí)現(xiàn)瞬態(tài)相電流平衡的正交電流再均衡技術(shù);而MAX20790的相電流導(dǎo)引功能,也可以對熱優(yōu)先級與正交電流平衡進(jìn)行補(bǔ)償,以實(shí)現(xiàn)更佳的熱性能。
總之,在上述各個特性的共同作用下,基于MAX16602和MAX20790的電源芯片組,可以打造出高密度、高效率、小尺寸、可裁剪的AI電源解決方案。
方案的快速評估
如果你希望快速上手,將MAX16602和MAX20790電源芯片組應(yīng)用在AI系統(tǒng)中,解決AI應(yīng)用中的電源管理“短板”,MAX16602CL8評估套件是一個不可或缺的工具。
MAX16602CL8評估套件是一塊完全裝配并經(jīng)過測試的電路板,板上包括一顆MAX16602和八顆MAX20790,以及評估該芯片組所需的其他元器件,可產(chǎn)生8路PWM控制信號或相信號。這些元器件構(gòu)成了一個8相同步降壓轉(zhuǎn)換器,可以將這款A(yù)I多相供電電源芯片組的特性全面、直觀地呈現(xiàn)在開發(fā)者的面前。
圖5:MAX16602CL8評估套件
最后總結(jié)一下:伴隨著AI應(yīng)用的部署和落地,高性能、高算力AI系統(tǒng)的電源管理也面臨著新的挑戰(zhàn),整個系統(tǒng)留給AI電源設(shè)計的空間越來越有限,因此在極其有限的空間內(nèi)如何提高功率密度成為設(shè)計的關(guān)鍵。為適應(yīng)AI系統(tǒng)的這一要求,打造全新的電源管理解決方案勢在必行。
Maxim的MAX16602和MAX20790電源芯片組就是這一趨勢推動下的成功之作,其能夠?yàn)镚PU、FPGA、ASIC和xPU等AI硬件加速器供電,有效提高工作效率、減小方案尺寸,滿足不同應(yīng)用場景下不同設(shè)計規(guī)格的要求。
現(xiàn)在,來貿(mào)澤電子,你就可以便捷地獲取到MAX16602CL8評估套件,馬上體驗(yàn)這一創(chuàng)新的電源管理方案如何為你創(chuàng)新的AI應(yīng)用提供有力的支撐。
原文標(biāo)題:應(yīng)對AI系統(tǒng)電源管理挑戰(zhàn),來看看Maxim的“芯”思路!
文章出處:【微信公眾號:貿(mào)澤電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4778瀏覽量
72126 -
AI
+關(guān)注
關(guān)注
87文章
30896瀏覽量
269089 -
電源芯片
+關(guān)注
關(guān)注
43文章
1095瀏覽量
77065
原文標(biāo)題:應(yīng)對AI系統(tǒng)電源管理挑戰(zhàn),來看看Maxim的“芯”思路!
文章出處:【微信號:貿(mào)澤電子,微信公眾號:貿(mào)澤電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論