半導(dǎo)體消耗的功率會(huì)產(chǎn)生熱量,必須從器件中去除熱量,但如何有效地做到這一點(diǎn)是一個(gè)越來(lái)越大的挑戰(zhàn)。
熱量是半導(dǎo)體的廢物。它是在設(shè)備中和電線上的功率耗散時(shí)產(chǎn)生的。當(dāng)設(shè)備切換時(shí)會(huì)消耗電力,這意味著它依賴于活動(dòng),并且功率不斷被不完善的設(shè)備和電線浪費(fèi)。設(shè)計(jì)很少是完美的,一些熱量來(lái)自執(zhí)行不需要的功能的活動(dòng)。但在某些時(shí)候,設(shè)計(jì)團(tuán)隊(duì)必須弄清楚如何擺脫熱量,因?yàn)槿绻麄儾贿@樣做,產(chǎn)品的使用壽命將非常短。
只有三個(gè)過(guò)程控制著熱量的傳遞——傳導(dǎo)、對(duì)流和輻射。簡(jiǎn)單來(lái)說(shuō),傳導(dǎo)適用于固體,對(duì)流適用于液體和氣體,輻射適用于真空,這在半導(dǎo)體中很少。
“熱量有三個(gè)步驟,”Ansys半導(dǎo)體部門(mén)營(yíng)銷總監(jiān)Marc Swinnen說(shuō)。“有生產(chǎn)、傳導(dǎo)和耗散。你產(chǎn)生熱量,你把它傳導(dǎo)到某個(gè)地方,然后消散它。功率分析告訴您熱量的產(chǎn)生位置。傳導(dǎo)和耗散是一種物理分析,包括流體學(xué)。這三者都必須包含在系統(tǒng)分析中,因?yàn)樗鼈冎g存在反饋。
隨著晶體管密度的增加,這變得更加困難。“大多數(shù)人都可以改變導(dǎo)電路徑,”Cadence 多物理場(chǎng)系統(tǒng)分析小組攝氏熱求解器產(chǎn)品工程師 Karthick Gopalakrishnan 說(shuō)。“有可能改進(jìn)材料和設(shè)計(jì)本身,通過(guò)散熱設(shè)備的傳導(dǎo)帶走更多的熱量。有一個(gè)挑戰(zhàn),因?yàn)槌俏覀兪褂么笮头?wù)器,否則這些設(shè)備周?chē)臒峥臻g非常小。您必須考慮材料改進(jìn),智能地利用芯片、封裝或 PCB 周?chē)臒峥臻g。你真正想做的是提高你的傳導(dǎo)傳熱率。
如果不進(jìn)行適當(dāng)?shù)姆治觯瑑H僅在設(shè)備上放置一個(gè)大散熱器就會(huì)導(dǎo)致額外的問(wèn)題。要做到這一點(diǎn),需要考慮氣流及其所在空間的機(jī)械設(shè)計(jì),以便考慮對(duì)其他設(shè)備的影響。
即使是散熱器也有局限性。“有很多方法可以消除系統(tǒng)中的熱量,例如強(qiáng)制液體冷卻,”Synopsys EDA Group 產(chǎn)品管理總監(jiān) William Ruby 說(shuō)。“我們看到一些更先進(jìn)的封裝取得了許多進(jìn)步。借助 3D-IC 設(shè)計(jì),可以實(shí)現(xiàn)強(qiáng)制氣流和液體冷卻。有一些更新的概念,能夠通過(guò)特殊的通孔來(lái)減輕熱量,以幫助傳播熱量。
與導(dǎo)體和絕緣體之間存在數(shù)量級(jí)差異的電導(dǎo)率不同,導(dǎo)熱性在某種程度上受到限制。“硅的電導(dǎo)率為每米開(kāi)爾文 (W/(m x K) 100 至 120 瓦,作為導(dǎo)熱材料還不錯(cuò),”Siemens Digital Industry Software 旗下 Simcenter 產(chǎn)品組合電子和半導(dǎo)體行業(yè)總監(jiān) John Parry 說(shuō)。“銅只有400,而銅通常被用作經(jīng)濟(jì)上最好的熱導(dǎo)體。
還有其他經(jīng)濟(jì)考慮。“數(shù)據(jù)中心的主要成本驅(qū)動(dòng)因素不是散熱方法的成本,而是管理數(shù)據(jù)中心級(jí)傳熱的運(yùn)營(yíng)成本,”Arm 系統(tǒng)集成與開(kāi)發(fā)研究員兼高級(jí)總監(jiān) Javier DeLaCruz 說(shuō)。“進(jìn)入數(shù)據(jù)中心的電力量是有限的,這些電力在為計(jì)算系統(tǒng)供電和提取熱量之間共享。因此,每瓦性能必須是衡量指標(biāo),而不僅僅是性能。
熱量會(huì)對(duì)性能產(chǎn)生重大影響。“即使遵循最佳散熱策略,每個(gè)芯片在電路運(yùn)行期間也會(huì)以不同的方式發(fā)熱,從而降低性能,”Keysight EDA 產(chǎn)品經(jīng)理 How-Siang Yap 說(shuō)。“動(dòng)態(tài)溫度可以改變器件的電氣特性,如增益、阻抗和負(fù)載牽引失配,以及更高級(jí)別的波形特性,如數(shù)字調(diào)制信號(hào)射頻電路中的誤差矢量幅度(EVM)和鄰道漏電比(ACLR)。在模擬系統(tǒng)中,沖擊損失可能更高。
分析并不容易。Ansys的Swinnen表示:“當(dāng)今的芯片非常復(fù)雜,很難定義如何創(chuàng)建活動(dòng)來(lái)顯示最壞的情況。“當(dāng)你看到由溫度引起的計(jì)時(shí)誤差時(shí),你看到的是納秒,最多幾微秒。其次,電參數(shù)和熱參數(shù)的時(shí)間常數(shù)非常不同,至少兩個(gè)數(shù)量級(jí)。當(dāng)你得到開(kāi)花的熱量時(shí),它會(huì)慢慢地通過(guò)芯片和隔壁消散,所以你會(huì)看到熱量增加,因?yàn)閮擅腌娗霸诟舯诮謪^(qū)發(fā)生的事情。
芯片
內(nèi)的熱量分布 熱量?jī)A向于向各個(gè)方向傳播。“你無(wú)法真正阻止熱量蔓延到任何地方,”西門(mén)子的帕里說(shuō)。“你可以哄騙它,但它與電氣世界非常不同,在電氣世界中,導(dǎo)體和絕緣體之間的電導(dǎo)率差異可能是20、21個(gè)數(shù)量級(jí)。在電氣上,你可以讓電流流向你想要的地方,但在熱上,你真的不能。
由于熱量取決于活動(dòng),因此芯片表面的溫度不恒定、均勻分布。“你可能有一個(gè)熱點(diǎn),由設(shè)計(jì)的計(jì)算密集型部分創(chuàng)建,比如硬件加速器,”Synopsys的Ruby說(shuō)。“芯片的另一部分可能不太活躍,或者只用于特定的操作模式。芯片上的溫度梯度取決于工作負(fù)載或活動(dòng)。
散熱在理論上很簡(jiǎn)單,但在實(shí)踐中卻要困難得多。“你希望通過(guò)盡可能多地將熱量分散到任何層來(lái)最大限度地減少熱點(diǎn),”Cadence 的 Gopalakrishnan 說(shuō)。“你必須考慮東西放在哪里。將某些東西移動(dòng)到模具的邊緣并不總是可行的,因?yàn)樵谀抢锬悴粫?huì)讓熱量向一個(gè)方向擴(kuò)散。
雖然你可能無(wú)法控制熱量,但你可以理解它是如何傳播的。“如果你對(duì)流過(guò)芯片上電線的電流進(jìn)行建模,并觀察由此產(chǎn)生的熱通量,那么在它們合并在一起之前,它不會(huì)走得太遠(yuǎn),”P(pán)arry說(shuō)。“你可以看看溫度曲線,這并沒(méi)有真正顯示出走線和它們之間的絕緣體之間的差異。如果您查看溫度曲線,您將幾乎無(wú)法檢測(cè)到金屬痕跡的位置。但如果你看一下熱通量,金屬中的熱通量比絕緣體中的熱通量高出幾個(gè)數(shù)量級(jí)。
這讓事情變得容易一些。“在對(duì)很多這些東西進(jìn)行建模時(shí),它使事情變得更容易,”P(pán)arry補(bǔ)充道。“你可以得到相當(dāng)準(zhǔn)確的結(jié)果,而不是對(duì)芯片表面的單個(gè)導(dǎo)線、金屬化層進(jìn)行建模,而只是使用平均的材料屬性,這是一件非常普遍的事情。”
一種有效的技術(shù)是利用熱感知的樓層規(guī)劃和單元放置。“基本思想是進(jìn)行放置以最小化峰值溫度和溫度梯度,”Ruby說(shuō)。“使用物理感知的 RTL 功耗分析工具,您可以分析初始布局,然后將該功耗曲線數(shù)據(jù)輸入到熱分析中。也就是說(shuō),從基于最終簽核或完成的物理實(shí)施進(jìn)行分析向左移動(dòng),這可能為時(shí)已晚,無(wú)法開(kāi)始更改宏觀平面圖。我們還可以查看通孔密度、凸塊密度和不同的金屬密度等因素。
對(duì)于 3D-IC,TSV 已被討論為創(chuàng)建熱走廊的一種方式。“更好的 TSV 放置會(huì)有所幫助,”Gopalakrishnan 說(shuō)。“但這是有限度的,因?yàn)樗鼈兇_實(shí)占用了寶貴的房地產(chǎn)。在平面規(guī)劃方面,無(wú)論是在芯片層面,還是在芯片層面,無(wú)論是在討論瓷磚、電源塊或功能單元時(shí),還是在嘗試添加 TSV 的路由層面,都有很大的潛力。對(duì)他們來(lái)說(shuō),最大的優(yōu)勢(shì)之一是,當(dāng)你在靠近芯片或電源的地方工作時(shí),你可以瞄準(zhǔn)熱點(diǎn)。
但影響是有限的。“它們?cè)谀撤N程度上被用作熱走廊,但如果你認(rèn)為它們是銅,它們的導(dǎo)電性只有它們所穿過(guò)的硅的四倍,”帕里說(shuō)。“考慮一個(gè) 10×10 的單元,每個(gè)角落都有一個(gè) TSV。這是 4/100。由于 TSV 的電導(dǎo)率僅為它們所通過(guò)的硅的四倍,因此芯片的有效電導(dǎo)率可能增加了 16%。它在熱上沒(méi)有太大的影響,雖然它們確實(shí)有幫助,但它不是靈丹妙藥。
另一種新興技術(shù)是背面供電。“背面電源有助于供電,但使散熱更具挑戰(zhàn)性,”DeLaCruz 說(shuō)。“塊狀硅以前是局部散熱的絕佳機(jī)制,現(xiàn)在已經(jīng)從大約800微米的厚度發(fā)展到只有一微米的厚度,這使得局部熱點(diǎn)更難管理。TSV 并沒(méi)有使熱管理更容易,它們只是讓它變得不同,因?yàn)?TSV 以一種非常局部的方式提供幫助,并且僅在垂直于晶體管的軸上提供幫助。TSV周?chē)难趸镆r里也阻礙了橫向熱能耗散。
3D 增加了新的熱問(wèn)題。“如果你想到模具之間的膠層,這是很常見(jiàn)的,它們的目的是將模具機(jī)械地固定在一起,”P(pán)arry說(shuō)。“你需要一定的厚度。否則,芯片之間互連的剪切力太高,并且會(huì)出現(xiàn)電氣破損。不幸的是,與硅芯片相比,這些膠層是一種相對(duì)較軟的材料,并且往往具有相對(duì)較低的導(dǎo)熱性。您需要在熱和機(jī)械之間進(jìn)行權(quán)衡。在熱學(xué)上,您希望該層盡可能薄,以使通過(guò)該層的熱傳導(dǎo)盡可能有效。從機(jī)械上講,你希望有一個(gè)厚層,因?yàn)檫@樣可以讓你承擔(dān)兩個(gè)模具之間位移的不匹配,而中間的材料剪切相對(duì)較少。
芯片
外部的熱量分布 熱量可以通過(guò)封裝頂部逸出,然后可能進(jìn)入散熱器,或者通過(guò)底部和它所連接的PCB逸出。“如果你有一個(gè)塑料包覆成型的BGA,那么你將把絕大多數(shù)(80%到90%)的熱量投入到電路板中,”P(pán)arry說(shuō)。“如果你有一個(gè)包裝,有一個(gè)非常好的傳導(dǎo)路徑到蓋子,你可能會(huì)安排80%到90%的熱量以這種方式傳播。您可以控制它,具體取決于您采取的打包方法,但不能完全控制它。有些人總是走另一條路。
您希望熱量流向何處是特定于應(yīng)用的。“在服務(wù)器中,軟件包周?chē)泻芏嗫臻g可以利用,”Gopalakrishnan說(shuō)。“你傾向于用主動(dòng)或被動(dòng)散熱器來(lái)填充它,以及有助于散發(fā)大量熱量的風(fēng)扇。PCB本身不會(huì)在散熱方面發(fā)揮重要作用。當(dāng)您使用移動(dòng)設(shè)備時(shí),這不是一個(gè)解決方案,因?yàn)榭赡艽蠹s一半的熱量通過(guò)底部,其余一半到達(dá)頂部。在這種情況下,PCB將在將熱量從芯片上散發(fā)出來(lái)方面發(fā)揮重要作用。
當(dāng)空間有限時(shí),它變得更加困難。“根據(jù)具體市場(chǎng)的不同,有不同的方法可以實(shí)現(xiàn)這一目標(biāo),”Arm 的 DeLaCruz 說(shuō)。“例如,在智能手機(jī)中,石墨或石墨烯薄膜等高導(dǎo)電薄膜的使用很普遍,因?yàn)橄到y(tǒng)中的體積最小且散熱有效。在基礎(chǔ)設(shè)施領(lǐng)域,使用主動(dòng)和被動(dòng)3D均熱板可以運(yùn)行到數(shù)百瓦的功率范圍內(nèi)。
液體冷卻是另一種可能性。“對(duì)流是我們最近看到很多進(jìn)展的地方,”Gopalakrishnan說(shuō)。“你有風(fēng)扇、液體冷卻和兩相系統(tǒng)。我們還擁有先進(jìn)的系統(tǒng),例如數(shù)據(jù)中心級(jí)別的浸沒(méi)式冷卻。你會(huì)看到很多設(shè)計(jì)工程師和制造設(shè)備和系統(tǒng)的公司的路線圖,他們正在將液體冷卻作為路線圖的一部分。這是因?yàn)椋绻皇窃谠O(shè)備上添加一個(gè)散熱器并期望它冷卻,那么當(dāng)您的散熱量超過(guò)每平方米 1 千瓦時(shí),它就會(huì)達(dá)到該限制。使用風(fēng)扇,每平方米約 10 千瓦。但是現(xiàn)在我們有每平方米1兆瓦的先進(jìn)服務(wù)器設(shè)備芯片。你真的必須探索這些策略。
不是每個(gè)人都認(rèn)為它會(huì)很快被采用。“雖然我們預(yù)計(jì)液體冷卻將發(fā)生在超級(jí)計(jì)算集群等專業(yè)部署中,但它不太可能廣泛扎根,”Ampere Computing產(chǎn)品副總裁Madhu Rangarajan說(shuō)。“對(duì)于芯片設(shè)計(jì)人員來(lái)說(shuō),在創(chuàng)造新技術(shù)時(shí),必須考慮到實(shí)際的基礎(chǔ)設(shè)施限制,并與系統(tǒng)設(shè)計(jì)人員和數(shù)據(jù)中心設(shè)計(jì)人員合作,推動(dòng)他們進(jìn)行廣泛部署。我們預(yù)計(jì),未來(lái)五年部署的大多數(shù) CPU 仍將需要以有效的 TCO 方式進(jìn)行風(fēng)冷。
模型和分析
熱可能是第三方小芯片市場(chǎng)的絆腳石之一,因?yàn)樾⌒酒枰獰崮P汀!皢蝹€(gè)小芯片實(shí)際上不能彼此孤立地設(shè)計(jì),”P(pán)arry說(shuō)。“每個(gè)人都需要了解其鄰居模具上的熱源。在開(kāi)發(fā)這些高密度先進(jìn)封裝設(shè)計(jì)時(shí),需要更多的協(xié)作。這些東西的開(kāi)發(fā)方式必須改變,以使設(shè)計(jì)易于處理。
創(chuàng)建模型并不簡(jiǎn)單。“在芯片熱模型中,有很多事情是你真的不想透露的,”Gopalakrishnan說(shuō)。“有人試圖以降階模型的形式添加自熱效應(yīng)、芯片的熱阻特性,或者某種近似值,不一定涉及知道芯片中存在的每一個(gè)幾何細(xì)節(jié)的人。目前,其中一些芯片模型就是這樣生成的。
工具也需要改變。“3D-IC的世界是綜合模型的世界,需要進(jìn)行基于模型的分析,”Ruby說(shuō)。“你不能像我們今天那樣把所有事情都做平。在單芯片上,我們?cè)诰W(wǎng)表級(jí)別進(jìn)行時(shí)序簽核和電源簽核。在3D-IC環(huán)境中,它可能變得不切實(shí)際,因此我們需要開(kāi)始研究對(duì)各種組件進(jìn)行建模。
最終,它將設(shè)計(jì)和包裝結(jié)合在一起。“您需要將芯片設(shè)計(jì)工作流程與封裝設(shè)計(jì)工作流程相結(jié)合,”P(pán)arry說(shuō)。“你不能把它們看作是先于另一個(gè)發(fā)生的,即芯片被交給一個(gè)封裝組,特別是在3D-IC中。但它在某種程度上適用于2.5D。挑戰(zhàn)在于采用我們所擁有的仿真技術(shù)類型,這種技術(shù)傳統(tǒng)上由封裝工程師使用,可能來(lái)自機(jī)械背景,并將其作為IC設(shè)計(jì)流程的一部分提供給進(jìn)行IC驗(yàn)證的人員。他們可能不習(xí)慣使用機(jī)械工程師使用的工具集。這是一個(gè)采用技術(shù)并重新包裝的案例,以便需要在設(shè)計(jì)流程中使用它的人可以使用它。
結(jié)論
許多芯片面臨熱障,解決問(wèn)題并不容易。“不幸的是,熱是集成密度的限制因素,”Swinnen說(shuō)。“我們可以設(shè)計(jì)和制造令人難以置信的芯片,只是它們會(huì)熔化。這不是制造限制,也不是設(shè)計(jì)限制。這是一個(gè)物理限制,我們無(wú)法獲得更多的熱量。
雖然在某些應(yīng)用中可以使用異國(guó)情調(diào)的解決方案,但大多數(shù)市場(chǎng)必須找到事半功倍的方法,這意味著每瓦特的功能更多。與此相關(guān)的成本比過(guò)去的解決方案要大得多。
審核編輯:黃飛
-
芯片設(shè)計(jì)
+關(guān)注
關(guān)注
15文章
1026瀏覽量
54969 -
晶體管
+關(guān)注
關(guān)注
77文章
9734瀏覽量
138688 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4844瀏覽量
72289 -
BGA
+關(guān)注
關(guān)注
5文章
549瀏覽量
46968 -
射頻電路
+關(guān)注
關(guān)注
35文章
430瀏覽量
43342
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論