非必要的消耗代價越來越高。
每隔幾年,就會推出新一代的計算機處理器。很長一段時間以來,CPU 似乎都保持著相同的功率水平,而 GPU 只增加了相對較小的數量。但如今,似乎所有供應商發布的高端機型都是需要大量功率的機型。
CPU是 250W,GPU是 450W ,這些是不是太高了?制造商關心這個嗎?在本文中,我們將揭開散熱片,看看功率數據背后的真相,看看到底發生了什么。
CPU 和 GPU 被歸類為超大規模集成電路 (VLSI) ,是晶體管、電阻器和其他電子元件的巨大集合,所有這些都是微觀尺寸。
這種芯片需要電流通過它們才能執行它們設計的任務。算術邏輯單元通過切換大量晶體管來執行數學運算,以改變電路中其他地方的各種電壓。
現代處理器使用一種稱為 FinFET(Fin 場效應晶體管)的晶體管。可以將它們想象成兩個島嶼之間的橋梁,在其中施加小電壓會降低道路,從而使電流從一個地方流向另一個地方。
顯然,這涉及通過島嶼和橋的電流,因此需要電力,如果沒有它,芯片根本不會做任何事情。但是為什么它們會變熱呢?
不幸的是,所有這些組件都對這種電流產生了阻力。實際數量確實很小,但考慮到 CPU 和 GPU 中的晶體管數量達到數十億,累積效應非常明顯。
指尖上的三十億個晶體管。
一個典型的 CPU 可能只有十幾毫歐的總內阻,但是一旦它有 80A 或更大的電流流過它,由于電阻而耗散的能量將超過每秒 90 焦耳(或瓦特,W)。
這種能量被轉移到構成整個芯片的材料上,這就是為什么每個處理器在工作時都會變熱的原因。大芯片需要主動冷卻,以防止它們的溫度升得太高,因此所有這些熱量都需要轉移到其他地方。
還有其他因素會影響散熱量,例如電流泄漏,但如果處理器正在“損失”能量(以熱量的形式),它將需要不斷地“消耗”能量以保持功能正常。
換句話說,損失的熱量與芯片的額定功率幾乎相同。因此,讓我們先來看看中央處理器,看看它們的功率需求這些年來是如何變化的。
CPU 功率數據背后的隱藏真相
多年來,CPU 供應商一直通過一個簡單的數字來說明其處理器的功耗:熱設計功耗或 TDP。不幸的是,隨著芯片設計的發展,這個數字已經經歷了各種定義。
英特爾目前的定義是:
“在制造過程中,處理器在基頻和最高結溫下執行英特爾指定的高復雜性工作負載時,經驗證不會超過時間平均功耗”。
換句話說,如果英特爾 CPU 的基本頻率為 3.4 GHz,最高溫度為 95 °C (203 °F),那么只要芯片在這些限制下運行,其額定功率將等于 TDP。
那么讓我們來看看過去 17 年 CPU 的一些例子。在此期間,我們采用了每年發布的最耗電的臺式機型號,而忽略了針對工作站等的型號。
除了一些孤立的案例,例如 2013 年的 AMDFX-9590(TDP 為 220W),CPU 的功率要求似乎非常一致。
唯一的問題是市場上幾乎每個 CPU 都可以以遠高于其基本頻率的速度運行。上面提到的 FX-9590 的基礎頻率為 4.7 GHz,但可以將時鐘頻率提高到 5.0 GHz。那么會發生什么呢?
你可能會認為這是一個簡單的答案:它會消耗更多的功率,從主板吸取更多的電流。不幸的是,情況并非總是如此,因為這取決于主板的 BIOS 中啟用了哪些設置。
英特爾和 AMD 都有許多選項,所有選項都可以激活或停用(取決于 BIOS 中是否有選項),讓 CPU 管理自己的功率和頻率。
堅持使用英特爾一段時間后,實現這一目標的主要系統被稱為Turbo Boost Technology。拋開 1980 年代風格的名稱不談,它的作用是主動控制 CPU 在給定負載下在一定時間內可以消耗多少功率。
英特爾的 CPU 通常有兩個這樣的功率限制,PL1(又名 TDP)和 PL2。
請注意橙色功率曲線如何在一定時間內飆升至顯著高于 PL1 的水平并升至 PL2。在這里,CPU 在其基本頻率之上運行,但不一定以其最大時鐘頻率運行。
由于英特爾默認禁用 PL3 和 PL4,我們可以將 PL2 作為 CPU 的實際最大功耗——它可能只有幾秒鐘(或者取決于 BIOS 設置,它可以永遠這樣運行),但它仍然是可能的最高功率。
那么PL2比PL1高多少呢?這個值隨著每個新的處理器型號而波動,但讓我們看看上面 TDP 圖表中最近幾年的值。
七年前,在酷睿 i7-8700K之類的產品中,PL1 和 PL2 之間只有 30W 的差異,但現在已經超過 100W——在某些情況下,功率需求實際上翻了一番。
AMD 沒有使用與英特爾相同的標簽和定義,但它們的 CPU 也可以消耗比 TDP 限制更多的功率。
上限以封裝功率跟蹤 (PPT) 形式給出——CPU 在任何給定負載下可以消耗的最大功率。對于 TDP 為 95W 或更高的所有 Ryzen 臺式機處理器,PPT 等于 1.34 x TDP。
所以現在有一點很清楚:盡管 TDP 相對靜態,但在過去幾年中,高端 CPU 的絕對最大功率要求肯定有所提高。
不過,主板供應商通過覆蓋英特爾的默認功率限制和時間限制,并在 BIOS 中設置自己的值,使事情變得更糟。換句話說,一個主板上的 CPU 可能最大功率為 120W,但在另一個主板上達到 200W。
我們應該在這一點上進行評估,因為到目前為止顯示的所有數據都是針對高端型號的——那些具有最高時鐘速度和最多內核數量的型號。
幸運的是,中端和預算 CPU 的變化很小,僅僅是因為它們的內核總是比顯示停止器少得多。
在臺式機 CPU 市場的低端,英特爾流行的Core i3-12100F的 TDP 為 58W(PL2 為 89W),而 AMD 的 Ryzen 3 4100 的 TDP 為 65W——幾乎與那些相同產品線一直如此。
然而,AMD 最新的中端Ryzen 7600X的 TDP 為 105W,比其前身 5600X 高出 40 倍。而英特爾的酷睿i5-12600K擁有高端芯片的TDP:125W。
所有這些都表明功耗明顯下降,主要是高端機型,但并非完全如此。如果你想要一個擁有最多內核數和最高時鐘速度的 CPU,那么隨之而來的是巨大的能源需求。
不幸的是,那些想要升級到最新的中檔產品的人也可能不得不接受顯著的能源漲價。
GPU
在 CPU 在功率方面相當溫和的情況下,即使考慮到最近最大限制的提高,臺式 PC 中的一個芯片隨著每一代的更新而變得更大和更饑餓。就晶體管的數量、芯片尺寸和處理能力而言,圖形處理芯片 (GPU) 是迄今為止大多數人將擁有的最大、最復雜的半導體設備。
今天游戲中的圖形保真度達到了 17 年前只能夢想的規模,但相比之下,所有這些多邊形、紋理和像素的功耗成本讓 CPU 看起來很輕巧。
在這張圖表中顯示了每年從頂級供應商那里獲取對功耗要求最高的消費級顯卡。
AMD 的Ryzen 9 7950X之類的產品可能會達到 230W 的最高功率,但近 15 年前高端 GPU 正在消耗這種功率水平。
正如圖表所示,幾乎沒有跡象表明最強大的顯卡需要更高功率的趨勢將完全下降,因為兩家供應商的趨勢顯然沒有下降,盡管相關性不是很強。
隨著英偉達推出GeForce RTX 4090,擁有 760 億個晶體管和 450W TDP 的芯片,這一標準有了顯著的飛躍。
那么 GPU 供應商真的根本不關心電源要求嗎?
上圖顯示了與以前相同的芯片在每平方毫米芯片中封裝的晶體管數量與顯卡的 TDP 的關系。
管芯密度標度是對數的,因為近年來密度發生了巨大飛躍——線性標度會將幾乎所有數據點打包到一個小區域中。
我們可以看到,隨著 GPU 將越來越多的納米級開關封裝到其電路中,功率需求穩步上升,但不是以恒定的方式(是的,AMD 線看起來很直,但請記住對數標度)。
非線性趨勢都在增加,但增長率本身每年都在下降。這種密度和 TDP 之間的模式取決于供應商發布的新芯片,這些芯片是在改進的工藝節點上制造的。
這是半導體代工廠用來制造芯片的制造方法的名稱。每個新節點都比其前身提供了多種優勢:更高的密度、更低的功耗、更好的性能等等。
較新的工藝節點是 GPU 擁有數十億個晶體管的原因。
并非所有這些改進都可以同時應用,但在 GPU 的情況下,它允許供應商創建真正巨大的處理器,具有出色的數字處理水平,以滿足合理的功率要求。
例如,如果 Navi 21 使用與 R520 相同的節點制造,則所需的功率將很好地運行到 kW 區域。因此,雖然現在的能量水平相當高,但它們可能會更糟。
新工藝節點和 GPU 設計帶來的好處不僅僅是降低功率水平。
自 2006 年第一個統一著色器模型出現以來,所有高端 GPU 的每單位功率計算能力幾乎一直以驚人的速度增長。
如果采用上述數據,自 2006 年以來 TDP 的平均增長為 102%,而 FP32 性能功耗比的增長則達到了驚人的 5700%
雖然 FP32 處理吞吐量不是顯卡的決定性質量,但它是游戲和 3D 圖形最重要的功能之一。我們今天只有具有令人難以置信的圖形和功能的游戲,因為最好的 GPU 變得更大更復雜。
盡管圖形處理器比以往任何時候都好,而且它們的功率水平實際上并沒有想象中那么糟糕,但它們的能耗水平仍在上升。即使是通常使用 30W 或更低功率的超預算 GPU,在過去幾年中 TDP 也出現了顯著增長。
如果一個人希望購買一張英偉達顯卡,它可以僅通過 PCI Express 插槽吸取其所有電流,那么實際上需要跳過整個 Ampere 庫存。GeForce RTX 3050的TDP 為 100W,由于插槽的限制為 75W,因此需要額外的電源連接器。
這樣的顯卡擁有比以往更強大的處理能力,但對于想要構建超低功耗系統的人來說,在顯卡方面可供選擇的選擇越來越少。
而且似乎沒有任何跡象表明電力需求的增長會放緩,更不用說下降了。例如,英特爾最新進軍顯卡市場的 Arc 系列,目前以 A770 為首。
這張卡的芯片擁有 214 億個晶體管,16GB GDDR6,TDP 為 225W。雖然它針對的是中端市場,但這種電力需求與四年前 AMD 和英偉達最大的芯片相同。
對于中端 GeForce 和 Radeon 卡來說稍微好一些,RTX 3060需要 170W,RX 6600 XT需要 160W,但所有領域的能源需求都在上升,遠遠超過 CPU。
如果不是為了更好的工程,需求顯然會高得多,但這里真正需要回答的一個重要問題是 CPU 和 GPU 是否需要太多的功率來提供它們所提供的功能。
多少是太多了?
關于 CPU 和 GPU 電力需求上升的兩個最常見的抱怨是電力成本和產生的熱量——讓我們先來看看前者。
假設你有一臺規格非常高的游戲 PC,里面裝滿了金錢可以負擔得起的一些最好的組件。讓我們還假設你使用的是 AMDRyzen 9 5950X,由輕度超頻的英偉達GeForce RTX 3090 Ti支持。
當然,其中也會有其他部件(至少,主板、一些 RAM 和存儲驅動器),但我們可以將它們放在一邊,因為它們的綜合能耗將遠低于 CPU 或 GPU .那么,在一些忙碌的游戲中,這臺 PC 需要什么樣的能力呢?670W到700W聽起來怎么樣?
現在想象一下,一年中的每一天,你每天都以這種方式使用PC 2 小時。PC 消耗的能量約為 500 kWh (0.7 x 2 x 365) - 相當于不間斷地運行 1.5 kW 電熱水壺近兩周。
根據世界上的居住地以及電費支付的費率,每年使用此類 PC 的費用可能在 70 到 280 美元之間(不包括稅費和額外費用)。
但與PC本身的總成本幾千美元相比,這是一個相對較小的數額。取較高的值并計算每小時游戲的電費僅相當于每小時 0.38 美元。
英偉達的新GeForce RTX 4090的 TDP 為 450W
在最壞的情況下,計算機具有你現在可以獲得的最耗能的 CPU 和 GPU 組合(上面的卡和 Intel 的Core i9-13900K),兩者都在其最高默認功率限制下運行,但仍然只需花費大約每小時 0.50 美元,用于相同的游戲程序。
你可能會爭辯說,每小時 50 美分的游戲費用太高了,而對于全世界數百萬人來說,這幾乎可以肯定是正確的。但他們一開始不太可能擁有這樣的 PC。
就每年的出貨量而言,家用游戲機比游戲 PC 更受歡迎,并且它們包含的硬件功能遠不如上面給出的示例。但在功率需求方面,像微軟的 Xbox Series X 這樣的東西在活躍游戲期間只會消耗 153W 。
即使考慮到可能會再增加 100W 功率的大型 OLED 電視,這兩款設備的能耗實際上也比單獨的 GeForce RTX 4090 少 44% 。因此,如果電力成本是一個真正的問題,那么游戲機是游戲的一個很好的選擇。
當然,并不是說你需要使用最新或最強大的 PC 部件來享受游戲。有很多舊的或中檔的組件沒有過高的功率需求,但仍然可以提供很多性能。
二手的 Radeon RX 5700 XT、GeForce RTX 2060 Super,甚至 GeForce GTX 1080 Ti 顯卡還是很能干的,三款 TDP 都在 250W 或更低。
簡而言之,純粹因為電力成本而增加電力是一個問題的論點在某種程度上是沒有實際意義的——在很大程度上取決于當地的電力單位價格、游戲習慣等,無法最終解決這樣的問題。辯論。
但是熱量呢?
正如本文開頭所提到的,幾乎每一焦耳的電能最終都會以熱量的形式消散,主要通過對流機制傳遞到環境中。
如果它使用電,它將散發熱量。
理論上,一臺輸出 900W 的計算機可以在短短 17 分鐘內將 1000 立方英尺(28 立方米)空氣的溫度從 20°C/68°F 提高到 40°C/104°F。這自然假設了完美的熱傳遞和完美的絕緣,更熱的空氣沒有移動到所討論的體積之外。
雖然它實際上不會那么快,但實際上,所有熱量最終仍會轉移到 PC 的周圍環境中,無論轉移的速度如何。
冷卻風扇,無論數量或性能如何,都不會改變這一點,因為它們只會幫助降低組件的溫度。緩解環境熱量上升的唯一方法是讓受熱的空氣通過例如窗戶開口移動到其他地方。
如果計劃在你能獲得的最強大的 CPU 和 GPU 上花費一大筆錢,那么請做好準備,因為它們會將大量熱能傾倒到你的游戲室中。
900W 的熱量對一個人來說可能是一個長期問題,但對另一個人來說完全沒問題。
多數人的需求大于少數人的需求
因此,對熱量輸出和電力成本的擔憂似乎是非常個別的問題。然而,當在全球范圍內擴展時,這一切都變得更加重要。
那里有數百萬臺 PC,雖然封裝 250W+ 芯片的區域數量相對較少,但最終所有這些機器都將被配備比現在更高功率需求的組件的計算機所取代。
要了解這一點,請考慮一下估計全球已售出1700 萬臺 Xbox Series X和 5000 萬臺 Xbox One 游戲機。前者比后者使用大約 90W 的功率。
如果我們假設所有這些舊設備都被新設備取代,那就是額外的 3GW 累積電力需求,并最終消散了熱量。顯然,這些機器不會同時運行,但所需的額外能量并不是這個控制臺獨有的。
隨著筆記本電腦、臺式機、工作站和服務器的新處理器問世,它們都將需要更多的能量,無論是幾瓦還是一百瓦。這反過來意味著能源行業將面臨對其供應能力越來越高的需求。
由于人口和經濟增長,無論如何都會出現這種情況,但半導體功率的增長只會使問題變得更加復雜。
即使考慮到 PC 銷量多年來的下降,也有其他行業正在做相反的事情:物聯網 (IoT)、人工智能 (AI) 和大數據分析都顯示出大量生長。
人工智能和大數據使用大量高端 GPU 來執行所需的計算,如果這些機器的新組件沒有顯示出緩和其電力需求的跡象,那么這些行業只會讓能源狀況變得更糟。
一些人估計,到 2050 年,全球范圍內的電力需求將是現在的 3 倍,每年增長 3% 到 4%。目前尚不清楚這些估計是否是處理器能耗增加的原因, 盡管。
自 2005 年以來,預計全球電力產量已從 18 PWh(1 PWh = 1,000,000 GWh)上升到 2021 年的 28 PWh——僅 16 年就增長了 56%。而這種增長完全是因為需求增加。半導體使用量的增長只會在未來幾十年增加。
那么,如果有的話,可以做些什么呢?
作為個人,你可以嘗試很多方法來降低最大 PC 組件的功率需求。對于 CPU,大多數主板在 BIOS 中都有多種電源選項,這將迫使處理器在空閑時降低其能耗。
高級配置和電源接口(ACPI) 早在 1996年就出現在臺式計算機中,此后一直在不斷更新。現在,所有消費類 CPU 都具有符合 ACPI 的特性,并且在功耗方面,有兩個值得注意的特性:P 狀態和 C 狀態。
前者是指處理器處于何種性能狀態,在BIOS中啟用時,可使芯片以較低的頻率和電壓運行,以節省能源。C 狀態做類似的事情,但控制 CPU 能夠做什么(例如,在緩存中維護數據或將其完全刷新),同時以較低功率要求的格式運行。
對于 AMD 較新的 Ryzen 處理器(3000 系列以上),在其Ryzen Master軟件中啟用 Eco 模式將強制處理器以顯著降低的 TDP 運行,而與啟用的任何 ACPI 選項無關。
根據所使用的系統和測量的性能指標,使用較低功率值的影響可能非常小。
根據所使用的系統和測量的性能指標,使用較低功率值的影響可能非常小。對于英特爾 CPU 的用戶,可以通過深入研究 BIOS 設置并尋找內部 CPU 電源管理來實現類似的功能(并非所有型號都有)。
在本節中,PL1 和 PL2 的值可以設置為低于默認值,盡管它們更有可能以不同的名稱列出。例如,華碩對 PL1/PL2 使用長/短包持續時間限制。
可以使用MSI Afterburner等軟件以同樣的方式調整顯卡。此應用程序可以控制卡的最大功率限制,設置為百分比,并且可以輕松降低該數字。
例如,Nvidia 的RTX 2080 Super的 100% 功率限制為 250W。將其降至 70% 會將 GPU 的功耗限制為 175W。當然,這也會降低顯卡的性能,但就像銳龍生態模式一樣,影響并沒有你想象的那么大。
類似的事情可以通過降低 GPU 的核心電壓來實現,這反過來通常也需要降低時鐘頻率。或者,如果游戲提供了限制幀速率的選項,將其固定在較低的值也會降低功率需求。
但是為了簡單起見,通過使用簡單的滑塊來調整功率限制是無法擊敗的。
我們使用上述顯卡(RTX 2080 Super)和英特爾酷睿 i7-9700K使用古墓麗影之影進行了一些快速測試。游戲的分辨率設置為 4K,所有圖形細節設置為最大值,啟用了 DLSS 質量模式,但禁用了光線追蹤。
最大可用功率降低 50% 只會導致平均幀速率降低 10%(1% Low 值下降不到 5%),這似乎令人難以置信,但同樣值得注意的是,這款游戲的高 CPU 負載。
DLSS 的使用當然也有助于這項測試,因為游戲以比呈現的分辨率低得多的分辨率渲染,但 GPU 只會嘗試以更快的速度渲染,并且仍然達到其功率限制。
顯然,不同的游戲和硬件設置會產生與上述不同的結果,但在Red Dead Redemption 2(1440p,最高質量)中,功率限制降低 50% 會導致平均幀速率降低 15%,而對于Far Cry 6的 FPS 下降僅為 7%。
所以所有這一切都可能引出一個簡單的問題——為什么硬件供應商將功率限制設置得如此之高,而這似乎是不必要的?
最可能的原因與營銷和產品狀態有關。AMD、英特爾和英偉達需要他們的模型盡可能清晰地區分,特別是在范圍的光環末端。
這些產品應該是你能買到的最好的產品,所以使用的芯片將從分箱過程中選擇,如果有足夠的功率,這些芯片可以以最高時鐘速度運行。
但這可能會導致類似 GeForce RTX 3090 Ti 的情況——它的 TDP 比 3090 高 100W(高出 29%),但即使在 4K 下,我們的測試也只顯示它在游戲中快 10% 左右.
由于所有主要供應商都希望銷售為他們制造的每一種可能的芯片,因此“好幾個百分點”的模型不會消失,但設計人員當然可以降低功率需求。
硬件廠商需要做得更好
AMD 等供應商大力宣傳其產品的每瓦性能方面,并且通常將其用作關鍵賣點。例如,對于他們的下一個桌面 GPU 架構 RDNA 3,改進預測是可觀的。但是,這并不意味著 Radeon RX 7000 系列顯卡的 TDP 會突然降低很多。
對于 RDNA 2,AMD 強調它的每瓦性能比之前的架構提高了 65%。然而,Radeon RX 6800 的 TDP 仍然是 300W。
我們自己的測試驗證了 AMD 聲稱的每單位功率性能大幅提高的說法,但這仍然不能削弱渲染能力的提高需要額外的能量來滿足這一事實。
有人可能會爭辯說,供應商應該更容易降低其產品的電力需求,甚至可能讓它們在默認情況下以某種“生態模式”運行。
制造商可能會說他們已經這樣做了,其形式是讓他們的芯片在各種時鐘級別(例如 Turbo 模式、升壓時鐘、游戲時鐘)上運行,并讓它們在空閑時顯著降低電壓。
但當英特爾推出第 12 代酷睿臺式機 CPU 時,新聞稿中充斥著性能聲明,但只有一個部分敢于提及功率。
全新的 CPU 設計在同一個芯片中混合了兩種不同的架構,顯然是對等效的第 11 代模型的改進。如上圖所示,英特爾本可以將 TDP 設置為 95W,將 PL2 設置為 125W,并且仍然能夠擁有更高的性能。
相反,他們保留了與以前相同的數字,只是將 PL2 值降低了 10W。這一切都是為了讓產品在某些測試中比競爭對手快一點。
當然,你不必購買這些芯片,但是當需要進行升級或只是購買全新的計算機或游戲機時,你幾乎沒有選擇接受這些耗電的產品,因為舊型號沒有生產時間更長。
雖然調整 CPU 和 GPU 的功率限制相對容易,但可以說這是最終用戶不應該做的事情。
可以說,太多的半導體制造商陷入了一種似乎與當今世界格格不入的思維模式——擁有盡可能高的性能,幾乎不惜一切代價在競爭中脫穎而出。
不過,隧道盡頭有一些光亮。例如,Apple 已將其幾乎整個 Mac 和 MacBook 產品線轉移到使用自己的M1/M2 處理器。這些 CPU+GPU 組合處理器旨在盡可能節能,性能與 AMD 和 Intel 的 x86 產品相當,但功耗需求顯著降低(游戲除外)。
服務器和工作站通常仍配備 Intel Xeon 或 AMD Epyc 處理器,但 Apple 使用的高能效 Arm 架構也正在向該領域擴展。大型云提供商正在用一些由 Ampere 的Altra 模型提供支持的服務器替換他們的服務器。
改變即將到來,我們可能還需要很多年才能看到推出的新處理器的能耗要求低于其前任產品,但該行業正在朝著這一目標邁進。
與此同時,在個人層面上,我們可以做出一個簡單的選擇:接受最新硬件的電力需求并按原樣使用它們(調整或不調整某些設置),或者用我們的錢包投票,讓供應商知道數百個瓦特的功率太高了,無法支付。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
19387瀏覽量
230556 -
cpu
+關注
關注
68文章
10891瀏覽量
212459 -
計算機
+關注
關注
19文章
7525瀏覽量
88360 -
晶體管
+關注
關注
77文章
9723瀏覽量
138621 -
TDP
+關注
關注
0文章
18瀏覽量
6893
原文標題:CPU 和 GPU 是否變得過于耗能?
文章出處:【微信號:ICViews,微信公眾號:半導體產業縱橫】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論