3D堆疊、多芯片封裝大家想必都不陌生了,這年頭制造工藝已經沒有太多噱頭,有時甚至性能提升也有限,廠商只好從架構上入手。像蘋果的UltraFusion拼接、Graphcore的3D WoW,都是在芯片設計廠商與晶圓廠強強聯合下的產物,我們今天要講的3D堆疊緩存也不例外。
96MB的超大3D V-Cache
把3D堆疊緩存先玩出來的不是別人,正是AMD。今年CES2022上公布的這款Ryzen7 5800X3D可以視為5800X的升級版,為原本的32MB 2D L3緩存加上了64MB的3D V-Cache緩存,使得總L3緩存達到了96MB。這種芯片堆疊方式與常見的C4和MicroBump不同,AMD用到了HybridBond3D技術,實現了更高的密度、更好的熱管理和更好的連接性。
3D V-Cache示意圖 / AMD
不過,AMD對Ryzen7 5800X3D的定義是一款“游戲CPU”,這意味著在一些高性能計算場景下不一定會獲得更好的性能,評測軟件跑分可能也不比英特爾12代酷睿i9、AMD Ryzen9 5900系列這些旗艦處理器,但游戲表現相當不俗。公布之際,AMD官方給出的FPS性能對比圖中,5800X3D與英特爾的i9-12900K在半數項目上持平,而半數項目上高出10%的性能,甚至超過了自家的Ryzen9 5900X。
Ryzen9 5900X與Ryzen7 5800X3D的性能對比 / AMD
近期,終于有搶跑的媒體展示了這塊處理器的游戲測試結果,測試對象為游戲《古墓麗影:暗影》。在720p分辨率的最高畫質選項下,5800X3D跑出了231FPS的成績,比英特爾的i9-12900K高出了21.58%。你可能會問為何要用如此低的分辨率來進行測試,這自然是為了消除GPU造成的影響,讓對比注重于純粹的CPU性能差異。
值得一提的是,測試結果中,5800X3D系統用到的是一塊3080Ti顯卡,而英特爾系統用到的是一塊性能更強的3090Ti顯卡,前者卻依然跑出了領先的層級,如此足見5800X3D在3D V-Cache加持下的實力了。
超算也能因此獲利?
除了這類高性能消費級處理器外,HPC也開始看上了3D堆疊緩存的潛力,比如AMD的Milan-X服務器CPU。與游戲場景一樣,更大的緩存可以為諸多核心HPC應用破除瓶頸。日本理化研究所(RIKEN)等一眾機構和學府的研究人員拿AMD了兩塊AMD的服務器CPU進行比較,一邊是256MB LLC的Milan,一邊是768MB LLC的Milan-X。從下圖可以看出,雖然隨著輸入變大優勢逐漸變小,但輸入規模較小時,大緩存占據了絕對的優勢。
Milan與Milan-X的性能對比 / RIKEN
這之后,幾位研究人員利用gem5模擬器,打造了兩種LARC處理器模型,均以1.5nm工藝打造,且都用到了大容量的3D堆疊緩存。這一處理器的設計參照了當下超級計算機之王富岳中A64FX核心,都是基于Armv8.2架構,只不過在1.5nm這樣的先進工藝下,可以看出面積優勢非常大,實現了近乎八倍的面積差異,如此一來核心數也從A64FX的12+1核堆上了32核。
A64FX和LARC的核心內存組對比 / RIKEN
A64FX的L2緩存并不算大,只有8MB,而他們設計的LARC處理器模型增加了3D堆疊的L2緩存,足足384MB的L2緩存相較前者有了48倍的提升。不過RIKEN提供的gem5模擬器僅僅支持2X大小L2緩存配置,所以就有了256MB和512MB的版本。為了更精準的對比,研究人員們也設計了32核的A64FX版本。
一半以上的測試應用中,單個512MBLARC處理器的核心內存組,要比A64FX高出兩倍以上的性能,而且這些提升中多半都歸功于3D堆疊緩存,并非只靠兩倍以上的核心數目。再結合面積上的優勢,針對這些緩存敏感的應用,單芯片的LARC處理器可以做到近10倍于A64FX的提升。不過這只是理論結果,畢竟現在既沒有1.5nm的工藝,也沒有基于芯片層級的實際測試對比,但確實為摩爾定律進展緩慢下的性能改進提供了另一個思路。
3D堆疊緩存的局限性
固然,這類3D堆疊的設計已經相當普遍了,但還有一個棘手的問題待設計者們優化,那就是散熱。面向堆疊緩存的CPU核心勢必會面臨著熱能蓄積,溫度升高而降低效能的情況,而且尋常的散熱手段面對這種內部積熱效果不佳。以AMD的3D V-Cache為例,雖然AMD巧妙地將堆疊緩存置于非計算核心上,但也只是略有緩解,L3緩存與3D V-Cache很可能也會面臨積熱的難題。
從最近的消息也可以看出一些端倪,AMD官方確認首個利用3D V-Cache技術的CPU,Ryzen7 5800X3D并不支持核心、緩存超頻或核心電壓調整,這還是建立在5800X3D本就比5800X頻率低上0.4GHz的基礎上。更重要的是,AMD技術營銷總監Robert Hallock指出,這項技術目前還不算成熟,他們也許會在未來推出可超頻的型號,但AMD的重心還是在可超頻的非3D堆疊緩存處理器上。
這就很好理解了,目前無論是工藝還是材料都沒有辦法很好地解決3D堆疊緩存的散熱問題,根據幾位HPC研究人員的推測,相關的制造工藝或在2028年才能成熟,屆時將先進到克服這一限制。不過在此之前,除了游戲外,3D堆疊緩存還不足以成為扭轉處理器市場的GameChanger,更像是一項“戰未來”的新技術。
-
芯片
+關注
關注
455文章
50832瀏覽量
423818 -
3D
+關注
關注
9文章
2880瀏覽量
107564 -
AMD處理器
+關注
關注
2文章
59瀏覽量
13004
發布評論請先 登錄
相關推薦
評論