與第三代EPYC 7003系列處理器相比,新一代EPYC 9004系列處理器有大量的技術(shù)進(jìn)步,主要包括核心數(shù)量、計(jì)算線程數(shù)大幅提升到最高96核心、192線程;5nm“Zen 4”架構(gòu)帶來(lái)了標(biāo)稱14%的IPC性能提升;AVX-512指令集的加入;雙CPU互聯(lián)可以最多對(duì)外提供160條PCIe 5.0總線;12通道DDR5內(nèi)存系統(tǒng)則讓服務(wù)器的內(nèi)存性能突飛猛進(jìn)(注:如果您想深入了解新一代EPYC 9004系列處理器的具體技術(shù)架構(gòu)、產(chǎn)品組成,請(qǐng)閱讀我們?cè)诮裉彀l(fā)布的第二篇文章:《第四代AMD EPYC處理器先進(jìn)技術(shù)指南》)。那么在實(shí)際測(cè)試與應(yīng)用中,它的性能究竟能有多少提升呢?在此背景下,我們特別針對(duì)第四代AMD EPYC(霄龍)9004系列處理器進(jìn)行了獨(dú)家測(cè)試。
參測(cè)處理器規(guī)格解析
《微型計(jì)算機(jī)》評(píng)測(cè)室本次對(duì)AMD EPYC 9654、EPYC 9554、EPYC 9374F這3款處理器進(jìn)行了詳細(xì)測(cè)試。其中EPYC 9654處理器是第四代EPYC處理器中定位最高的產(chǎn)品,雖然它的最高加速頻率在所有產(chǎn)品中不算高,只有3.7GHz,但它卻擁有多達(dá)96核心、192條線程,384MB三級(jí)緩存。相對(duì)64核心的產(chǎn)品,其TDP熱設(shè)計(jì)功耗也沒有上升太多,為360W,與EPYC 9554這類高頻64核心處理器相同。更值得一提的是,AMD EPYC 9654支持組建雙路系統(tǒng),為用戶打造192核心、384線程多核心的超多核心計(jì)算系統(tǒng)創(chuàng)造了條件,對(duì)那些亟需多線程運(yùn)算性能的渲染與模擬、科學(xué)仿真用戶頗具吸引力。
而第二款A(yù)MD EPYC 9554是一款兼具頻率與核心數(shù)量的處理器,它采用64核心、128線程設(shè)計(jì),能夠滿足各類服務(wù)器應(yīng)用。之所以它的TDP熱設(shè)計(jì)功耗與AMD EPYC 9654相同,原因就在于它擁有更高的基準(zhǔn)頻率,從 EPYC 9654的2.4GHz提升到3.1GHz,全核心加速頻率也從3.55GHz提升到3.75GHz。它既適用于那些對(duì)頻率有較高依賴的應(yīng)用,也能滿足各類多線程計(jì)算應(yīng)用的需求。
我們測(cè)試的第三款A(yù)MD EPYC 9374F處理器有所不同,其型號(hào)帶有“F”,采用這種命名方式的主要目的是突出它擁有更高的單核心基頻及最高加速頻率,其基準(zhǔn)頻率就超過(guò)前面兩款處理器的最高加速頻率,為3.85GHz,單核心最高加速頻率可達(dá)4.3GHz,全核心加速頻率達(dá)到4.1GHz。這意味著該處理器很適合進(jìn)行3D建模與與AEC(建筑、工程、施工)可視化等依賴處理器頻率的各類應(yīng)用,同時(shí)其核心、線程數(shù)也不少,擁有32核心、64線程配置,也能從事渲染、科學(xué)運(yùn)算之類的工作。
▲AMD EPYC 9654、EPYC 9554、EPYC 9374F都采用接近正方形的外觀設(shè)計(jì),相比上代EPYC處理器面積更大。
為了更直觀地體現(xiàn)第四代EPYC 9004系列處理器的進(jìn)步,我們還采用第三代AMD EPYC處理器中綜合性能最強(qiáng)的EPYC 7763參與了測(cè)試,EPYC 7763采用Zen 3處理器架構(gòu),7nm工藝打造,基于64核心128線程設(shè)計(jì),基準(zhǔn)頻率為2.45GHz,Boost頻率最高為3.5GHz,TDP為280W,支持8通道DDR4 3200內(nèi)存。在參測(cè)處理器中,AMD EPYC 7763的技術(shù)規(guī)格最接近AMD EPYC 9554,所以請(qǐng)大家特別注意EPYC 9554與EPYC 7763的差異,這也最能體現(xiàn)新一代處理器的進(jìn)步所在。
我們?nèi)绾螠y(cè)試
本次測(cè)試統(tǒng)一考察的是雙路系統(tǒng)的性能,因此所有參測(cè)的三款第四代EPYC 9004系列處理器都統(tǒng)一使用了AMD Titanite SP5 2P2U雙路主板。內(nèi)存方面,EPYC 9004系列單路CPU支持12個(gè)內(nèi)存通道,比EPYC 7003系列處理器增加了4個(gè)內(nèi)存通道,其中1DPC(DIMM Per Channel,每通道內(nèi)存數(shù)量)支持12根內(nèi)存,2DPC支持24根內(nèi)存;EPYC 9004雙路系統(tǒng)則支持24個(gè)內(nèi)存通道,不過(guò)由于受限于機(jī)架和機(jī)箱寬度,雙路服務(wù)器只能支持1DPC 24根內(nèi)存。本次測(cè)試所使用的內(nèi)存為三星DDR5 4800 64GB,內(nèi)存總數(shù)量為24根,內(nèi)存總?cè)萘繛?.5TB,搭配美光9300系列企業(yè)級(jí)NVMe SSD。
而基于Zen 3架構(gòu)的EPYC 7763雙路系統(tǒng)則采用AMD DAYTONA_X主板、三星 DDR4 3200 32GB內(nèi)存,總數(shù)量為16根,內(nèi)存總?cè)萘繛?12GB,搭配三星PM883企業(yè)級(jí)SSD。接下來(lái)我們?cè)赨buntu 22.04操作系統(tǒng)下,特別采用考察處理器浮點(diǎn)與整數(shù)性能、內(nèi)存性能,以及壓縮、光線追蹤、科學(xué)仿真等十大專業(yè)軟件、13個(gè)子項(xiàng)項(xiàng)目對(duì)四款處理器的性能進(jìn)行了全面測(cè)試。
▲本次測(cè)試統(tǒng)一考察的是雙路系統(tǒng)的性能,第四代EPYC 9004系列處理器采用了AMD Titanite SP5 2P2U雙路主板,12通道、24條內(nèi)存配置。
第四代AMD EPYC處理器雙路系統(tǒng)測(cè)試平臺(tái)一覽
處理器:EPYC 9654 ×2
EPYC 9554×2
EPYC 9374F×2
內(nèi)存:三星DDR5 4800 64GB×24
主板:AMD Titanite(BIOS版本:RT1003F)
硬盤:美光9300系列企業(yè)級(jí)NVMe SSD
操作系統(tǒng):Ubuntu 22.04
第三代AMD EPYC 7763雙路系統(tǒng)測(cè)試平臺(tái)一覽
處理器:EPYC 7763×2
內(nèi)存:三星 DDR4 3200 32GB×16
主板:AMD DAYTONA_X(BIOS版本:RYM1007C)
硬盤:三星 PM883
操作系統(tǒng):Ubuntu 22.04
性能測(cè)試:SPECrate 2017
SPECrate 2017 測(cè)試的是在單位時(shí)間內(nèi)運(yùn)行的實(shí)例數(shù)量,這是服務(wù)器采購(gòu)時(shí)的主要性能指標(biāo),所以服務(wù)器廠商和處理器廠商通常提供的是這一測(cè)試成績(jī)。在SPECrate 2017 中包含SPECrate Integer 和SPECrate Floating Point,前者測(cè)試的是整型并發(fā)性能,后者測(cè)試的是浮點(diǎn)并發(fā)性能。
首先我們關(guān)注了EPYC 9554與EPYC 7763在雙路配置性能上的對(duì)比。測(cè)試成績(jī)顯示盡管兩款雙路系統(tǒng)的核心數(shù)、線程數(shù)都為128核心、256線程配置,但使用新架構(gòu)、DDR5內(nèi)存,工作頻率也更高的EPYC 9554在測(cè)試成績(jī)上有非常顯著的提升,其浮點(diǎn)運(yùn)算性能較上一代產(chǎn)品提升了高達(dá)90.2%,整數(shù)運(yùn)算性能也提升了多達(dá)62.2%。
同時(shí)更為驚人的是,即便核心、線程數(shù)更少的EPYC 9374F雙路系統(tǒng)(64核心、128線程)也戰(zhàn)勝了核心、線程數(shù)翻倍的AMD EPYC 7763雙路系統(tǒng)。我們分析主要原因在于一是EPYC 9374F處理器的工作頻率大大提升,其全核心加速頻率可達(dá)4.1GHz,較EPYC 7763領(lǐng)先900MHz,可以有力彌補(bǔ)在處理器核心數(shù)上的不足。二是使用了新的Zen 4處理器核心,即便在同頻率下,Zen 4處理器的IPC性能較Zen 3處理器都有14%的性能提升;三是AMD第四代EPYC 9004系列處理器的雙路系統(tǒng)可以使用升級(jí)了規(guī)格的4條Infinity Fabric總線連接兩顆處理器,其理論傳輸帶寬最高可達(dá)PCIe 5.0 x64即256GB/s,較上代產(chǎn)品使用的PCIe 4.0 x64即128GB/s傳輸帶寬翻倍,可以更通暢、充分地傳輸兩款處理器之間的互聯(lián)數(shù)據(jù),不會(huì)存在數(shù)據(jù)傳輸瓶頸,從而能更高效地發(fā)揮出兩顆處理器的最大計(jì)算性能;四還是帶寬助力,AMD第四代EPYC 9004系列處理器采用的是12通道DDR5 4800內(nèi)存系統(tǒng),其每路理論內(nèi)存帶寬也比第三代EPYC使用的8通道DDR4 3200內(nèi)存系統(tǒng)要大得多,從而也能更好地發(fā)揮出新處理器的運(yùn)算性能。
接下來(lái)讓我們?cè)倏纯垂肢F級(jí)系統(tǒng):采用192核心、384線程的EPYC 9654雙路系統(tǒng)的性能表現(xiàn)。憑借更多的計(jì)算核心與線程數(shù),它的表現(xiàn)肯定是最優(yōu)的,其整數(shù)性能相對(duì)于EPYC 9554雙路系統(tǒng)又領(lǐng)先了多達(dá)30.9%,浮點(diǎn)運(yùn)算性能領(lǐng)先了16.4%。雖說(shuō)可能由于軟件優(yōu)化有限,無(wú)法充分發(fā)揮出384條計(jì)算線程的最大威力,但可以肯定的是,如果應(yīng)用場(chǎng)景需要更強(qiáng)大的多線程運(yùn)算性能,EPYC 9654就是最佳選擇。
性能測(cè)試:Stream-Triad
Stream是業(yè)界廣為流行的綜合性內(nèi)存帶寬實(shí)際性能測(cè)量工具之一。和硬件廠商提供的理論最大內(nèi)存帶寬不同,通過(guò)fortran、C兩種高級(jí)且高效的語(yǔ)言編寫完成的Stream,可以在測(cè)試中充分發(fā)揮出內(nèi)存的能力。Stream一共包含Copy、Scale、Add 和Triad 這4種操作,其中Triad組合了前面3種操作,所以其測(cè)試成績(jī)更具參考價(jià)值。
從測(cè)試結(jié)果可以看到,由于參測(cè)的AMD第四代EPYC 9004系列處理器每一路采用的是規(guī)格大幅提升的12通道DDR5 4800內(nèi)存系統(tǒng),相對(duì)于第三代EPYC 7763每一路系統(tǒng)采用的8通道DDR4 3200在單路內(nèi)存帶寬在規(guī)格上就有大幅提升(460.8GB/s VS. 204.8GB/s),因此最終在實(shí)際測(cè)試上,AMD第四代EPYC 9004系列處理器雙路系統(tǒng)在內(nèi)存性能上也取得了壓倒性的勝利。三款第四代EPYC處理器的內(nèi)存帶寬最低成績(jī)也有741062.959MB/s,相對(duì)于EPYC 7763處理器雙路系統(tǒng)的內(nèi)存性能領(lǐng)先多達(dá)99.2%。
性能測(cè)試:7-ZIP壓縮性能
7-Zip是一款完全免費(fèi)而且開源的壓縮軟件,其大部分代碼都是基于GNU LGPL協(xié)議編寫,部分代碼基于BSD 3-clause協(xié)議編寫。其壓縮性能測(cè)試主要考察處理器壓縮文件的速度,是一個(gè)支持多線程壓縮的測(cè)試,比較依賴處理器的整數(shù)運(yùn)算性能與內(nèi)存性能。
結(jié)果顯而易見,由于在壓縮應(yīng)用中內(nèi)存的性能也至關(guān)重要,只有內(nèi)存快速地傳輸需要壓縮的文件數(shù)據(jù)才能提升處理器的壓縮效率,因此每路采用12通道DDR5內(nèi)存的AMD第四代EPYC 9004系列處理器憑借高得多的內(nèi)存帶寬可以輕松地戰(zhàn)勝每路采用8通道DDR4內(nèi)存的EPYC 7763處理器。哪怕是雙路EPYC 9374F系統(tǒng),在核心總數(shù)和線程總數(shù)都比雙路EPYC 7763少一半的情況下,其壓縮性能也比EPYC 7763領(lǐng)先了18.1%。而在第四代EPYC處理器中,由于7-ZIP也是一款支持多線程壓縮性能的測(cè)試,所以核心、線程數(shù)更多的192核心、384線程的EPYC 9654雙路系統(tǒng)擁有更好的表現(xiàn),其壓縮速度比128核心、256線程配置的EPYC 9554雙路系統(tǒng)快了100616MIPS。
性能測(cè)試:NAMD
NAMD 是一種并行的分子動(dòng)力學(xué)代碼,由伊利諾伊大學(xué)厄巴納- 香檳分校貝克曼高級(jí)科學(xué)與技術(shù)研究所的理論和計(jì)算生物物理學(xué)小組開發(fā),它主要用于大型生物分子系統(tǒng)的高性能模擬。本次測(cè)試中,我們主要通過(guò)NAMD來(lái)考察參測(cè)處理器的浮點(diǎn)性能。
結(jié)果與之前的測(cè)試類似,憑借Zen 4架構(gòu)、更高的工作頻率、更強(qiáng)的內(nèi)存與傳輸總線配置,同為128核心、256線程配置的EPYC 9554雙路系統(tǒng)比EPYC 7763雙路系統(tǒng)快了44.4%,領(lǐng)先幅度非常明顯。其實(shí)即使是64核心、128線程配置的EPYC 9374F雙路系統(tǒng)在這一測(cè)試中也就比7763雙路系統(tǒng)僅僅慢了0.47%,差距非常小,這也進(jìn)一步突出了AMD第四代EPYC 9004系列處理器也有效提升了處理器的單核心性能,使得更少核心的處理器就能媲美上一代旗艦產(chǎn)品。而頂級(jí)的192核心、384線程EPYC 9654雙路系統(tǒng)依然擁有最好的表現(xiàn),其執(zhí)行速度比128核心、256線程配置的EPYC 9554雙路系統(tǒng)還快了43%,優(yōu)勢(shì)很大。就如我們前面所說(shuō),在科學(xué)仿真類應(yīng)用中,是能夠發(fā)揮出處理器多線程運(yùn)算性能的。
性能測(cè)試:OpenSSL
OpenSSL廣泛用于保護(hù)服務(wù)器之間的通信,這是許多服務(wù)器堆棧中的重要協(xié)議。OpenSSL測(cè)試主要包含生成簽名和驗(yàn)證簽名兩部分,我們?cè)诒敬未藭r(shí)中主要進(jìn)行了OpenSSL生成簽名測(cè)試。
測(cè)試結(jié)果顯示,OpenSSL測(cè)試顯然是一個(gè)非常依賴處理器多線程運(yùn)算性能的測(cè)試,不同核心數(shù)、線程數(shù)配置的雙路系統(tǒng)在成績(jī)上都有顯著的區(qū)別。如擁有192核心、384線程的EPYC 9654雙路系統(tǒng)在簽名效率上比128核心、256線程配置的EPYC 9554雙路系統(tǒng)快了47.6%。而EPYC 9554雙路系統(tǒng)的簽名效率又比64核心、128線程配置的EPYC 9374F雙路系統(tǒng)快了多達(dá)74%。當(dāng)然處理器架構(gòu)、工作頻率上的不同也可以在OpenSSL生成簽名測(cè)試上拉開差距,如EPYC 7763雙路系統(tǒng)與EPYC 9554雙路系統(tǒng)雖然都為128核心、256線程配置,但后者的簽名效率比前者快了28.8%,Zen 4架構(gòu)的優(yōu)勢(shì)顯而易見。
性能測(cè)試:UnixBench Dhrystone 2和Whetstone
本項(xiàng)目主要用于測(cè)試Unix系統(tǒng)性能,其中包括測(cè)試字符串處理,體現(xiàn)整數(shù)性能的Dhrystone 2 using register variables和測(cè)試雙精度浮點(diǎn)操作速度與效率的Double-Precision Whetstone 這兩個(gè)測(cè)試項(xiàng)目。此外,在這兩個(gè)測(cè)試項(xiàng)目均可選用單線程或多線程進(jìn)行測(cè)試,本次測(cè)試我們使用的是多線程。
測(cè)試結(jié)果與SPECrate 2017類似,首先EPYC 9554雙路系統(tǒng)在體現(xiàn)整數(shù)性能的Dhrystone 2 using register variables上領(lǐng)先EPYC 7763雙路系統(tǒng)高達(dá)63.4%,在雙精度浮點(diǎn)性能運(yùn)算上也領(lǐng)先了19.9%,作為兩個(gè)處理器核心數(shù)量、線程數(shù)相同的雙路系統(tǒng),第四代EPYC 9004系列處理器的進(jìn)步得到了充分體現(xiàn)。值得一提的是,64核心、128線程配置的EPYC 9374F雙路系統(tǒng)也再次展現(xiàn)了單核心性能大幅增加的實(shí)力,其整數(shù)性能只落后EPYC 7763雙路系統(tǒng)約2.3%,要知道它的處理器核心數(shù)量可是比后者少了64顆。而192核心、384線程的EPYC 9654雙路系統(tǒng)繼續(xù)壓倒群雄,其整數(shù)性能、雙精度浮點(diǎn)性能分別領(lǐng)先EPYC 9554雙路系統(tǒng)達(dá)29.7%、44.6%。
性能測(cè)試:C-ray 1.1
C-ray 是一種常用的光線追蹤基準(zhǔn)測(cè)試,可以顯示多線程工作負(fù)載下處理器的差異,時(shí)間越短說(shuō)明系統(tǒng)性能越強(qiáng)。在本次測(cè)試中,我們使用了4K和8K這兩種分辨率進(jìn)行測(cè)試,從而對(duì)比參測(cè)系統(tǒng)在不同負(fù)載下的性能差異。
從測(cè)試來(lái)看,在普通4K分辨率下,可能由于工作負(fù)載不是太大,EPYC 9654與EPYC 9554雙路系統(tǒng)平臺(tái)并未拉開差距,耗時(shí)相同。不過(guò)與上一代EPYC 7763雙路系統(tǒng),以及核心數(shù)少得多的EPYC 9374F雙路系統(tǒng)相比,它們還是具備明顯優(yōu)勢(shì)。其中EPYC 7763雙路系統(tǒng)的耗時(shí)比EPYC 9654與EPYC 9554雙路系統(tǒng)多了59.5%,EPYC 9374F雙路系統(tǒng)的耗時(shí)則比它們多了50%。
而在工作負(fù)載更大的8K分辨率下,四個(gè)參測(cè)系統(tǒng)就都拉開了差距,192核心、384線程的EPYC 9654雙路系統(tǒng)相對(duì)于128核心、256線程配置的EPYC 9554雙路系統(tǒng)優(yōu)勢(shì)明顯,后者耗時(shí)比前者多了28.6%。而相同核心數(shù)、線程數(shù)的上一代EPYC 7763雙路系統(tǒng)在測(cè)試耗時(shí)上又比EPYC 9554多了17.7%。核心數(shù)、線程數(shù)最少的EPYC 9374F雙路系統(tǒng)墊底。這充分體現(xiàn)出在執(zhí)行高分辨率光線追蹤應(yīng)用時(shí),用戶應(yīng)盡可能選擇采用新架構(gòu)、新工藝設(shè)計(jì),核心線程數(shù)盡可能多的雙路處理器系統(tǒng)。
性能測(cè)試:Sysbench CPU
Sysbench是一款被廣泛使用的Linux 基準(zhǔn)測(cè)試,它可以對(duì)CPU進(jìn)行性能測(cè)試,在測(cè)試中主要是通過(guò)CPU進(jìn)行質(zhì)數(shù)加法運(yùn)算,質(zhì)數(shù)極限為10000 個(gè)。
同樣,這也是一個(gè)非常依賴處理器多核心運(yùn)算性能的測(cè)試,EPYC 9654雙路系統(tǒng)處于遙遙領(lǐng)先的地位,每秒可完成823134.4輪運(yùn)算,比EPYC 9554多了35.8%。而EPYC 9554雙路系統(tǒng)則憑借新架構(gòu)、更高的工作頻率比核心與線程數(shù)相同的上一代EPYC 7763雙路系統(tǒng)多了24.2%。值得一提的是,核心與線程數(shù)只有EPYC 7763雙路系統(tǒng)一半的EPYC 9374F雙路系統(tǒng)在該測(cè)試中也達(dá)到了前者的71.6%,顯然這同樣應(yīng)該歸功于AMD第四代EPYC 9004系列處理器擁有更強(qiáng)的單核心運(yùn)算性能,可以有效彌補(bǔ)這類處理器在核心數(shù)量上的不足。
性能測(cè)試:HPL
HPL的英文全稱為“High-Performance Linpack”,Linpack 是國(guó)際上一款用于測(cè)試高性能計(jì)算機(jī)系統(tǒng)浮點(diǎn)性能的基準(zhǔn)測(cè)試工具。通過(guò)對(duì)高性能計(jì)算機(jī)采用高斯消元法求解一元N次稠密線性代數(shù)方程組的測(cè)試,考量高性能計(jì)算機(jī)的浮點(diǎn)性能。值得一提的是,該測(cè)試支持AVX-512指令集,在支持AVX-512技術(shù)的硬件上,可以使用AVX-512指令集運(yùn)算來(lái)完成該測(cè)試。
相對(duì)于不支持AVX-512指令集,基于Zen 3架構(gòu)的EPYC 7763雙路系統(tǒng)來(lái)說(shuō),新一代EPYC處理器獲得了壓倒性的勝利。首先相同核心、線程數(shù)的EPYC 9554雙路系統(tǒng)在測(cè)試成績(jī)上領(lǐng)先了EPYC 7763雙路系統(tǒng)高達(dá)64.8%,即便是核心、線程數(shù)只有一半的EPYC 9374F雙路系統(tǒng)在該測(cè)試中也能達(dá)到EPYC 7763雙路系統(tǒng)性能的99.3%。而192核心、384線程的EPYC 9654雙路系統(tǒng)則一騎絕塵,相對(duì)于EPYC 7763雙路系統(tǒng)的領(lǐng)先幅度可以達(dá)到驚人的101.9%。AMD第四代EPYC 9004系列處理器能有如此大領(lǐng)先的根本原因就在于Zen 4架構(gòu)支持AVX-512指令集,Zen 3架構(gòu)不支持。而AVX-512即高級(jí)向量擴(kuò)展512位指令集可以借助寬度達(dá)到512bit的數(shù)據(jù)寄存器,以及大量專用指令,提升處理器在一條指令中處理多個(gè)數(shù)據(jù)點(diǎn)的能力,所以就能在科學(xué)模擬、金融分析、人工智能 (AI) /深度學(xué)習(xí)、圖像和音頻/視頻處理、密碼學(xué)和數(shù)據(jù)壓縮等支持AVX-512指令集的應(yīng)用中獲得更快的處理能力。
性能測(cè)試:DGEMM
DGEMM是我們此次加入的一個(gè)新測(cè)試,它是一個(gè)基于雙精度矩陣乘法例行程序的快速基準(zhǔn)測(cè)試,可計(jì)算以下乘積:C←αAB+βC。其中A、B和C是包含雙精度浮點(diǎn)值的矩陣,而α和β是標(biāo)量。AMD的開源DGEMM基準(zhǔn)使用了AOCL 4.0的AMD BLIS組件,其結(jié)果最終會(huì)反饋出一個(gè)Gflops值,該值將接近于可實(shí)現(xiàn)的最大系統(tǒng)吞吐量。同樣這個(gè)測(cè)試也可以使用AVX-512指令集運(yùn)算,可以體現(xiàn)處理器在支持AVX-512指令集后的性能優(yōu)勢(shì)。
測(cè)試結(jié)果與HPL相比,可謂有過(guò)之而無(wú)不及,即便是64核心、128線程的EPYC 9374F雙路系統(tǒng)也能小勝不支持AVX-512指令集,128核心、256線程配置的EPYC 7763雙路系統(tǒng)。這充分說(shuō)明,處理器支持AVX-512指令集后,的確能在支持AVX-512指令集的軟件中實(shí)現(xiàn)處理器的運(yùn)算性能翻番,以一打二。對(duì)于需要使用AVX-512相關(guān)軟件的用戶而言,升級(jí)基于Zen 4架構(gòu)的AMD第四代EPYC 9004系列處理器顯然是非常有必要的,可以大幅提高生產(chǎn)力。其他方面,核心、線程數(shù)更多的EPYC 9554,EPYC 9654雙路系統(tǒng)自然有更強(qiáng)大的性能表現(xiàn),其中EPYC 9654雙路系統(tǒng)的算力突破8000GFLOPS,遠(yuǎn)超其他型號(hào)。
質(zhì)的飛躍!提升生產(chǎn)力與工作效率的利器
顯然,憑借新一代Zen 4架構(gòu)、對(duì)AVX-512指令集的支持、更高的工作頻率、更強(qiáng)大的12通道DDR5內(nèi)存配置,第四代EPYC 9004系列處理器在以上10大測(cè)試項(xiàng)目、13個(gè)測(cè)試小項(xiàng)中都大獲全勝,特別是均為128核心、256線程配置的EPYC 9554雙路系統(tǒng)在13個(gè)子項(xiàng)測(cè)試中相對(duì)于EPYC 7763雙路系統(tǒng)的最大領(lǐng)先幅度達(dá)到102%,最小領(lǐng)先幅度也有17.8%。其平均領(lǐng)先幅度高達(dá)51.1%,用質(zhì)的飛躍來(lái)形容毫不為過(guò),而這僅僅是在第三代EPYC發(fā)布一年后就獲得了如此大的進(jìn)步,可以證明第四代EPYC 9004系列處理器的確是一款在技術(shù)架構(gòu)設(shè)計(jì)、性能表現(xiàn)上非常成功的產(chǎn)品。
再來(lái)看看強(qiáng)大的性能怪獸EPYC 9654,我們認(rèn)為在所有測(cè)試將其他產(chǎn)品都遠(yuǎn)遠(yuǎn)甩在身后的192核心、384線程的EPYC 9654雙路系統(tǒng),在很長(zhǎng)一段時(shí)間內(nèi),都是不計(jì)成本,亟需性能的用戶首選之一。因?yàn)楦鶕?jù)目前的最新信息,第四代至強(qiáng)可擴(kuò)展處理器也只能提供最多56個(gè)核心,且采用的是8通道DDR5內(nèi)存配置。而在EPYC 9654之下,還有84核心、168線程的EPYC 9634,64核心、128線程的EPYC 9554、9534系列產(chǎn)品,第四代EPYC 9004系列處理器的高端產(chǎn)品在技術(shù)規(guī)格上相對(duì)于對(duì)手具有壓倒性的優(yōu)勢(shì)。至于像AMD EPYC 9374F這類核心數(shù)相對(duì)較少的第四代EPYC產(chǎn)品,它則是需要兼顧單核心性能或預(yù)算較少用戶的高性價(jià)比優(yōu)選。
總體來(lái)看,就像消費(fèi)級(jí)產(chǎn)品一樣,5nm生產(chǎn)工藝、Zen 4架構(gòu)、DDR5內(nèi)存的引入令第四代EPYC 9004系列處理器成為一款技術(shù)規(guī)格與性能得到大幅提升的產(chǎn)品。要知道由于周邊廠商進(jìn)度滯后的緣故,目前其支持PCIe 5.0 SSD、CXL內(nèi)存的能力還尚未發(fā)揮出來(lái),本次測(cè)試結(jié)果不能代表它的最終完全體狀態(tài),在不久的將來(lái),它還能給用戶更多的驚喜。所以可以預(yù)見,更具競(jìng)爭(zhēng)力的AMD第四代EPYC 9004系列處理器將繼續(xù)成為超融合基礎(chǔ)設(shè)施、云端應(yīng)用、數(shù)據(jù)分析、科學(xué)計(jì)算、HPC、內(nèi)容創(chuàng)建等專業(yè)領(lǐng)域的領(lǐng)先解決方案,為企業(yè)用戶提供卓越的性能、可靠的安全特性,并從容應(yīng)對(duì)各種復(fù)雜的IT挑戰(zhàn)。
審核編輯 :李倩
-
處理器
+關(guān)注
關(guān)注
68文章
19286瀏覽量
229843 -
amd
+關(guān)注
關(guān)注
25文章
5468瀏覽量
134162
原文標(biāo)題:一起來(lái)體驗(yàn)96核心、192線程CPU的強(qiáng)大威力——第四代AMD EPYC處理器獨(dú)家測(cè)試
文章出處:【微信號(hào):Microcomputer,微信公眾號(hào):Microcomputer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論