紙面發(fā)布多日之后,AMD RX 6000系列顯卡今天終于開始解禁上市了,首發(fā)兩款型號,RX 6800 4599元,RX 6800 XT 5099元,下個(gè)月2號還會有旗艦級的RX 6900 XT 7999元。
首發(fā)評測請移步——RTX 3080出生兩個(gè)月卒!Radeon RX 6800/6800 XT首發(fā)評測
它們都采用了升級版的RDNA 2底層架構(gòu),均基于Navi 21 GPU核心,也常被叫做Big Navi,最多擁有80組計(jì)算單元、5120個(gè)流處理器、16GB GDDR6顯存,支持PCIe 4.0。
而在7nm工藝不變、核心規(guī)模翻番、頻率大幅提升的同時(shí),整卡功耗依然保持在最多300W。
本文中,我們重點(diǎn)講講RDNA 2的架構(gòu)設(shè)計(jì),以及兩項(xiàng)關(guān)鍵圖形技術(shù)。
RDNA 2雖然是RDNA架構(gòu)的更新版本,并不是完全重新設(shè)計(jì),但是它帶來的突破和提升是驚人的,也完全實(shí)現(xiàn)了項(xiàng)目起步之初設(shè)立的看似不可能的目標(biāo)。
這就是:16個(gè)月之內(nèi),性能提升1倍,能效提升至少50%,完整支持DX12 Ultimate等技術(shù)特性,支持硬件光線追蹤。
在微架構(gòu)上,RDNA 2充分借鑒了Zen CPU的世界級設(shè)計(jì)思路(消息稱Zen開發(fā)團(tuán)隊(duì)直接介入了RDNA 2設(shè)計(jì)),整體得以更加精煉、高效。
縱向比較的話,在同等功耗水平下,RDNA 2每個(gè)計(jì)算單元的運(yùn)行頻率提升了足足30%,標(biāo)稱加速頻率最高2250MHz,實(shí)際運(yùn)行中其實(shí)能夠跑到2450MHz!
橫向比較的話,在同等頻率下,RDNA 2每個(gè)計(jì)算單元的功耗可以降低50%,也就是省電一半。
以上是RDNA、RDNA 2兩代架構(gòu)圖,可以發(fā)現(xiàn)整體布局沒有太大變化,當(dāng)然各個(gè)功能模塊都是調(diào)整優(yōu)化過的,而最突出的,一是增加了獨(dú)立的Infinity Cache高速緩存,二是在每個(gè)計(jì)算單元內(nèi)加入了專用的光追加速器Ray Accelerator。
至于RDNA 2架構(gòu)的底層細(xì)節(jié),比如說計(jì)算單元的變化,AMD這次沒有給出更多資料,只是簡單提到了幾點(diǎn),包括精簡TLB以降低延遲、重新設(shè)計(jì)32位像素流水線并支持HDR格式、優(yōu)化幾何分派與曲面細(xì)分、全方位精細(xì)時(shí)鐘門控、頻率樹分離與門控、最小化數(shù)據(jù)轉(zhuǎn)移、重新平衡流水線、高性能庫等等,但沒有任何圖示。
不過也好,太深入太專業(yè)的東西咱們也鉆研不夠,直接享受成果就是了。
Infinity Cache高速緩存的加入,以及一二級緩存的調(diào)整,主要是為了解決RDNA 2架構(gòu)必須在核心數(shù)量翻番、頻率提升30%的情況下,不會受到帶寬不足的制約。
上一代的RDNA架構(gòu)中,零級緩存分布在每個(gè)計(jì)算單元中,一級緩存是每個(gè)著色器引擎獨(dú)享的,并單獨(dú)訪問二級緩存,4MB二級緩存則負(fù)責(zé)在著色器引擎、指令處理器之間共享數(shù)據(jù)。
RDNA架構(gòu)搭配的是256-bit GDDR6顯存,等效頻率14GHz,總帶寬為448GB/s,看起來不少,但核心規(guī)模急劇擴(kuò)大后,就會成為瓶頸。
GPU發(fā)展的傳統(tǒng)思路中,提升顯存帶寬的核心途徑就是擴(kuò)大位寬、提高頻率。RTX 3090就擁有384-bit 19.5GHz GDDR6X,帶寬高達(dá)936GB/s,AMD Fury、Vega系列顯卡還用過以高帶寬著稱的HBM,Radeon VII就達(dá)到了驚人的1TB/s。
但是,擴(kuò)大位寬會造成核心面積急劇擴(kuò)大、功耗急劇增加,HBM顯存則是成本高昂,還要與GPU整合封裝。
Smart Access Memory(SAM)顯存智取技術(shù)就是AMD提出的更高效的高帶寬解決方案,而且充分依托了AMD的平臺化優(yōu)勢。
NVIDIA雖然號稱也在研發(fā)類似的技術(shù),但沒有自己的CPU處理器做輔助,就有點(diǎn)像無根之水了。
RDNA 2為此集成了128MB大容量的Infinity Cache高速緩存,有點(diǎn)像銳龍/霄龍?zhí)幚砥髦械娜壘彺妫瑫r(shí)優(yōu)化各級緩存結(jié)構(gòu)的體系,還將二級緩存容量翻兩番達(dá)到16MB。
再結(jié)合AMD CPU/GPU通用的Infinity Fabric高速互連通道,支持16x64-bit通道,最高頻率1.94GHz,其帶寬是256-bit GDDR6顯存的幾乎4倍!
按照AMD的說法,Infinity Cache高速緩存結(jié)合256-bit GDDR6顯存,帶寬可以達(dá)到384-bit GDDR6顯存的多達(dá)2.17倍,而且還能節(jié)省10%的功耗——512-bit GDDR6或者4096-bit HBM也能帶來類似或者更高的帶寬,但是功耗和成本完全不可同日而語了。
與此同時(shí),平均顯存延遲也降低了足足34%。
再借助成熟的PCIe 4.0技術(shù)、自家平臺優(yōu)勢,銳龍5000處理器、RX 6000顯卡彼此搭配的時(shí)候,SAM技術(shù)可以將更多內(nèi)存空間映射到本地存儲地址寄存器中,讓處理器訪問顯卡全部容量的顯存,不再有任何限制,也徹底消除了帶寬瓶頸。
SAM技術(shù)加持后,不但帶寬瓶頸完全不存在,還有額外加成,官方宣稱可給RX 6800 XT帶來平均6%的游戲性能提升,最多超過10%。
在我們的實(shí)測中,RX 6800 XT開啟SAM,游戲性能平均提升大約3%,《刺客信條:奧德賽》、《古墓麗影:暗影》、《戰(zhàn)地5》、《戰(zhàn)爭機(jī)器》都是比較明顯的,以前是《戰(zhàn)爭機(jī)器5》,1080p分辨率下達(dá)到了驚人的12%。
回想之前RX 6000系列規(guī)格曝光的時(shí)候,看到只有256-bit位寬,再加上AMD保密措施做得好,頂級規(guī)格一直沒有透露,相信絕大多數(shù)人都認(rèn)為AMD這次直接棄療了,不做高端,結(jié)果誰都沒想到來了一個(gè)這么一個(gè)獨(dú)門大招。
當(dāng)然,SAM技術(shù)需要特定的條件才能開啟,硬件上不但需要銳龍5000處理器、RX 6000顯卡,還得搭配X570、B550主板,并在BIOS中開啟相關(guān)選項(xiàng)。
AMD表示,目前沒有計(jì)劃將SAM技術(shù)應(yīng)用于老平臺,所以400系列主板用戶即便上了銳龍5000處理器,也會少一些“福利”。
再說說光追。RDNA 2的思路是在每一個(gè)計(jì)算單元內(nèi),加入一個(gè)專門的Ray Accelerator光追加速單元,這與在微軟Xbox Series X/S、索尼PS5上的設(shè)計(jì)如出一轍,跨平臺的游戲優(yōu)化自然是得心應(yīng)手。
對比NVIDIA RT Core專用光追核心的做法,RDNA 2將光追加速器集成于計(jì)算單元,可以共享通常無法在光追中無法被完全利用到的硬件。
換言之,運(yùn)行非光追負(fù)載時(shí),AMD光追加速器的部分硬件仍然可以正常運(yùn)作,NVIDIA RT核心就完全閑置了,前者自然有著更高的整體效率,不必為根本用不到的硬件付出成本和功耗。
關(guān)于光追游戲支持,RDNA 2架構(gòu)基于行業(yè)標(biāo)準(zhǔn)的微軟DXR API和即將推出的Vulkan光追API,所以任何基于這些標(biāo)準(zhǔn)API的光追游戲,AMD都可以直接支持,首發(fā)超過十款,包括《塵埃5》、《眾神隕落》、《孤島驚魂6》、《銀河破裂者》、《魔獸世界:暗影國度》、《戰(zhàn)地5》、《使命召喚:現(xiàn)代戰(zhàn)爭》、《孤島危機(jī)重制》、《堡壘之夜》、《地鐵:離去》、《古墓麗影:暗影》、《看門狗:軍團(tuán)》。
這是AMD放出的RNA 2光追渲染效果圖,注意第一張和傳統(tǒng)光柵化渲染的對比。
AMD聲稱,相比于軟件方案,RDNA 2架構(gòu)的硬件加速光追性能,可以提升10倍之多,同時(shí)給出了部分游戲的實(shí)際性能,2K分辨率下《使命召喚:現(xiàn)代戰(zhàn)爭》可以跑出95FPS,《孤島危機(jī)重制版》可達(dá)90FPS,《戰(zhàn)地5》能有70FPS。
還有一點(diǎn)很多人可能沒注意到,光追不僅僅可以用于游戲,在圖形渲染中同樣很關(guān)鍵,而且早就有應(yīng)用了,只不過一直都是軟件方案,效率不是很高。
AMD ProRender渲染器插件就一直支持光追,支持Blender、Houdini、Autodesk Maya等頂級渲染軟件,Blender Cycles也即將支持。
AMD聲稱,RX 6800 XT相比于此前的Radeon VII,利用硬件光追加速,在渲染方面可以帶來大約50-70%的性能飛躍。
另外,針對NVIDIA DLSS深度學(xué)習(xí)超采樣抗鋸齒技術(shù),AMD也提出了超分辨率(FidelityFX Super Resolution),簡稱FSR,不過還在開發(fā)之中,正與游戲開發(fā)商聯(lián)合優(yōu)化支持,更多細(xì)節(jié)會在后續(xù)放出。
總的來說,基于一系列全新設(shè)計(jì)和特性,RDNA 2架構(gòu)在運(yùn)行頻率、同頻性能、能效比等各個(gè)方面都取得了顯著的進(jìn)步,綜合能效比在RDNA相對于GCN提升50%的基礎(chǔ)上,又提升了多達(dá)54%!
這其中,21%來自同頻性能增強(qiáng),17%來自能耗優(yōu)化,16%來自設(shè)計(jì)頻率提升。
最后是一組AMD官方給出的RX 6800、RX 6800 XT與競品性能對比,看看就好,實(shí)際性能對比還請移步本站的首發(fā)評測。
責(zé)任編輯:pj
-
處理器
+關(guān)注
關(guān)注
68文章
19291瀏覽量
229906 -
amd
+關(guān)注
關(guān)注
25文章
5469瀏覽量
134193 -
cpu
+關(guān)注
關(guān)注
68文章
10868瀏覽量
211844
發(fā)布評論請先 登錄
相關(guān)推薦
評論