當NVIDIA基于新一代Ampere安培架構的GeForce RTX 30系列顯卡發布之時,幾乎在所有玩家的內心都默默的宣判了AMD的死刑。
因為此前在流處理器數量相同的情況下,同時代的NVIDIA顯卡性能是遠強于AMD顯卡,就算是RDNA構架也不能難幸免。RX 5700 XT無法戰勝擁有相同2560個流處理器數量的RTX 2070 Super,前者是7nm,后者是12nm。
新一代RTX 3090一上來就宣告擁有10496個流處理器,帶來的震撼可想而知!至于傳說中的RDNA2,很早之前大家就知道了,它最多擁有5120個流處理器。恐怕那時沒人會覺得RNDA2會威脅到RTX 3090,甚至RTX 3080都可以高枕無憂。
不過如同Zen3處理器帶給大家的震撼一樣,10月29日發布的RDNA2 GPU的實際性能表現幾乎超出了所有人的預料!
RDNA 2雖然是RDNA架構的更新版本,并不是完全重新設計。但在RDNA原有的基礎上,RDNA2性能提升1倍,能效提升至少50%,ROP單元翻倍,完整支持DX12 Ultimate等技術特性,支持硬件光線追蹤。
可以發現整體布局沒有太大變化,當然各個功能模塊都是調整優化過的,而最突出的,一是增加了獨立的Infinity Cache高速緩存,二是在每個計算單元內加入了專用的光追加速器Ray Accelerator。
至于RDNA 2架構的底層細節,比如說計算單元的變化,AMD這次沒有給出更多資料,只是簡單提到了幾點,包括精簡TLB以降低延遲、重新設計32位像素流水線并支持HDR格式、優化幾何分派與曲面細分、全方位精細時鐘門控、頻率樹分離與門控、最小化數據轉移、重新平衡流水線、高性能庫等等,但沒有任何圖示。
以下是RDNA2構架新技術解析:
1、Smart Access Memory (SAM)顯存智取技術
在游戲運行的時候,CPU是不能一次性訪問全部顯存的,比如RTX 3090有24GB顯存,而CPU只能訪問其中的256MB。于是有大量數據會回到內存后給CPU處理器完成后再轉移到顯存,此時不僅浪費了帶寬也造成了無謂的資源浪費。
Smart Access Memory (SAM)可以讓搭載AMD 500系列芯片組在搭載Zen3 CPU和RDNA2 GPU的時候,讓Zen3 CPU可以完整訪問全部顯存,而且帶寬還是PCIe 4.0的速度,理論上最多可以讓游戲性能提升13%。
2、Ray Accelerator單元
在RDNA2構架中,加入了硬件光追單元Ray Accelerator!與NVIDIA的完全專用RT Core相比,RDNA2的Ray Accelerator緊密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的現有HW。
這是AMD放出的RNA 2光追渲染效果圖,可以看到RDNA2實時光線追蹤效果與傳統光柵化渲染的差別。
AMD聲稱,相比于軟件方案,RDNA 2架構的硬件加速光追性能,可以提升10倍之多,同時給出了部分游戲的實際性能,2K分辨率下《使命召喚:現代戰爭》可以跑出95FPS,《孤島危機重制版》可達90FPS,《戰地5》能有70FPS。
3、全局Infinity Cache
在大容量三級緩存的加持下,Zen3的IPC性能獲得了巨大的性能提升。如今AMD將這個理念帶入了GPU領域。
傳統的GPU構架中,一般只有1.5~4MB的緩存,RDNA2除了4MB的L2緩存之外,還加入了128MB的全局Infinity Cache緩存,所有的CU單元均可以訪問。
AMD Infinity Cache 作為一個巨大的帶寬放大器,其有效帶寬可以達到256 位 16 Gbps GDDR6 顯存的 4 倍。在Infinity Cache的帶動下,512GB/s帶寬的RX 6900 XT的性能表現足以媲美936GB/s帶寬的RTX 3090。
4、Fidelity FX超分辨率抗鋸齒技術
針對NVIDIA DLSS深度學習超采樣抗鋸齒技術,AMD也提出了超分辨率(FidelityFX Super Resolution),簡稱FSR。目前這個技術正在開發中,不久之后會在新驅動中提供支持
歷代AMD顯卡在ROP單元數量上都非常保守,最頂級型號的GPU最多就只有64個ROP。這一次AMD非常的激進,RX 6800 XT直接就配備了128個ROP,也是GPU歷史上第一款擁有128個ROP的顯卡。
責任編輯:pj
-
處理器
+關注
關注
68文章
19291瀏覽量
229907 -
amd
+關注
關注
25文章
5469瀏覽量
134194 -
cpu
+關注
關注
68文章
10868瀏覽量
211844
發布評論請先 登錄
相關推薦
評論