一、前言:比想象中性能更強的RTX 4070顯卡
GeForce RTX 4070解禁發布之前,不少人對它有點迷惑。
首先,它的CUDA核心(流處理器)與上代RTX 3070完全相同,都是5888個。另外一點就是它的顯存位寬只有192Bit,RTX 3070則是256Bit。
有鑒于此,很多玩家預測RTX 4070的性能不會比RTX 3070強多少,大概也就是RTX 3070 Ti的水準。
RTX 4070真的如此不堪嗎?當然不是!
RTX 4070使用了與RTX 4070 Ti相同的AD104核心,完整的AD104核心共有7680個CUDA核心(分為5組GPC/30組TPC/60組SM)、240個第四代Tensor Core張量核心、60個第三代RT Core光追核心、240個紋理單元、80個ROP單元、3MB一級緩存、48MB二級緩存。
完整的AD104核心
AD104-250核心(RTX 4070)
RTX 4070做了部分精簡,擁有4組GPC共5888個流處理器、184個Tensor Core、46個RT Core和5888個流處理器單元、64個ROP單元、36MB二級緩存。
這其中很多參數與RTX 3070相同,比如流處理器、Tensor Core、RT Core,2款顯卡一模一樣,而ROP單元數量和顯存位寬甚至還不如RTX 3070。
不過不要忘了,RTX 4070采用的是第四代Tensor Core和第三代RT Core,相比RTX 3070都領先了一代。
另外在臺積電4N制程工藝加持下,RTX 4070的加速頻率高達2475MHz,實際游戲頻率更是高達2800MHz,相比RTX 3070提升了接近50%。
如此巨大的頻率自然也會帶來更強的游戲性能。
AD104的晶體管數量2倍于GA104,而流處理器數量卻并沒有翻倍,這是因為大量的晶體管用在了二級緩存上。
RTX 4070二級緩存容量高達36MB,9倍于RTX 3070,更大容量的二級緩存可以降低GPU對于顯存帶寬的需求。
另外,雖然顯存位寬只有192Bit,但是由于采用了頻率高達21Gbps的GDDR6x顯存,位寬達到了504GB/s,而256Bit的RTX 3070位寬只有448GB/s。
更大容量的二級緩存再加上更高的顯存帶寬,RTX 4070的性能到底會比RTX 3070強多少呢?
二、圖賞:可以看作是迷你版的RTX 4090
?
和巨大的包裝盒比起來,RTX 4070顯得十分小巧。
送來一條2x8Pin轉16Pin的電源線,RTX 4080是3x8Pin、RTX 4090上是4×8Pin。
看起來就像是RTX 4080的縮小版。
背面。
依然是16Pin供電接口,不過功耗很低,完全不可能出現燒化接口的情況。
3個DP1.4和1個HDMI 2.1接口。
拆掉外框。
銅底+熱管的散熱設計。
非常mini的PCB板,改造成ITX版型也不難。
5+3相供電電路設計,雖然簡單,但也足夠應付200W的TGP。
背面空空如也。
RTX 4070采用的是AD104核心,芯片面積295mm2,擁有358億晶體管。
GPU旁邊是6顆美光GDDR6X顯存,單顆2GB,總容量12GB,等效頻率21GHz,帶寬504GB/s。
RTX 4070就是迷你版的RTX 4090/4080。
三、理論性能測試:3DMark運行頻率可達2800MHz
測試平臺如下:
1、3DMark Time Spy
在2K分辨率3DMark Time Spy測試中,RTX 4070圖形分數達到了17924分,核心溫度最高68℃,熱點溫度最高86℃,核心運行最高頻率為2820MHz,最高風扇轉速1709PM,最高功耗173W。
在4K分辨率3DMark Time Spy Extreme測試中,RTX 4070圖形分數達到了8587分,核心溫度最高69℃,核心運行最高頻率為2805MHz,最高風扇轉速1700RPM,最高功耗173W。
2、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme測試中,RTX 4070圖形分數達到了21351分,核心溫度最高63℃,核心運行最高頻率為2835Hz,最高風扇轉速1409RPM,最高功耗169W。
在4K分辨率3DMark Fire Strike Ultra測試中,RTX 4070圖形分數達到了10095分,核心溫度最高64℃,核心運行最高頻率為2835Hz,最高風扇轉速1410RPM,最高功耗168W。
四、1080P與2K游戲測試:都比RTX 3080強
1、刺客信條:英靈殿
2、德軍總部:新血脈
3、地平線:零之曙光
4、孤島驚魂5
5、孤島驚魂6
6、古墓麗影:暗影
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、戰爭機器5
1080P分辨率測試數據匯總如下:
2K分辨率測試數據匯總如下:
1080P分辨率下,RTX 4070要比RTX 3080強了5%,到了2K分辨率下仍有1%的性能優勢。
和RTX 3070相比,在2K分辨率俠下RTX 4070都能領先30%左右。
至于RTX 2070 Super,RTX 4070要比它強68%。
五、4K游戲測試:稍弱于RTX 3080
1、刺客信條:英靈殿
2、德軍總部:新血脈
3、地平線:零之曙光
4、孤島驚魂5
5、孤島驚魂6
6、古墓麗影:暗影
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、戰爭機器5
測試數據匯總如下:
4K分辨率下,RTX 4070相比RTX 3070 Ti的領先優勢降到了13%,比起RTX 3070快了25%,但被RTX 3080反超,落后后者5%。
六、DLSS 3游戲測試之一: 3款無光追DLSS 3游戲
此次我們一共測試了8款游戲,包括4款支持DLSS 3但無光追的:《3DMark》、《超級突破》、《毀滅全人類》。
另外還有4款同時支持DLSS與光追的游戲:《暗影火炬城》、《光明記憶》:《無限、生死輪回》、《賽博朋克2077》。
所有DLSS 3以及光追測試都是在2K分辨率下進行。
1、3DMark
DLSS 2模式下幀率為121FPS,比默認的65FPS提升了133%。
DLSS 3的成績為132FPS,相比默認提升了156%。
2、超級人類
這是默認最高畫質,RTX 4070的幀率為158FPS。
DLSS 3的畫質與原生畫質相比有那么一點差別,不過不仔細看到話,很難發現差異。
3、毀滅全人類2:重新探測
最高畫質下,RTX 4070的幀率為114FPS。
開啟DLSS 3之后,幀率來到了222FPS,近乎翻倍。
七、DLSS 3游戲測試之二:4款支持DLSS 3的光追游戲
1、暗影火炬城
開啟光追時,幀率為127FPS。
2、光明記憶:無限
開啟RTX時,游戲的幀率為105FPS。
開啟DLSS 3之后,幀率提升到了225FPS,提升了114%。
3、生死輪回
開啟光追之后,游戲的幀率僅有56FPS。
打開DLSS 3之后,幀率提升到了180FPS,提升幅度搞到221%。
4、賽博朋克2077
開啟光追之后,游戲的幀率僅有38FPS。
打開DLSS 3之后,幀率提升到了136FPS。
測試數據匯總如下:
八、功耗測試:烤機僅67度、能效比二倍于RTX 3070 Ti
1)、烤機測試
使用Furmark來對RTX 4070進行烤機測試,測試是室溫為28度。
將Furmark的參數設定為1920*1200分辨率、0AA。
運行14分鐘之后,RTX 4080的溫度穩定在67度附近,功耗穩定在196W,烤機時GPU頻率為2460MHz,CPU風扇轉速只有1794RPM,基本上聽不到風扇的噪音。
2)、真實游戲功耗測試
1、GTA V
1080P分辨率下,RTX 4070的功耗為117W,而RTX 3070 Ti則高達202W。
2K分辨率下,RTX 4070功耗是165W,運行頻率2805MHz,溫度56度。
RTX 3070 Ti的功耗為262W,運行頻率1905MHz,溫度73度。
2、絕地求生
這是1080P分辨率。
左邊是RTX 4070,功耗186W,溫度65度。
右邊是RTX 3070 Ti,功耗285W,溫度80度。
2K分辨率下,RTX 4070功耗190W,RTX 370 Ti功耗是288W。
3、古墓麗影:暗影
1080P分辨率下,RTX 4070功耗183W,溫度59度,運行頻率2805MHz。
2K分辨率下,RTX 4070功耗188W,RTX 3070 Ti則是282W。
測試數據匯總如下:
在1080P分辨率下,RTX 4070在3A游戲中的平均功耗只有171W,2K分辨率也只有186W;就算是到了4K分辨率,平均功耗也不到190W,這個功耗不到RTX 3070 Ti的2/3。
雖然RTX 4070的TGP是200W,但實際上基本上沒有游戲可以跑到這個數字。相比之下,RTX 3070 Ti可以輕松跑滿290W的TGP。
九、Stable Diffusion與RTX VSR體驗
1、Stable Diffusion出圖速度測試
如今已是AI時代,ChatGPT是最火的聊天機器人,而當前最火的AI作圖工具則是Stable Diffusion,只需要輸入一句話、或者特定的關鍵詞,就能生成一幅你想要的圖像。
只不過Stable Diffusion也是有要求的,你需要一張顯存容量6GB以上的NVIDIA顯卡。
下面我們來看看RTX 4070的出圖速度。
生成圖像寬度864、高度1264,采樣迭代步數70。
實測RTX 4070出圖耗時82秒,顯存占用5GB,功耗168W。
RTX 2070 Super耗時122秒,功耗210W。
RTX 3070 Ti耗時86秒,GPU功耗277W,溫度76度。
RTX 3070出圖耗時95秒,GPU功耗210W。
小結:4張顯卡中,RTX 4070不僅出圖速度最快,功耗也是最低的,比RTX 3070 Ti低了110W。
另外我們這里只是出一張圖,如果是大量出圖,從中篩選優質圖片,耗時會更久,這個時候高端顯卡可以節約大量時間。
2、RTX VSR效果體驗
其實很早之前就有AI圖片畫質增強工具,但是視頻超分辨率技術一直是空白,主要是處理視頻需要極高的算力。近期NVIDIA上線了RTX VSR 視頻超分辨率技術,可以利用Tenser Core張量核心硬件單元,智能銳化和強化特征和邊緣,同時消除惱人的壓縮偽影。
想使用RTX VSR 視頻超分辨率技術,只需要下載最新版本的GeForce顯卡驅動和Chrome瀏覽器即可。
驅動安裝完成之后,在NVIDIA控制面板中會出現RTX 視頻增強選項,一共有4檔可供選擇,1檔畫質最低,4檔畫質最好。
左邊是360P分辨率視頻,右邊是RTX VSR 4x畫面,可以增強后的畫面已經達到了1080P的畫質水準,線條更加清晰、背景也純凈了很多。
就算是1080P視頻,經過RTX VSR 4x增強后,畫面中的噪點、鋸齒都減輕了很多,細節更為豐富。
十一、總結:不僅僅只是一款游戲顯卡
2022年12月上市的AMD次旗艦RX 7900 XT,其性能能媲美RTX 4080,價格僅售7499元,比對手足足便宜了2000元。
然而4個月過去了,如今許多非公RX 7900 XT已經降到了6000元以下,比RTX 4070 Ti還便宜不少,但依舊無人問津,真是讓人唏噓不已。
原因很簡單,顯卡只是單純的游戲性能強是遠遠不夠的,能效比、生產力、光線追蹤等等這些綜合起來,重要性上遠遠超過GPU的傳統游戲性能。在這些方面,AMD顯卡落后的已不是一點半點。
就拿目前大受歡迎的AI作圖工具Stable Diffusion來說,A卡直接就無法識別……
以下是本次測試小結:
1、性能
RTX 4070最適合1080P和2K分辨率。我們測試了11款游戲,在2K分辨率下,除了《賽博朋克2077》“只有”92幀之后,其他10款游戲的幀率都超過了100FPS,平均幀率比RTX 3080還要強1%。
如果和RTX 3070 Ti相比,RTX 4070在1080P和2K分辨率下的優勢接近20%,和RTX 3070相比,領先優勢則接近30%。
我們也測試了圖靈時代的RTX 2070 Super,這款顯卡已經根本上時代,RTX 4070比它快了近70%。
2、功耗
RTX 4070的TGP為200W,不過根據我們的測試,這塊顯卡在游戲中的功耗實際上是很難觸及到200W的。
我們測試了6款3A大作的真實游戲功耗,在1080P分辨率下RTX 4070的平均功耗是171W,而RTX 3070 Ti是264W,RTX 3080則是300W。
2K分辨率下,RTX 4070在6款游戲中的平均功耗是186W,RTX 3070 Ti和RTX 3080則分別是279W、313W。
4K分辨率下,RTX 4070在6款游戲中的平均功耗為188W,RTX 3070 Ti是286W,而RTX 3080已經跑到了320W的TGP上限。
三款顯卡中,RTX 4070在1080P和2K分辨率下的性能最強,但功耗還不到3080的60%。
3、DLSS 3和光追
目前能玩的DLSS 3游戲多達數十款,我們測試了7款。
在開啟DLSS 2之后,游戲幀率提升幅度為95%。打開DLSS 3,游戲幀率提升幅度達到了136%。
而與RTX 3070 Ti相比,RTX 4070在開啟DLSS 3之后領先前者超過50%。
4、附加價值
此次我們還體驗了Stable Diffusion與RTX VSR技術。
和RTX 3070 Ti相比,RTX 4070在Stable Diffusion中的出圖速度不僅更快,同時功耗也低了110W。如果要生成大量圖片,RTX 4070僅僅160W的功耗對于機箱內部的散熱也不會造成太大影響。
至于RTX VSR,這是一個實打實的視頻畫質增強技術,實測360P視頻通過RTX VSR 4x增強,最終畫面效果甚至可以媲美1080P視頻。1080P視頻經過增強后,畫面觀感與4K分辨率已相差無幾。
但是筆者感覺RTX VSR技術其實用在大屏電視上效果更好,如今86寸甚至100寸電視已經開始普及,這么大的屏幕,如果視頻分辨率1080P,鋸齒感會非常明顯。
5、價格
NVIDIA GeForce RTX 4070建議零售價4799元起,此次NVIDIA備足了庫存,首批商家的非公版將會有一半以上以建議零售價進行銷售,甚至第三方渠道首發特惠低于4799元的也會有一些。
也許這會是第一塊大家都買得起的RTX 40系顯卡!
編輯:黃飛
?
評論
查看更多