2022年10月上旬,代表著Ada Lovelace架構(gòu)頂級性能的GeForce RTX 4090 GPU登場亮相發(fā)售,宣告了RTX 40系GPU正式進(jìn)入消費者的視野。不過正如我們測試之后的結(jié)論所說,雖然RTX 4090擁有遠(yuǎn)勝RTX 3090 Ti的強悍性能,而且還有DLSS 3這一神奇黑科技的護(hù)航,但萬元以上的價格確實不是大眾消費者能輕易接受的。時隔一月之后,同樣代表了旗艦級性能,但價格卻要便宜不少的次旗艦產(chǎn)品GeForce RTX 4080登場了。同樣擁有勝過RTX 3090 Ti的性能表現(xiàn),但價格卻要相對親民一些,會不會讓你更加心動?
和RTX 4090一樣,同出一脈的GeForce RTX 4080 GPU仍然繼承了來自Ada Lovelace架構(gòu)的全部特色與技術(shù)。在GeForce RTX 4090 Founders Edition首發(fā)評測時,我們已經(jīng)對Ada Lovelace架構(gòu)的核心特色技術(shù)與主要特點進(jìn)行了非常細(xì)致的解析,在這里我們就不一一重復(fù)了。不過為了幫助大家更好地理解本測試文章,我們還是將Ada Lovelace架構(gòu)的核心技術(shù)要點做了個簡單總結(jié),供大家參考。
來自Ada架構(gòu)的RTX 40系GPU技術(shù)創(chuàng)新
RTX 40 系列 GPU 具有一系列新的技術(shù)創(chuàng)新,包括TSMC 4N 制造工藝,整體實現(xiàn)高達(dá) 2 倍的性能功耗比飛躍。?
緩存暴增
?
Ada架構(gòu)的改革在緩存部分有了較大改變。每個SM擁有128KB L1緩存,AD102總計擁有18432KB L1緩存,相比GA102的10752KB緩存增加了大約70%。在L2緩存方面,AD102目前擁有98304KB的L2緩存,相比之前GA102所擁有的6144KB大約是后者的16倍。如此巨大的緩存,將為所有GPU相關(guān)操作都帶來巨大的收益,尤其是光線追蹤、路徑追蹤等復(fù)雜的操作收益最為明顯。
更強的SM
AAD102的每個SM單元包含128個CUDA內(nèi)核,1個ADA第三代RT核心以及4個ADA第四代張量(Tensor)核心、4個紋理單元、256KB寄存器、128KB的L1/共享內(nèi)存,和之前的產(chǎn)品一樣,L1/共享內(nèi)存也可以根據(jù)使用情況進(jìn)行配置。流式多處理器具有高達(dá) 83 TFLOPS 的著色能力,吞吐量超過上一代產(chǎn)品 2 倍。?
第三代光追核心
第三代 RT Cores 的有效光線追蹤計算能力達(dá)到 191 TFLOPS,是上一代產(chǎn)品 2.8 倍。?
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高達(dá) 1.32 petaflops 的張量處理性能,超過上一代5倍。
Shader Execution Reordering著色器執(zhí)行重排序
SER可以重新調(diào)度著色器的工作排序,從而避免部分著色器在等待中浪費算力和電能,以獲得更好的效率和性能。SER 為光線追蹤帶來最高可達(dá) 3 倍的性能提升,整體游戲性能提升可高達(dá) 25%。
DLSS 3與OFA光流加速器
基于Ada光流加速器的DLSS 3最高可帶來相對于DLSS 2達(dá)2 倍的性能提升,使 DLSS 3 能夠預(yù)測場景中幀和幀之間的運動變化,使神經(jīng)網(wǎng)絡(luò)能夠在保持圖像質(zhì)量的同時提高幀率。DLSS 3 技術(shù)支持 GeForce RTX 40 系列 GPU,它包括 3 個功能:光學(xué)幀生成技術(shù)、超級分辨率(DLSS 2 的關(guān)鍵創(chuàng)新)和 NVIDIA Reflex。開發(fā)者只需整合 DLSS 3,即可默認(rèn)支持 DLSS 2。
雙NVIDIA編碼器(NVENC)
基于 Ada 架構(gòu)的全新顯卡配備了支持 AV1 編碼的全新第八代 NVIDIA 編碼器 (NVENC),可為主播、廣播愛好者和視頻通話用戶帶來更多新的嘗試和體驗。該技術(shù)的效率比 H.264 高 40%,這有助于主播在保持直播推流比特率不變的情況下,將畫面分辨率從 1080p 提高到 1440p,且畫質(zhì)依然穩(wěn)定。?
更強的Studio性能
除了游戲性能之外,RTX 40系GPU也是用于內(nèi)容創(chuàng)作的優(yōu)秀GPU,在加速3D設(shè)計創(chuàng)作、視頻剪輯處理和AI計算方面,都有非常不錯的表現(xiàn)。
同時嗎,專用的NVIDIA Studio Driver在頂級創(chuàng)意應(yīng)用上經(jīng)過全面測試,能夠最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代編碼器來提高現(xiàn)場直播質(zhì)量,利用 NVIDIA Broadcast AI 特效改善麥克風(fēng)和網(wǎng)絡(luò)攝像頭,并進(jìn)入AI驅(qū)動的 VTubing。?
●得益于RTX 40 系列的雙編碼器和高達(dá)2倍的AI工具性能,視頻編輯的輸出速度最高可提升 2倍。?
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 設(shè)計創(chuàng)作者可以在4K@60fps 下進(jìn)行創(chuàng)作。
●Modder可以重制經(jīng)典游戲,并通過RTX Remix開啟RTX。
GeForce RTX 4080 Founders Edition鑒賞
復(fù)習(xí)完理論,來看今天的主角GeForce RTX 4080 Founders Edition。
從核心架構(gòu)圖可以看出,相對于完整的AD-102核心配置的12個GPC模塊,代號為AD-103的GeForce RTX 4080 GPU只擁有7個GPC模塊,而且在GPC的配置上做了一些減法。全部7個GPC模塊中有4個配置了完整的12組SM模塊,有兩個GPC配置了10組SM,而最后一個GPC只配置了8組SM。這樣算下來,完整的AD-103核心總共配置了48+20+8即76組SM單元。Ada核心的每個SM單元配置的CUDA核心為128個,因此RTX 4080 GPU具有9728個CUDA 核心, 可提供 49 TFLOPS的著色器傳統(tǒng)光柵渲染能力。同樣,這也意味著GeForce RTX 4080 GPU擁有76個第三代Tensor Cores光追核心和304個第四代Tensor Cores AI核心,能夠為光追游戲或渲染工作提供113RT-TFLOPS的計算能力,同時能夠為DLSS或AI計算提供高達(dá)780Tensor-TFLOPS的計算性能。在核心頻率上,RTX 4080的GPU核心頻率為2205MHz~2505MHz,略低于RTX 4090,但相比RTX 30系旗艦不到2GHz的頻率設(shè)置,仍然是要高得多,也說明采用TSMC 4N工藝打造的Ada核心在能效比上確實比RTX 30系出色得多。
在顯存的配置上,由于NVIDIA最終撤銷了12GB顯存版的RTX 4080 GPU計劃,因此16GB GDDR6X顯存的版本就成為了目前RTX 4080的唯一配置。在顯存位寬上從RTX 4090的384bit降為256bit,不過頻率從RTX 4090的1313MHz提升到了1400MHz,因此帶寬雖然為768GB/s要低于RTX 4090,但總速率表現(xiàn)還是達(dá)到了22.4Gpbs,高于RTX 4090的21Gbps。
按照NVIDIA給出的官方參考數(shù)據(jù),在現(xiàn)代游戲中RTX 4080的性能最高可達(dá) GeForce RTX 3080 Ti 的2倍,而功耗則降低了近10%。具體是不是有這樣的性能表現(xiàn)呢?后文我們將進(jìn)行深度的詳細(xì)測試。
說個題外話,其實可以看出,RTX 4080和RTX 4090之間在硬件規(guī)格參數(shù)上相差很大,所以我們一點也不懷疑RTX 4080 Ti這個等級的GPU是一定存在的。而且不妨大膽猜測一下,104或110組SM單元配置的20GB GDDR6X顯存版RTX 4080 Ti是不是很有吸引力呢?(個人猜測,僅供參考)。
從外觀上來看,RTX 4080 FE與RTX 4090 FE幾乎是一模一樣,而且在長寬的尺寸上也幾乎保持一致。在散熱結(jié)構(gòu)上,RTX 4080 FE仍然是采用的雙軸流通設(shè)計,加厚的散熱片也充分保證了散熱的性能需求。在風(fēng)扇部分,和RTX 4090 FE一樣,RTX 30系旗艦產(chǎn)品的9葉曲折扇改為了兩只大面積的7葉類鐮刀風(fēng)扇,但是在靜音效果上反而感覺更優(yōu)秀。較大扇葉面積的風(fēng)扇能夠提供更高的風(fēng)壓與風(fēng)量,而風(fēng)扇部分此次采用的流體動力軸和反方向旋轉(zhuǎn)的設(shè)計,則讓RTX 4080 FE和RTX 4090 FE一樣可以更安靜、涼爽地運行。
▲和RTX 4090 FE一樣的7葉鐮刀風(fēng)扇,雙側(cè)反向旋轉(zhuǎn)帶來更高散熱效率。
▲主出風(fēng)口設(shè)置在擋板處,大量的鏤空設(shè)計可以充分保證散熱效果。在視頻輸出接口部分,仍然是傳統(tǒng)的1 HDMI+3 DP,支持HDMI 2.1和DP 1.4a。
▲RTX 40系GPU已經(jīng)全面進(jìn)化到600W供電的ATX 3.0電源PCIe 5 16Pin 12VHPWR接口,不過RTX 4080 FE的包裝盒內(nèi)也附帶了一根3×8pin轉(zhuǎn)16Pin的轉(zhuǎn)接線,方便用戶平滑升級。
▲和RTX 4090 FE一樣,支撐架安裝部位也采用了隱藏式磁吸設(shè)計。
▲從NVIDIA的官方PCB渲染圖來看(FE公版顯卡實在很難拆,而且我們擔(dān)心拆解容易損壞散熱結(jié)構(gòu),所以就沒拆解RTX 4080 FE,用NVIDIA官方資料進(jìn)行內(nèi)部設(shè)計解析),RTX 4080 FE仍然采用了燕尾PCB的設(shè)計模式,18相供電。中間的AD103核心因為是官方渲染圖,因此打上了NVIDIA Logo。顯存部分則采用了來自美光的8顆GDDR6X顆粒,單顆容量2GB。
NVIDIA GeForce RTX 4080 Founders Edition參數(shù)規(guī)格
核心架構(gòu):Ada Lovelace
核心代號:AD103-300
制程工藝:TSMC 4N(NVIDIA定制工藝)
SM單元:76
CUDA核心數(shù):9728
光追核心數(shù)(RT Cores):76
AI核心數(shù)(Tensor Cores):304
核心頻率:2205MHz~2505MHz
顯存容量:16GB GDDR6X
顯存速率:22.4Gbps
顯存位寬:256bit
顯存帶寬:716.8GB/s
支持DLSS版本:DLSS 3
TGP:320W
建議電源:700W
首發(fā)參考價:9499元
性能實測,比RTX 3090 Ti還強20%多!
步入大家最期待的實際應(yīng)用測試。想必所有玩家心里都有這樣一個疑問:作為首發(fā)價格達(dá)9499元的RTX 4080 FE,其實際性能表現(xiàn)能否匹配這樣的價格定位呢?
整體的測試我們大致分為三個部分:第一部分是游戲性能的體驗,包括傳統(tǒng)光追游戲+DLSS 2的性能表現(xiàn)檢測以及DLSS 3性能的專項測試,這是本次評測的最重要的核心部分;第二部分則是與設(shè)計創(chuàng)作相關(guān)的Studio性能評測,考察RTX 4080在設(shè)計創(chuàng)作應(yīng)用方面的優(yōu)勢;第三部分則是功耗相關(guān)的評測,這部分我們不再用傳統(tǒng)的單一Furmark烤機(jī)來檢測RTX 4080 Founders Edition的能耗,而是分別在1440p游戲、4K游戲和8K游戲環(huán)境下考察RTX 4080的實際功耗表現(xiàn),并且根據(jù)這些成績和性能表現(xiàn)來簡略計算RTX 4080的每瓦性能(僅供參考)。同時,我們還將RTX 4090 FE、RTX 3090 Ti FE和RTX 3080 Ti FE納入了對比參考測試。
下面,就讓我們逐步深入解析RTX 4080 Founders Edition的性能世界吧!
測試平臺概覽
GPU:NVIDIA RTX 4080 FE、RTX 4090 FE、RTX 3090 Ti FE、RTX 3080 Ti FE
主板:技嘉AORUS Z790 MASTER
內(nèi)存:技嘉AORUS DDR5 6000 64GB
顯示器:戴爾UP3218K(7680×4320@60Hz)
電源:鑫谷昆侖KL-1250G冰山版ATX 3.0(額定1250W)
操作系統(tǒng):Windows 11 Pro 21H2
驅(qū)動程序:Game Ready Driver 526.72
▲截至發(fā)稿時,GPU-Z未更新,因此尚不能完全識別RTX 4080 GPU。
3DMark理論性能測試
在3DMark的理論性能測試部分,我們可以看到RTX 4080 FE與RTX 4090 FE的平均理論3D性能差距約在30%上下,PortRoyal光追性能測試部分的差距超過了40%。畢竟RTX 4080 FE與RTX 4090 FE在規(guī)格上確實相差了一大截,有這樣的性能差距也算正常,而且也為可能出現(xiàn)的RTX 4080 Ti埋下了伏筆。
在與上一代旗艦級和次旗艦產(chǎn)品的比較上,RTX 4080 FE的表現(xiàn)還是非常搶眼的。在與RTX 3080 Ti FE的較量上,RTX 4080 FE幾乎領(lǐng)先后者整整40%的性能,即使與RTX 3090 Ti這款前一代的頂級旗艦產(chǎn)品相比,所有測試項目的平均領(lǐng)先幅度也達(dá)到了25%左右,堪稱表現(xiàn)不俗。
游戲性能測試,輕松駕馭4K全特效光追
在游戲測試部分,出于對RTX 4080 FE的定位思考,我們將整體測試重點放在了4K分辨率下,但考慮到少部分玩家的特殊需求,我們也在部分游戲中加入了8K分辨率的體驗評測。同時,目前的實際情況是,絕大部分玩家都還在使用1440p甚至1080p顯示器,因此我們也將一部分1440p游戲的體驗測試加入了本次的體驗之旅中,以期望得到一個相對完整的體驗測試報告。在所有游戲的測試中,我們都開啟了最高畫質(zhì)與最高光追效果設(shè)置(《刺客信條:英靈殿》設(shè)置為高畫質(zhì)),DLSS模式統(tǒng)一開啟為:8K超級性能、4K/1440p為平衡(《暗影火炬城》《生死輪回》《光明記憶:無限》三款游戲DLSS設(shè)置為自動,特此說明)。
傳統(tǒng)光追游戲+DLSS 2性能體驗
在8K光追游戲測試部分,RTX 4080 FE的表現(xiàn)還是比較搶眼的。在DLSS開啟之后,基本都能夠在60fps左右或更高的幀率運行8K游戲。與RTX 3090 Ti FE相比,RTX 4080 FE的8K游戲整體性能領(lǐng)先約30%,與RTX 3080 Ti FE相比,8K游戲性能更是達(dá)到了接近90%的領(lǐng)先程度。不過與RTX 4090 FE相比,仍然還有40%~45%的性能差距。
4K分辨率下的游戲性能表現(xiàn)是我們的測試重點,這部分我們一共選擇26款當(dāng)下的熱點游戲進(jìn)行了詳細(xì)的測試(《Unity:Enemies》這款游戲RTX 40系GPU自動開啟DLSS 3,RTX 30系及更老的GPU自動開啟DLSS 2。)。從整體的測試情況來看,RTX 4080 FE在性能上的表現(xiàn)仍然不俗,相比RTX 3080 Ti而言,整體性能平均領(lǐng)先都達(dá)到了50%,在部分游戲中的領(lǐng)先幅度高達(dá)80%以上。相比RTX 3090 Ti,RTX 4080 FE的性能平均也達(dá)到了25%左右的領(lǐng)先幅度。不過相比RTX 4090 FE,RTX 4080 FE在4K分辨率下性能還是落后約35%。
1440p分辨率理論上不是RTX 4080的主戰(zhàn)場,不過考慮到很多玩家目前都還在1440p顯示器上奮戰(zhàn),因此我們也將這部分成績納入了測試之中。在1440p分辨率下,隨著游戲?qū)PU性能需求的降低,RTX 4080 FE和RTX 4090 FE、RTX 3090 Ti FE和RTX 3080 Ti FE的正負(fù)性能差距都有縮小的趨勢。在這一分辨率下,RTX 4080 FE平均性能領(lǐng)先RTX 3080 Ti約40%,GPU負(fù)荷越高,RTX 4080 FE的優(yōu)勢越明顯。與RTX 3090 Ti FE相比,在1440p分辨率下RTX 4080 FE的性能領(lǐng)先幅度縮小到了20%左右,同時相比RTX 4090的性能落后也縮小到了20%左右。
DLSS 2/3對比測試
在這部分中,我們和當(dāng)初測試RTX 4090 FE時一樣,對DLSS 3進(jìn)行了專項的測試。我們分別對比了同一代產(chǎn)品(RTX 4080)在 DLSS 2和DLSS 3設(shè)置下的不同游戲性能表現(xiàn),同時也對比了不同代產(chǎn)品在兩代DLSS設(shè)置下的不同表現(xiàn)(RTX 30系+DLSS 2對比RTX 40系+DLSS 3),以觀察在新一代DLSS技術(shù)的支持下,RTX 40系GPU相對上一代產(chǎn)品的有怎樣的迅猛提升。
先來看3DMark的DLSS TEST測試項目。很明顯,DLSS 3同比DLSS 2在性能上有50%以上的性能提升,相比Native原生幀率,更是最高提升幅度達(dá)到了400%左右。
來看同代產(chǎn)品間DLSS 2/3在實際游戲表現(xiàn)中的性能差距。我們用RTX 4080在11款支持DLSS 3的游戲中測試了兩代DLSS技術(shù)的性能比較。從測試數(shù)據(jù)來看,RTX 4080在同等級設(shè)置的DLSS模式下,DLSS 3下的幀率相對DLSS 2要強40%~70%,平均領(lǐng)先程度約為哦45%左右。如果同比Native原生幀率,DLSS 3模式下大約能達(dá)到原生幀率的2.5~4.5倍,平均下來也達(dá)到了Native原生幀率的3倍左右。可見DLSS 3確實在幀率提升方面確實令人喜出望外。
再來看跨代GPU搭配跨代DLSS模式的性能比較。這部分測試中我們選擇了RTX 3080 Ti和RTX 3090 Ti在DLSS 2設(shè)置下的幀率表現(xiàn),對比RTX 4080在DLSS 3設(shè)置下的幀率表現(xiàn)。從測試結(jié)果來看,DLSS 3模式下的RTX 4080 FE相對于RTX 3090 Ti平均達(dá)到了1.6倍左右的性能,而相對于RTX 3080 Ti來說,RTX 4080 FE在DLSS 3模式下對比DLSS 2模式的RTX 3080 Ti更是達(dá)到了平均1.75倍左右的性能,最高甚至達(dá)到了2.2~2.5倍的性能。DLSS 3的加持下,進(jìn)一步鞏固了RTX 4080 FE的性能優(yōu)勢。
DLSS 3及PCL測試
NVIDIA在DLSS 3中囊括了NVIDIA Reflex低延遲技術(shù),能夠極大地改善游戲體驗的流暢性,尤其是對FPS游戲來說更是意義重大,畢竟更低的延遲也就意味了更快速的反應(yīng)操作。另外隨著FrameView 1.4版本的更新,現(xiàn)在FrameView已經(jīng)能夠在支持的游戲中監(jiān)測、記錄游戲的PCL系統(tǒng)延遲時間與1%L fps低幀,這兩個指標(biāo)都是關(guān)系到游戲流暢與否的主要因素。因此,我們也選擇了包括《瘟疫傳說:安魂曲》《賽博朋克2077》《幻塔》等在內(nèi)的11款支持DLSS 3的游戲進(jìn)行了測試。
從測試結(jié)果來看,DLSS 3的幀率提升功能作用顯露無余。不只是在幀率表現(xiàn)上相對于Native原生幀率有100%~400%的提升,而且在1%L fps和PCL系統(tǒng)延遲上也有驚艷的表現(xiàn)。比如在4K分辨率設(shè)置的《生死輪回》游戲中,盡管在DLSS關(guān)閉的情況下能達(dá)到60fps以上的游戲幀率,但游戲的1%L fps僅為28fps左右,說明游戲仍然會時不時產(chǎn)生卡頓的情況,而且PCL系統(tǒng)延遲在DLSS關(guān)閉時也高達(dá)85ms。在開啟DLSS 3平衡模式之后,游戲幀率飆升到立刻150fps以上,達(dá)到了絕對流暢水準(zhǔn)。同時1%L fps也提升到了127fps,說明已經(jīng)不會在任何情況下影響到游戲的流暢運行。另一方面系統(tǒng)延遲也在開啟DLSS 3之后從85ms下降到了27ms,讓游戲更加絲滑順暢。在其余幾款測試游戲中,DLSS 3也有著同樣的表現(xiàn),請大家自行閱覽分析。
在RTX 4090 FE的首發(fā)評測時,我們已經(jīng)詳細(xì)地對比過DLSS 3、DLSS 2和Native原生之間的畫質(zhì)差異。即使在4K分辨率的DLSS性能模式的設(shè)置下,無論是DLSS 2還是DLSS 3,最終呈現(xiàn)的游戲畫面相對于原生畫質(zhì)幾乎看不出損失,與原生畫質(zhì)相差不大。對比DLSS 3和DLSS 2的性能模式,也可以看出二者基本沒有差別,甚至DLSS 3模式下的畫質(zhì)還略微清晰一些。這足以說明DLSS 3對游戲畫質(zhì)的影響幾乎可以忽略不計,至少多絕大多數(shù)玩家來說,完全不用擔(dān)心開啟DLSS 3之后在游戲中看到明顯的畫質(zhì)損失。為了讓大家有更直觀的認(rèn)識,我們又在本次測試過程中截取了不同DLSS 3設(shè)置下的游戲畫面,并與原生畫質(zhì)進(jìn)行對比,結(jié)果仍然是沒有太大差別,甚至更好。
▲4K分辨率,《賽博朋克2077》
▲1440p,《賽博朋克2077》
▲1440p,《F1 22》
我們在兩款不同游戲中分別截取了同一場景下的原生(圖中)、DLSS 2平衡(圖左)和DLSS 3平衡(圖右)的游戲畫面。從三個不同場景的截圖可以明顯看出,在DLSS 3設(shè)置下的游戲畫面相比DLSS 2和原生畫質(zhì)沒有任何的損耗,甚至在放大到300%左右可以發(fā)現(xiàn),DLSS 3模式下的畫面鋸齒感相比原生畫質(zhì)更小,相比DLSS 2都還要更清晰一些。
2022年,11月15日,DLSS 3游戲庫新增如下:
《逆水寒》:已正式支持DLSS 3
《微軟模擬飛行》:已推出搶先體驗版,已于 11 月 11 日與《微軟模擬飛行》(Microsoft Flight Simulator )Sim Update 11 和全新《微軟模擬飛行》40 周年紀(jì)念版(Microsoft Flight Simulator 40th Anniversary Edition)同時發(fā)布。
《WRC Generations》:FIA WRC 官方游戲,11月16日推出,支持DLSS 3。
《極品飛車:不羈》:11月29日推出,支持DLSS 3。
《戰(zhàn)錘40K:暗潮》:11月30日推出,支持DLSS 3和光線追蹤技術(shù)。
下列兩款游戲?qū)⒏轮С諨LSS 3:
《毀滅全人類 2:重新探測》:11 月 15 日推出,幀率最高可提升至 2 倍。
《漫威蜘蛛俠:邁爾斯?莫拉萊斯》:11月18日發(fā)布,支持DLSS 3。
因此,當(dāng)今天GeForce RTX 4080正式發(fā)布時,將已有10款DLSS 3游戲發(fā)布上線,它們是《瘟疫傳說:安魂曲》《光明記憶:無限》《毀滅全人類2:重新探測》《暗影火炬城》《F1 22》《逆水寒》《生死輪回》《漫威蜘蛛俠:重制版》《微軟模擬飛行》和《超級人類》。
《WRC Generations》《極品飛車:不羈》和 《戰(zhàn)錘40K:暗潮》在RTX 4080推出后不久就會發(fā)布,圣誕節(jié)前玩家就可暢玩這些DLSS 3游戲。?
Studio性能測試
RTX 4080的設(shè)計創(chuàng)作性能如何?我們從視頻剪輯、3D建模渲染以及圖片處理三個方面對RTX 4080 FE進(jìn)行了考察。
在Davinci Resolve Studio 18的視頻剪輯轉(zhuǎn)碼處理測試中,相比RTX 3080 Ti,RTX 4080在各項測試中平均性能領(lǐng)先約30%,相比RTX 3090 Ti平均領(lǐng)先約20%。
在Blender模型渲染測試中,無論是Opendata benchmark還是Bledner 3.1模型渲染,RTX 4080相對于RTX 3080 Ti都有50%左右的性能提升,相對于RTX 3090 Ti,性能領(lǐng)先幅度也達(dá)到了35%或更高的程度。
在ON1 Resize AI 2022的圖片縮放處理測試中,RTX 4080和RTX 3090 Ti的性能差距極其有限,在5%左右,但相對于RTX 3080 Ti,還是有40%的性能領(lǐng)先幅度。
從整體測試結(jié)果來看,雖然RTX 4080在Studio設(shè)計創(chuàng)作性能上相比RTX 4090仍有一定差距,但確實已經(jīng)明顯勝過了RTX 3090 Ti和RTX 3080 Ti,尤其是相對于RTX 3080 Ti來說,RTX 4080的設(shè)計創(chuàng)作性能幾乎達(dá)到了后者的1.5倍甚至更高。
功耗測試
在RTX 4080 FE的功耗測試部分,我們想做點不一樣的。
一直以來我們都是用Furmark全滿載烤機(jī)的成績來作為顯卡功耗的基礎(chǔ)指標(biāo),其實這樣還是有一些不妥——因為它沒有代表玩家使用顯卡的真實情況。我們通常用TGP來表示GPU運行功耗的上限限制,對于高功耗的應(yīng)用,GPU的功耗可能會達(dá)到TGP的功耗上限,而GPU Boost的時鐘頻率將在功耗和散熱限制范圍內(nèi)被優(yōu)化。而在GPU受到CPU瓶頸限制的情況下,或GPU正在運行輕度工作負(fù)載的情況下,GPU的功耗可能遠(yuǎn)遠(yuǎn)低于TGP。在這些情況下,GPU Boost頻率仍可能達(dá)到設(shè)定的最大值,因此GPU的執(zhí)行效率將達(dá)到最大化。在大多數(shù)工作條件下,包括許多游戲在內(nèi),都只能使RTX 40系列GPU的功耗大大低于TGP。那么在玩家平時進(jìn)行典型應(yīng)用時,RTX 4080 FE的功耗會達(dá)到多少呢?在這樣的功耗條件下達(dá)到對應(yīng)的性能表現(xiàn),誰的能耗比更高?誰的每瓦性能表現(xiàn)更好呢?我們用NVIDIA PCAT功耗測試套件對典型應(yīng)用狀況進(jìn)行了測試。
在1440p分辨率、最高畫質(zhì)、最高光追特效、DLSS 平衡設(shè)置的《賽博朋克2077》游戲中,RTX 4080 FE的實際游戲運行功耗約為250W左右,同比相同狀態(tài)下,RTX 4090的運行功耗約為290W、RTX 3090 Ti接近400W,RTX 3080 Ti約為350W。在更低的功耗下,RTX 4080 FE實現(xiàn)了更高的性能,其能耗比明顯超越RTX 3090 Ti和RTX 3080 Ti許多。
4K分辨率下的情況大致相當(dāng),在4K分辨率下進(jìn)行《賽博朋克2077》游戲時,RTX 4080 FE的功耗大約達(dá)到了280W左右,相比1440p游戲有一定上漲。
8K分辨率下的游戲?qū)PU帶來了較大的負(fù)荷。在這一分辨率下進(jìn)行《賽博朋克2077》游戲時,RTX 4080 FE的功耗達(dá)到了290W以上,但平均功耗仍然低于300W。反觀RTX 3090 Ti,此時的功耗已經(jīng)達(dá)到了450W以上,即使RTX 3080 Ti的功耗也保持在380W左右。
Furmark烤機(jī)時,各款顯卡基本都能達(dá)到TGP設(shè)定的上限甚至更高。
最后,我們把各個狀態(tài)下的功耗表現(xiàn)做了一個總結(jié),來一起看看。
如果我們把3DMark TimeSpy Extreme的測試分?jǐn)?shù),除以運這一程序時的GPU平均功耗,是不是就能得到一個每瓦分?jǐn)?shù)的答案?這個可以近似地用來表示GPU在進(jìn)行DX12游戲時的每瓦性能。同樣,我們把3DMark PortRoyal的測試分?jǐn)?shù)除以運行它時的平均功耗,是不是就能近似地得到光追游戲時的每瓦性能(非絕對正確的每瓦性能,但具有較大參考意義)?
非常直觀,在代表DX12游戲性能的3DMark TimeSpy Extreme測試中,RTX 4080 FE的每瓦性能參考指數(shù)約為123.38,是RTX 3080 Ti的1.7倍,是RTX 3090 Ti的2.1倍,換句話說,近似地可以看作RTX 4080 FE在DX 12非光追游戲中的每瓦性能相對于RTX 3090 Ti達(dá)到了翻倍,而相對于RTX 3080 Ti則在每瓦游戲性能上提升了70%以上。
再來看光追環(huán)境的情況。在3DMark PortRoyal的測試中,RTX 4080 FE相對于RTX 3080 Ti的每瓦光追游戲性能提升了75%,而相對于RTX 3090 Ti更是提升達(dá)到了90%以上。很明顯可以看出,得益于優(yōu)秀的Ada Lovelace架構(gòu)和TSMC 4N NVIDIA定制工藝的應(yīng)用,RTX 40系GPU的每瓦光追游戲性能有了迅猛的增長,增長幅度也遠(yuǎn)超過了50%。
哦,最后還有GPU溫度控制。在室溫26℃的環(huán)境下,我們用Furmark對RTX 4080 FE進(jìn)行了持續(xù)25分鐘的烤機(jī)測試,最后RTX 4080 FE的核心溫度穩(wěn)定在了62℃上下,由此也足以說明RTX 4080 FE的散熱結(jié)構(gòu)設(shè)計非常優(yōu)秀,這樣的溫度控制也著實讓人驚喜。
高性能,低功耗,這才是高端游戲顯卡應(yīng)有的樣子
說實話,最開始的時候我們是有想過首發(fā)價格9499元的RTX 4080 FE應(yīng)該是能夠擁有匹敵RTX 3090 Ti這種前一代頂級旗艦的降維打擊能力的,不過最后測試中發(fā)現(xiàn)RTX 4080 FE在一般游戲中都有著超越RTX 3090 Ti 25%以上的性能表現(xiàn)還是多少有那么一丁點意外。所以在測試了RTX 3090 Ti對比之后,我們果斷放棄了原本的上一代對位對比顯卡RTX 3080,因為這就根本不是同一個層級的東西了,而且價格上也確實相差太遠(yuǎn)。所以最后選定了價格定位相對靠近的RTX 3080 Ti與旗艦頂級RTX 3090 Ti作為對比。
從整體的成績表現(xiàn)來看,我覺得RTX 4080 FE的定位還是比較清晰且準(zhǔn)確的。作為搭配了76組SM單元,9728個CUDA核心的AD103核心其定位顯然是RTX 40系GPU旗艦族群中的守門員,因此其價格也達(dá)到了9499元起的地步。從性能測試的成績來看,RTX 4080 FE的表現(xiàn)也是完全合格的,在各項測試中均表現(xiàn)出了超過RTX 3080 Ti 40%以上的性能,相對于RTX 3090 Ti的性能領(lǐng)先幅度也在25%左右,實現(xiàn)了大步伐的全面超越。特別要提的是,在DLSS 3的輔助下,RTX 4080 FE的性能甚至相對于RTX 3080 Ti達(dá)到了100%以上的提升,而且在每瓦性能表現(xiàn)上相對于RTX 3090 Ti和RTX 3080 Ti都有50%以上的提升。所以對目前還嫌RTX 4090的價格太高而難以接受的話,RTX 4080倒是一個比較合適的頂級性能選擇,至少它已經(jīng)將RTX 3090 Ti都甩得遠(yuǎn)遠(yuǎn)的,成為了這個性能段的高性價比選擇。當(dāng)然,還得希望上市之后不要溢價太多,如果能保持在萬元左右,那么RTX 4080對不差錢的玩家來說,毫無疑問將成為頂級旗艦性能顯卡市場上的最熱門選擇。當(dāng)然,如果預(yù)算還是受限只能眼饞RTX 4080,那就再等等吧!等明年的RTX 4070和RTX 4060,或許又能帶來一波新的驚喜。
編輯:黃飛
?
評論
查看更多