詮釋最炫RGB顯卡！耕升GeForce RTX 4090 炫光 OC評測

TIME

2022-10-28 10:10

中關(guān)村在線(xiàn)

分享

　　從Ampere到AdaLovelace，NVIDIA耗費了兩年時(shí)間，RTX4090 給我們帶來(lái)的是幾乎兩倍于RTX3090Ti 的性能表現，第三代光追技術(shù)和第三代DLSS技術(shù)再一次告訴世界，NVIDIA仍然是這個(gè)星球上最懂圖形技術(shù)、最能夠帶來(lái)驚艷GPU芯片的半導體公司。

　　我們已經(jīng)為大家帶來(lái)了包括公版顯卡在內的多款RTX4090 評測，這一代的非公顯卡在設計上可以說(shuō)是各顯神通，每一個(gè)AIC廠(chǎng)商對RTX4090 都有著(zhù)不一樣的理解。今天的主角是來(lái)自耕升的GeForceRTX 4090 炫光OC，它可能是當前市場(chǎng)上運用了最多RGB燈光元素的RTX4090，下面我們一起來(lái)探索這塊最炫RGB顯卡。

1耕升GeForceRTX 4090 炫光OC概覽

　　作為最為老牌的顯卡廠(chǎng)商之一，耕升的每一代產(chǎn)品都會(huì )在設計上給大家帶來(lái)多樣化的選擇，顧名思義，“炫光”系列就是主打外觀(guān)燈光效果的系列產(chǎn)品。

　　耕升 RTX 4090 炫光 OC產(chǎn)品綜述|圖片(5)|參數|報價(jià)|點(diǎn)評

　　耕升GeForceRTX 4090 炫光OC的正面采用了鏡面效果的鋼琴烤漆工藝設計，這種工藝在當下的電子產(chǎn)品上已經(jīng)不太多見(jiàn)，它的優(yōu)點(diǎn)是表面有著(zhù)極佳的光澤效果，能夠最大程度地表達光之藝術(shù)，缺點(diǎn)則是容易沾染指紋。當然對于顯卡來(lái)說(shuō)，沾指紋的缺點(diǎn)可以忽略，畢竟放到機箱里面后，很難再會(huì )把它拿出來(lái)把玩。

　　在顯卡沒(méi)有點(diǎn)亮的時(shí)候，耕升GeForceRTX 4090 炫光OC顯得比較低調，不過(guò)一旦將它運轉起來(lái)，就能夠感受到溢出的RGB效果，整個(gè)顯卡的正面、側面都被RGB元素籠罩了起來(lái)。而且與其它顯卡在不開(kāi)燈狀態(tài)下也能夠看到表面紋理的設定不同，耕升GeForceRTX 4090 炫光OC的線(xiàn)條設計只有在運行狀態(tài)下才能夠體驗得到，給玩家帶來(lái)“進(jìn)化”的感覺(jué)。

　　值得一提的是，隨機附帶的顯卡支架也能夠支持ARGB燈光效果，連同顯卡的光效都可以通過(guò)升級版GW-SOUL調控軟件進(jìn)行設置，實(shí)現全局的燈光同步。

　　耕升GeForceRTX 4090 炫光OC搭載了第二代“炫之黑曜石”散熱器，全新升級成由2個(gè)102mm和1個(gè)92mm風(fēng)扇組合而成的強效風(fēng)扇系統，配合第二代耕升“炫風(fēng)之刃”造型的扇葉設計，讓加寬的9葉特殊葉型扇葉在相同的轉速下提升空氣流量，增強散熱效果，降低顯卡的溫度壓力。

　　顯卡后側也采用了鏤空設計，讓冷空氣可以直接穿透顯卡的散熱鰭片，提升空氣循環(huán)速度，加快核心的熱量散發(fā)。

　　第二代“炫之黑曜石”散熱器還運用了特大面積散熱鰭片，內置8根復合式熱管，并且在熱管中進(jìn)行鍍鎳設計以提升抗氧能力，從而進(jìn)一步提高顯卡的散熱效率。

　　耕升GeForceRTX 4090 炫光OC的背面設計相對樸實(shí)了一些，一塊金屬背板覆蓋了顯卡PCB，耕升的品牌元素印刷在顯卡左側。

　　顯卡頂部慣例是16pin12VHPWR 供電接口，支持全新PCI-E5.0 供電規范，出廠(chǎng)自帶了一組12VHPWR轉4*8Pin供電線(xiàn)，兼容舊型號電源無(wú)難度，最高可提供600W供電能力，為后續超頻奠定基礎。

　　耕升GeForceRTX 4090 炫光OC采用三槽設計，提供了三個(gè)DP1.4和1個(gè)HDMI2.1 顯示輸出接口，至于呼聲較高的DP2.0，其實(shí)目前絕大部分消費級游戲顯示器都沒(méi)有實(shí)裝，且DP1.4a 標準也能夠支持8K60Hz刷新率的顯示器。所以，綜合來(lái)看，絕對夠用。

　　總體來(lái)說(shuō)，耕升GeForceRTX 4090 炫光OC的燈光效果非常吸睛，與關(guān)機狀態(tài)下的外表形成了鮮明反差，應該會(huì )受到許多RGB愛(ài)好者的青睞。

2NVIDIA Ada Lovelace架構

　　本次發(fā)布的GeForceRTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造，采用TSMC4nm定制工藝（TSMC4 nm NVIDIA Custom Process），旗艦核心AD102達到了恐怖的760億個(gè)晶體管，而在RTX30系顯卡中為280億個(gè)。

　　與上一代NVIDIAAmpere相比，NVIDIA Ada Lovelace在相同功率下，具有2倍以上的性能提升。最高可達到90-TFLOPS的著(zhù)色器數據吞吐量，而本次發(fā)布的GeForceRTX 4090則達到83-TFLOPs，相比上一代NVIDIA Ampere則只有40-TFOPs。

　　完整的AD102核心共有18432個(gè)CUDA，其中包含12個(gè)圖形處理集群(GPCs)，72個(gè)紋理處理集群(TPCs)，144個(gè)流式多處理器(SMs)。144個(gè)第三代光追核心（RTCores）、576個(gè)第四代張量核心（TensorCores）。另外可以看到Boost頻率也從1.9GHz猛增到了2.5GHz。

　　另外一點(diǎn)在架構圖上沒(méi)有體現的是，AD102核心還包含288個(gè)FP64雙精度浮點(diǎn)核心(每SM2個(gè))，用來(lái)確保FP64代碼正確處理，包括FP64張量核心代碼。

　　通常來(lái)講，單精度浮點(diǎn)運算會(huì )用于深度學(xué)習模型訓練，而雙精度浮點(diǎn)運算則用于數值模擬工作。通常游戲卡都會(huì )砍掉FP64，這既節省了成本，又對游戲本身沒(méi)有影響。而專(zhuān)業(yè)卡都保留有FP64，目的就是為了精度更高訓練與計算。

　　此次資料中只提到了AD102核心搭載了288個(gè)FP64，尚不知道后續的推出的產(chǎn)品有無(wú)變更。

　　了解了完整的GA102核心，我們再來(lái)看一下RTX4090的核心，其實(shí)知道了RTX4090的參數，我們大概也能了解到后續可能推出的“Ti”系列究竟相差在哪。

　　相比完整的GA102來(lái)說(shuō)，RTX4090共有16384個(gè)CUDA，其中包含11個(gè)GPC、64個(gè)TPC以及128個(gè)SM單元，第三代RTCores為128個(gè)，第四代TensorCores為512個(gè)。

　　其實(shí)根據完整的架構圖就能看出，此次Ada架構整體結構性的改動(dòng)并不大，這一點(diǎn)從SM單元便能清晰印證，同樣的FP32CUDA核心，同樣的FP32/INT32混合CUDA核心，同樣的L1級緩存等等。當然，每個(gè)SM單元內部的TensorCore升級為第四代。

　　不過(guò)變化最為顯著(zhù)的，則是第三代光追核心，我們結合兩代架構來(lái)看。在第二代光追核心中，包含負責邊界交叉測試的BoxIntersection Engine引擎，和負責三角形交叉測試的TriangleIntersection Engine引擎。

　　而在第三代光追核心中，還增加了兩個(gè)新的引擎：OpacityMicro-Map Engines（OMM）和DisplacedMicro-Mesh Engines（DMM），這兩個(gè)新的硬件單元可以極大地提升光追性能（具體原理后文詳細介紹）。

　　至此，每2個(gè)SM單元組成一個(gè)TPC單元，每6組TPC單元組成一個(gè)完整的GPC頂層單元（在部分核心中，會(huì )出現5組TPC組成一個(gè)GPC單元的情況）。

　　而每個(gè)GPC單元又搭載一個(gè)獨立的光柵引擎、兩組ROP分區（每組包含8個(gè)ROP單元）。

　　過(guò)多關(guān)于數數的部分就不再介紹了，畢竟此次架構圖的大面上與NVIDIAAmpere架構基本相同，下面我們分別來(lái)看看，除了性能Ada架構還有哪些升級。

　　ShaderExecution Reordering （SER）著(zhù)色器執行重排序

　　SER主要的作用是提升著(zhù)色器性能，它可以將效率低下的工作負載，動(dòng)態(tài)重組為更高效的工作負載。主要針對光線(xiàn)追蹤的性能提升非常大。

　　簡(jiǎn)單地說(shuō)，GPU在執行類(lèi)似工作的時(shí)候效率最高。但隨著(zhù)光追效果越來(lái)越強大，每個(gè)場(chǎng)景可能有數百萬(wàn)條光線(xiàn)照射在不同材質(zhì)上，而我們知道不同材質(zhì)的反射率，以及反射效果也是不同的。所以這樣就為著(zhù)色器創(chuàng )建了大量的、發(fā)散的，效率低下的工作負載。

　　SER則可以將這些雜亂的指令重新分門(mén)別類(lèi)，動(dòng)態(tài)重組為更高效的工作負載。根據NVIDIA的說(shuō)法，SER可將著(zhù)色器性能最多提升2倍，并將游戲幀率最高提升25%。

　　舉個(gè)簡(jiǎn)單的例子，當光線(xiàn)第一次從發(fā)射端到碰撞端是非常有規律的射線(xiàn)，而碰撞到物體后的二次光追，則會(huì )出現大量發(fā)散的、無(wú)規律的反射，這對于光追負載是非常高的。而從圖中便能看到，SER可以將這些指令進(jìn)行二次排序，以發(fā)揮出著(zhù)色器的最大性能。

　　不過(guò)好在這么實(shí)用的功能并不是RTX40系的專(zhuān)利，它是一個(gè)易于集成的SDK，目前需要游戲開(kāi)發(fā)商集成在游戲中。另外由于它是一個(gè)通用的邏輯，后續也有可能直接集成在Windows的API中，這樣游戲開(kāi)發(fā)者就無(wú)需特意引用，直接調用系統API即可。

　　可以說(shuō)SER對于手持RTX20系及以上（能夠開(kāi)啟光線(xiàn)追蹤）的N卡用戶(hù)來(lái)說(shuō)，是極大地福音。畢竟免費提升的光追性能，誰(shuí)不喜歡呢。

　　第三代RTCores

　　RTCore的作用在于更快的光線(xiàn)追蹤計算能力，如果說(shuō)在RTX30系顯卡中，想要暢享4K高幀率游戲有點(diǎn)吃力，那么RTX40系顯卡中，將顯得輕而易舉。

　　在GeForceRTX 4090這張顯卡上，達到了191RT-TFLOPs的處理能力，而RTX30系顯卡最快處理能力為78RT-TFLOPs，足足為2.4倍。并且根據NVIDIA的官方說(shuō)法，第三代RTCore的峰值RT-TFLOPs相比于前代提高了2.8倍。而這只能說(shuō)明，這張4090并非AdaLovelace架構的最終形態(tài)。

　　OpacityMicro-Map Engines

　　在第三代RTCores中引入了兩個(gè)重要的硬件單元，首先是OpacityMicro-Map Engines，可以理解為微映射透明度引擎，它主要的作用是優(yōu)化光線(xiàn)追蹤渲染，可大幅減輕著(zhù)色器的工作負擔。

　　比如樹(shù)葉之類(lèi)的復雜物體，不同的光線(xiàn)都會(huì )影響它的表現狀態(tài)，以及樹(shù)葉之間的光線(xiàn)反彈，所以對于光線(xiàn)追蹤的計算量是巨大的。

　　不過(guò)OpacityMicro-MapEngines可以將光線(xiàn)追蹤特性烘焙到不透明蒙版中，所以那些不規則形狀和半透明的對象，也就能夠更快更精準的渲染出來(lái)，從而極大減輕著(zhù)色器的工作負擔。

　　DisplacedMicro-Mesh Engines（DMM）

　　DisplacedMicro-Mesh Engines可理解為微網(wǎng)格置換引擎，它構建光線(xiàn)追蹤的BVH（Boundingvolume hierarchy）的速度提高了10倍！所使用的的顯存減少了20倍！

　　DMM由第三代RTcore本地處理，與前幾代相比，它只使用基本三角形渲染復雜幾何圖形，極大減少了存儲和處理需求。

　　具體的工作原理從圖中一目了然，新的DMM可以將面數非常多的復雜圖形做簡(jiǎn)化，創(chuàng )造出簡(jiǎn)單的模型，但整體的光線(xiàn)追蹤效果不變。

　　通過(guò)一些模型數據我們可以具體看到，新的DMM將模型簡(jiǎn)化了多少。原本1100萬(wàn)三角面的模型，經(jīng)過(guò)簡(jiǎn)化后，只有15萬(wàn)左右的微網(wǎng)格，BVH的構建速度提升了8.5倍，小了6.5倍。

　　而這還不是最夸張的，越復雜的模型往往優(yōu)化的效果越好，在官方展示的這幾組對比示例中，最快可提升大于15倍的速度，容量簡(jiǎn)化20倍的模型。

　　第四代TensorCores

　　除了光追單元的升級外，第四代張量核心的升級更加恐怖。它采用了新的FP8張量引擎，在GeForceRTX 4090這張顯卡上，吞吐量達到了1.32Tensor petaFLOPs，提高了5倍。

　　注意這里的單位——petaFLOPs。以往的TFLOPs為萬(wàn)億次浮點(diǎn)運算，而petaFLOPs則為千萬(wàn)億次浮點(diǎn)運算。

　　DLSS3

　　本次推出的DLSS3也是RTX40系一大賣(mài)點(diǎn)，從DLSS2.3直接邁入了3.0版本，也能看出此次的升級之大。而DLSS3也被NVIDIA官方稱(chēng)為神經(jīng)網(wǎng)絡(luò )渲染新時(shí)代。

　　全新的DLSS3在原有的DLSS超分辨率的基礎上，添加了光學(xué)多幀生成技術(shù)，以生成全新的幀，而不像原來(lái)只能生成像素。

　　DLSS3結合了DLSS超分辨率、DLSS幀生成和NVIDIAReflex這三大技術(shù)，能夠重建八分之七的像素，極大提高性能。

　　在GPU受限的游戲中，比如2K分辨率及以上的更高分辨率，DLSS2能夠將幀率提高2倍，DLSS3則能夠提升4倍。

　　本次DLSS3跨越了一個(gè)大版本，從想法和原理上也再度升級，完全“猜想”1幀的技術(shù)，我們解釋起來(lái)簡(jiǎn)單，但實(shí)施起來(lái)需要大量的推理與演算，以及絕對超前的想法。

　　不過(guò)“憑空”生成的1幀，在延遲上絕對要比DLSS2高。所以此次完整的DLSS3中，捆綁了NVIDIAReflex，可以有效幫助減小延遲。

　　這也不負NVIDIA給它起了個(gè)“神經(jīng)網(wǎng)絡(luò )渲染新時(shí)代”的名號?？v觀(guān)目前市面上的XeSS、FSR技術(shù)，DLSS絕對稱(chēng)得上“巨人的肩膀”。當然，連年的創(chuàng )新，苦的是手持上一代顯卡的玩家，想體驗DLSS3的幀生成，目前唯一的辦法就是購入一張RTX40系顯卡。

　　NewOptical Flow Accelerator

　　NewOptical Flow Accelerator光流加速器是在第四代TensorCores中最新引入的，這也是為何DLSS3中的幀生成為RTX40系顯卡獨享。

　　光流加速器在原本DLSS2的基礎上，還可以計算兩個(gè)連續幀內的光流場(chǎng)，能夠捕捉游戲畫(huà)面從第1幀到第2幀的方向和速度，從中捕捉粒子、反射和光照等像素信息。并分別計算運動(dòng)矢量和光流來(lái)獲得精準的陰影重建效果。

　　以《賽博朋克2077》為例，在第一幀，光流加速器會(huì )捕捉到每一個(gè)像素中的粒子、反射和光照等信息。并在第二幀中查找匹配的像素區域，計算幀之間的差值。

　　如果說(shuō)原來(lái)DLSS2能夠“猜”出一張圖剩下的像素，那么DLSS3除了這些，還能夠“猜”出下一幀的畫(huà)面。

　　另外由于DLSS3的幀生成是在GPU中處理和運行的，所以即使遇到CPU瓶頸的游戲，AI同樣能夠提升幀率。這也是為什么在此次發(fā)布會(huì )中說(shuō)到，DLSS3能夠突破CPU的限制來(lái)提升幀數。

　　雙AV1編碼器

　　本次升級的第八代NVENC編碼器可以說(shuō)是直播、視頻、后期工作者的極大福音。它首次加入了對AV1編碼的支持，最顯而易見(jiàn)的效果就是直播。

　　相比傳統的H.264編碼，AV1編碼的效率平均提升了40%，在同碼率下AV1編碼的畫(huà)質(zhì)將更好。目前大部分直播的分辨率和清晰度，均受限于平臺規定的最大比特率。以Twitch限制的8Mbps為例，可以看到在同等帶寬下，同為2K60幀的畫(huà)面，采用AV1編碼的清晰度明顯比H.264更高。

　　說(shuō)起直播，OBS相信大家都不陌生，在10月份即將發(fā)布的補丁中，OBS就加入了對NVENC的AV1編碼支持

　　當然，直播只是我們更容易見(jiàn)到的AV1優(yōu)勢，在視頻工作的所有環(huán)節，AV1編碼都可以帶來(lái)極大提升。

　　所以，如圖所見(jiàn)。NVIDIA已經(jīng)為廣大用戶(hù)鋪好了一條完整的生態(tài)鏈，從編碼API、軟件、平臺到播放器，將全面支持AV1編碼。

　　另外再說(shuō)一下NVIDIA一直強調的雙AV1編碼。顧名思義，即部分顯卡內搭載了兩個(gè)編碼器，它所帶來(lái)的效果也是顯而易見(jiàn)的。

　　首先，根據官方宣傳的，在4KH.265的導出速度上，RTX4090是RTX3090 Ti的2.2倍；在8KH.265的導出速度上更是達到了2.5倍。這部分的提升，大家常用的剪映同樣適用，感興趣的用戶(hù)不妨親自體驗一下。

　　除了導出速度，8K60幀的視頻錄制在以前簡(jiǎn)直難以想象，而雙編碼器的好處就是可以將圖像一分為二，兩個(gè)編碼器分別處理7680x2160的圖像信息，最后拼合完整。

　　關(guān)于編碼部分，可能大部分用戶(hù)的感受不深，但當有一天，你想錄屏的時(shí)候，卻發(fā)現顯卡不支持，才會(huì )發(fā)覺(jué)它的重要性……

　　隨著(zhù)圖像逐漸進(jìn)入到超清時(shí)代，硬件編碼和渲染幾乎已經(jīng)成為不可或缺的幫手。雖然論質(zhì)量，硬件編碼仍不及CPU軟編，但軟編做到了極限畫(huà)質(zhì)，也要承受時(shí)間的無(wú)窮長(cháng)。甚至在一張8K渲染圖中，兩種編碼方式的時(shí)間差距就已經(jīng)達到了幾個(gè)小時(shí)，遑論一段10秒的CG動(dòng)畫(huà)。在不斷進(jìn)步的硬件編碼中，質(zhì)量和時(shí)間也在不斷地被挑戰和刷新。

3測試平臺簡(jiǎn)介

　　首先介紹一下測試平臺，為了保障耕升GeForceRTX 4090 炫光OC的性能發(fā)揮，我們的平臺也再次進(jìn)行了全面更新。不過(guò)由于手頭上沒(méi)有旗艦處理器，采用了12代中高端產(chǎn)品，并且在電源上進(jìn)行了著(zhù)重升級，采用了華碩ROG雷神2代1600W的鈦金牌全模組電源。

　　首先看一下GPU-Z的參數，耕升GeForceRTX 4090 炫光OC采用AD102核心，采用TSMC4nm 定制工藝（TSMC4 nm NVIDIA Custom Process），芯片面積608平方毫米，這里相對于RTX30 系的GA102的628平方毫米更小。

　　擁有16384個(gè)CUDA，相比RTX3090 Ti 的10752多52%，Boost頻率達到了2580MHz，相比公版的2520MHz有一定的提升。

　　采用24GBGDDR6XMicron顯存，位寬為384bit，顯存帶寬達到了1008.4GB/s，光柵單元和紋理單元為176和512。

4理論性能測試

　　下面先進(jìn)行的是用來(lái)衡量顯卡DX11理論性能的3DMARKFS套裝：FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能，取顯卡分數實(shí)際測試結果如下：

　　在針對顯卡DX11性能的3DMARKFS 套裝測試中，耕升GeForceRTX 4090 炫光OC的提升非常驚人，可以看到在分辨率越高的情況下這張顯卡提升越大，其中FS提升了65%；FSE提升了79%；FSU則暴力提升了82%。

　　綜合來(lái)看，在整個(gè)FS套裝的測試中，耕升GeForceRTX 4090 炫光OC相較GeForceRTX 3090 Ti 的提升約為75%。

　　3DMark FireStrike 系列測試是對顯卡DX11性能的全面檢驗，我們可以將FS系列的測試成績(jì)看做是大部分過(guò)去流行熱門(mén)游戲的基準參考，耕升GeForceRTX 4090 炫光OC相比上一代旗艦RTX3090Ti 以及RTX3090 都有著(zhù)巨幅性能提升。

　　而在針對DX12環(huán)境下的TimeSpy 和TimeSpy Extreme 測試中，耕升GeForceRTX 4090 炫光OC相較GeForceRTX 3090 Ti 的提升分別為：TS提升69%；TSE提升77%，綜合下來(lái)約為73%。

　　3DMarkTime Spy 系列是針對DX12圖形接口標準的基準性能測試，能夠代表目前以及可預見(jiàn)未來(lái)游戲大作的性能表現，耕升GeForceRTX 4090 炫光OC的成績(jì)同樣驚人，在考驗更為嚴苛的TSE測試中也有著(zhù)高達77%的性能提升。

　　PortRoyal是3DMARK中專(zhuān)門(mén)針對光追性能的測試項，耕升GeForceRTX 4090 炫光OC相較GeForceRTX 3090 Ti 的提升約為82%。

　　本次測試我們還引入了3DMark最新的SpeedWay性能測試模塊，SpeedWay使用光線(xiàn)追蹤和實(shí)時(shí)全局照明來(lái)渲染逼真的光照和反射效果。它基于新的DirectX12 旗艦版功能（如網(wǎng)格著(zhù)色器和可變速率著(zhù)色）來(lái)優(yōu)化性能和視覺(jué)質(zhì)量，是測試顯卡全方位綜合性能的基準測試工具。

　　由于這個(gè)工具剛剛發(fā)布，所以我們暫時(shí)沒(méi)有更多進(jìn)行其他產(chǎn)品的跑分進(jìn)行對比，這里的數據供大家參考，耕升GeForceRTX 4090 炫光OC的表現優(yōu)于其他Boost頻率同樣為2580MHz的競品，不過(guò)性能差異并不是非常明顯。

　　綜合來(lái)看，耕升GeForceRTX 4090 炫光OC的理論性能相較GeForceRTX 3090 Ti的提升約為77%，表現非常出彩。

　　耕升GeForceRTX 4090 炫光OCDLSS 3 4K

　　在本次測試中，我們使用3DMARK的測試版進(jìn)行了DLSS3 的相關(guān)測試。在4K分辨率下，DLSS關(guān)閉為58.43幀，DLSS3 開(kāi)啟后為175.51幀，提升幅度高達200%，這樣的性能跨越著(zhù)實(shí)罕見(jiàn)！

　　RTX3090 Ti DLSS 2 4K

　　另外我們也測試了GeForceRTX 3090 Ti 在該程序下成績(jì)，其中DLSS關(guān)閉為32.73幀，由于不支持DLSS3，所以在DLSS2 下的成績(jì)?yōu)?3.63幀。

　　耕升GeForceRTX 4090 炫光OC在開(kāi)啟DLSS3 后，相比關(guān)閉提升了200%；而GeForceRTX 3090 Ti 在開(kāi)啟DLSS2 后，相比關(guān)閉提升了155%。

　　當然DLSS3最夸張的還不止數字上這么簡(jiǎn)單，我們再來(lái)看看這張圖。

　　耕升GeForceRTX 4090 炫光OCDLSS 3 8K

　　在8K（7680x4320）分辨率下的 DLSS3 測試中，耕升GeForceRTX 4090 炫光OC在DLSS關(guān)閉的情況下僅有13.43幀，已經(jīng)無(wú)法正常運行游戲，而在開(kāi)啟DLSS3 后，一躍達到了93.68的流暢水準，提升了598%！

　　8K 下的測試成績(jì)意味著(zhù)耕升GeForceRTX 4090 炫光OC已經(jīng)可以滿(mǎn)足8K@60fps的游戲運行及格線(xiàn)，如果適當降低畫(huà)質(zhì)，畫(huà)面幀率甚至可以突破100Hz，這讓現在的8K電視等設備也可以用于游戲需求，為玩家帶來(lái)更加極致的游戲畫(huà)面。

5常規游戲性能測試

　　由于本次RTX40 系加入了DLSS3 新技術(shù)，所以后面會(huì )進(jìn)行單獨測試，這里依然選擇主流的幾款3A大作進(jìn)行游戲性能對比。

　　首先在《地平線(xiàn)5》中，可以明顯看到，不止在1080p分辨率下，即使在2K分辨率中，受限CPU的情況依然明顯。作為一款標準的3A游戲，在4K分辨率下依然可以跑到149幀，這在以前絕對是無(wú)法想象的。

　　對于像《地平線(xiàn)5》這樣的賽車(chē)游戲來(lái)說(shuō)，賽車(chē)競速只是部分玩家體驗絕美風(fēng)景的一種方式，分辨率和刷新率的改善帶來(lái)的不僅僅是游戲感受的提升，更是玩家對游戲內風(fēng)土人情的全新體驗。

　　性能方面，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分別為：1080p提升52%；2K提升56%；4K提升75%，綜合提升61%。

　　在《刺客信條：英靈殿》中，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090Ti 的提升分別為：1080p提升59%；2K提升69%；4K提升67%，綜合提升65%。在眾生平等《英靈殿》中取得如此巨額的畫(huà)面幀數改進(jìn)屬實(shí)難得，耕升GeForceRTX 4090 炫光OC即便在4K分辨率下也能夠獲得120fps的幀率表現，遠遠超過(guò)了一些競品，這非常不容易。

　　在《無(wú)主之地3》中，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分別為：1080p提升42%；2K提升68%；4K提升68%，綜合提升59%。

　　《光明記憶：無(wú)限》的光追測試軟件是獨立于游戲的測試工具，比游戲中用到的光線(xiàn)追蹤技術(shù)更多，測試條件為“RTX最高/DLSS質(zhì)量”。所以測試幀數相對較低，但實(shí)際游戲配置相當親民。

　　性能方面，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分別為：1080p提升78%；2K提升81%；4K提升73%，綜合提升77%。

　　在另外一款國產(chǎn)游戲《邊境》的跑分軟件中，情況基本與《光明記憶：無(wú)限》相同，測試條件均在“RTX最高/DLSS質(zhì)量”下進(jìn)行。

　　在《邊境》中，耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分別為：1080p提升82%；2K提升90%；4K提升85%，綜合提升86%。

　　《光明記憶：無(wú)限》和《邊境》兩款最早的光追測試程序，到今天也已經(jīng)陪伴著(zhù)NVIDIA走過(guò)了三代光追核心，見(jiàn)證了光線(xiàn)追蹤單元從懵懂到成熟的全過(guò)程。

　　耕升GeForceRTX 4090 炫光OC的提升是肉眼可見(jiàn)的，從初代只能保證1080P下的流暢運行，到如今在4K分辨率下獲得87fps的運行幀率，能夠切實(shí)感受到NVIDIA的技術(shù)“大躍進(jìn)”。

6DLSS 3性能測試

　　由于本次新技術(shù)DLSS3的推出，將有35款游戲將于近期推出全新的DLSS3功能，本次我們也拿到了部分游戲的測試版。

　　另外《超級人類(lèi)》、《生死輪回》、《逆水寒》“拂云庭“、《微軟模擬飛行》、《瘟疫傳說(shuō)：安魂曲》都將在10月陸續發(fā)布支持DLSS3 的版本。

　　其中《賽博朋克2077》、《F122》、《瘟疫傳說(shuō)：安魂曲》、《微軟模擬飛行》、《逆水寒》本次進(jìn)行了DLSS3 的測試，另外Unity和虛幻引擎也提供了本次的測試程序。

　　本次DLSS3 的測試圖表比較繁瑣，并且增加了1%Low FPS 和延遲的測試，普通的FPS好理解，那么這個(gè)1%Low FPS 是什么意思。

　　首先，游戲Benchmark通常測試的FPS即為，一段時(shí)間內的游戲平均幀。而1%Low FPS 則是將一段時(shí)間內的幀數從大到小排列，取最小的1%出來(lái)，再對這1%的數求平均值。

　　其實(shí)簡(jiǎn)單來(lái)說(shuō)，這兩個(gè)數值都不能代表我們在游玩時(shí)，具體哪一刻的感受，但FPS更注重整體，而1%Low FPS 則是從最差的里面求平均，更謹慎一些。

　　看懂了1%LowFPS，我們再來(lái)看這張圖表，在坐標軸左側的為延遲（越低越好），坐標軸右側的均為幀數（越高越好），并且由于牽扯到正負坐標，所以?xún)蓚鹊闹涤锌赡軙?huì )不同。

　　Frameview中的測試結果為小數點(diǎn)后三位，為了方便觀(guān)看，這里在幀數上進(jìn)行四舍五入，延遲則保留小數點(diǎn)后一位。由于目前測試DLSS3 的游戲均為測試版，所以難免出現BUG。

　　在《微軟模擬飛行》中，在開(kāi)啟和關(guān)閉DLSS2 的時(shí)候，分數幾乎無(wú)變化。這款游戲是極度吃CPU資源的游戲，如果瓶頸卡在處理器上，那么傳統的DLSS2 的確無(wú)法提供更多的幀數加成。

　　而在DLSS3 中，我們能夠明顯看到幀數的大幅提升，要知道我們所有DLSS3 的測試均在4K分辨率下進(jìn)行。

　　不過(guò)幀生成并不是毫無(wú)弊端，這也是為什么此次測試加入了延遲。并且在開(kāi)啟DLSS3 后，NVIDIAReflex 是捆綁開(kāi)啟的。但相對于DLSS2 增加的這點(diǎn)延遲，在實(shí)際體驗中的感受并不強。

　　在《賽博朋克2077》中的數據反映比較真實(shí)，可以看到在DLSS關(guān)的光線(xiàn)追蹤最高的情況下，即便耕升GeForceRTX 4090 炫光OC顯卡也只有38幀，并且延遲達到了50.6毫秒。

　　而在開(kāi)啟DLSS3 后，幀數為138，提升了263%。雖然相比DLSS2 的延遲高了11.3毫秒左右，但相比關(guān)閉DLSS來(lái)說(shuō)，依然維持在較低的水平。DLSS3 直接將耕升GeForceRTX 4090 炫光OC的運行幀數從及格線(xiàn)拉到了電競水平，實(shí)現了質(zhì)的飛躍。

　　《瘟疫傳說(shuō)：安魂曲》是最新發(fā)布的一款游戲，在DLSS3 和DLSS關(guān)之間的幀數提升，同樣達到了138%。在這款游戲中，DLSS3 相比DLSS2 的延遲增加了12.1ms，在我們測試過(guò)的4090顯卡中屬于比較低的水平了。

　　目前《F122》的數據測試同樣有問(wèn)題，在DLSS關(guān)和DLSS2 中均沒(méi)有延遲數據。

　　這一組主要看幀數的提升。其中DLSS3 相比DLSS關(guān)的幀數提升了147%，相比DLSS2 的提升也達到了23%。賽車(chē)游戲的幀數提升雖然不像FPS那樣可以提升游戲勝率，但是畫(huà)面越流暢，真實(shí)感就越強，玩家的體驗也就越沉浸，DLSS3 給《F122》帶來(lái)的改善相當巨大。

　　最后則是國產(chǎn)游戲《逆水寒》的光追測試，本次我們選擇的測試Demo采用了真正的全局光照。

　　在嘗試關(guān)閉DLSS運行后，幀數僅有個(gè)位數，而延遲早已上萬(wàn)。還記得在純光線(xiàn)追蹤軟件中測試的《光明記憶無(wú)限》和《邊境》，在本次只有DLSS2 的情況下都能夠達到80幀左右。而《逆水寒》這款真正意義上的全局光照，在DLSS2 開(kāi)啟后僅有50幀左右，著(zhù)實(shí)恐怖。不過(guò)在開(kāi)啟DLSS3 的情況下，4K分辨率也來(lái)到了82幀，已經(jīng)可以保證基本的游戲體驗了。

　　畫(huà)質(zhì)方面，在上圖中我們截取《賽博朋克2077》中的一角，可以看到在兩種DLSS模式下，相較原畫(huà)質(zhì)幾乎沒(méi)有明顯變化，只在柵欄處的光影效果有所不同，但對于如此大幅度的幀數提升，這點(diǎn)瑕疵幾乎可以忽略不計。

　　RTX3090 Ti即時(shí)幀數39幀

　　耕升GeForceRTX 4090 炫光OC即時(shí)幀數101幀

　　在Unity的測試程序中，有一組實(shí)時(shí)演算的光線(xiàn)追蹤+DLSS的幀數對比。耕升GeForceRTX 4090 炫光OC在開(kāi)啟DLSS3 后，實(shí)時(shí)幀數為101；而GeForceRTX 3090 Ti在開(kāi)啟 DLSS2 后，實(shí)時(shí)幀數為39幀，提升約為159%。

　　DLSS關(guān)81幀

　　DLSS2 160幀

　　DLSS3 195幀

　　在UE5提供的測試游戲中，方便地給出了DLSS的快捷測試，這里分為DLSS關(guān)（超分辨率關(guān)+幀生成關(guān)+Reflex關(guān)）；DLSS2（超分辨率性能+幀生成關(guān)+Reflex開(kāi)）；DLSS3（超分辨率性能+幀生成開(kāi)+Reflex開(kāi)）三檔測試。

　　其中，耕升GeForceRTX 4090 炫光OC在DLSS關(guān)的即時(shí)幀數為81幀，DLSS2 為160幀，DLSS3 為195幀。不過(guò)UE5這個(gè)測試的DLSS3 延遲為48.00ms，而DLSS2 為16.85ms，相對較高。

　　從DLSS3 的整體測試中能看到，在開(kāi)啟DLSS3之后畫(huà)面的延遲都有小幅度的提升，不過(guò)在大多數游戲中，這點(diǎn)延遲其實(shí)不會(huì )造成過(guò)多的負面影響，但是其提升的幀率將會(huì )實(shí)打實(shí)地帶來(lái)更為流暢的畫(huà)面，孰輕孰重不必多說(shuō)。

7專(zhuān)業(yè)軟件測試

　　作為“90”級別的顯卡，擁有24GB的超大顯存，內容創(chuàng )作者領(lǐng)域的應用是必不可少的。我們使用SPECviewperf13 這款工業(yè)、專(zhuān)業(yè)軟件跑分測試。

　　對比顯卡為耕升 GeForceRTX 4090 炫光OC顯卡、上一代旗艦GeForceRTX 3090 Ti 顯卡以及上一代游戲旗艦GeForceRTX 3080 Ti 顯卡。

　　在SPECviewperf13 的軟件測試中，每款專(zhuān)業(yè)軟件對于性能提升的程度不盡相同，其中SW相比RTX3090Ti 提升了34%，MAYA相比RTX3090Ti 提升了42%，CREO相比RTX3090Ti 提升了41%，CATIA相比RTX3090 Ti 提升了56%，3DSMAX 相比RTX3090Ti 提升了54%。

　　耕升GeForceRTX 4090 炫光OC測試得分

　　RTX3090 Ti 測試得分

　　Blender是一款專(zhuān)業(yè)的三維渲染軟件，本次推出了固定的Benchmark跑分軟件，省去了安裝軟件下載素材的麻煩。這款跑分軟件只需下載好啟動(dòng)程序，軟件會(huì )自動(dòng)渲染測試monster/junkshop/classroom共三個(gè)場(chǎng)景。

　　上圖為耕升GeForceRTX 4090 炫光OC顯卡得分，分別為6510/2977/3044分，平均4177分；下圖為GeForceRTX 3090 Ti 顯卡得分，分別為3136/1812/1549分，平均2165分。通過(guò)平均分的比較不難發(fā)現提升非常明顯，達到了93%，這對于以幀為渲染單位的動(dòng)畫(huà)來(lái)說(shuō)，能夠大幅度節省時(shí)間。

　　在專(zhuān)業(yè)軟件的測試中也可以感受到耕升GeForceRTX 4090 炫光OC的優(yōu)秀性能表現，雖然相對游戲幀數的提升沒(méi)有那么夸張，但是對于工作室來(lái)說(shuō)，每一個(gè)流程的效率改善都能夠加快項目進(jìn)度，從而快速完成任務(wù)，提升人效。

8功耗及溫度測試

　　功耗測試中，我們選擇FurMark軟件進(jìn)行拷機測試，并采用GPU-Z檢測溫度，功耗僅計算顯卡自身。

　　在本次的烤機測試中，耕升GeForceRTX 4090 炫光OC的表現同樣出色，在100%TDP 滿(mǎn)載的情況下，功耗來(lái)到了450W左右，與公版相當，但對于電源的要求也非?？植懒?，官方建議電源850W，這方面的預算不能節省。

　　另外在滿(mǎn)載拷機測試中，耕升GeForceRTX 4090 炫光OC峰值溫度為67.2℃，而熱點(diǎn)的峰值溫度為75.1℃，GPU頻率來(lái)到了2610MHz，已經(jīng)突破了標定值2580MHz，這也是它整體性能表現相對于其他競品來(lái)說(shuō)更好的原因之一。

9詮釋最炫RGB顯卡

　　AdaLovelace 架構給第三代光追核心增加的兩個(gè)新引擎OpacityMicro-Map Engines（OMM）和DisplacedMicro-Mesh Engines（DMM）為RTX4090 的光追性能帶來(lái)的提升令人難以置信，同時(shí)DLSS3 更是被NVIDIA官方稱(chēng)為神經(jīng)網(wǎng)絡(luò )渲染新時(shí)代，光線(xiàn)追蹤+神經(jīng)網(wǎng)絡(luò )渲染，為NVIDIA在過(guò)去幾年一直推動(dòng)的圖形技術(shù)賦予了更多的想象空間。

　　4K 高刷新的3A大作將不再是通過(guò)妥協(xié)畫(huà)面質(zhì)量才能夠獲得的，游戲玩家們可以憧憬8K分辨率下的極致虛擬世界，游戲工作室們也能夠在新顯卡算力的支持下，進(jìn)一步發(fā)揮想象空間，提升游戲畫(huà)面的真實(shí)氛圍，為游戲世界帶來(lái)更多的精彩故事。

　　耕升GeForceRTX 4090 炫光OC圓滿(mǎn)詮釋了它“最炫RGB顯卡”的定位，通過(guò)極致的反差感為玩家帶來(lái)個(gè)性化十足的燈光方案，哪怕你不是RGB愛(ài)好者，也不得不感嘆耕升實(shí)在是太會(huì )了，把顯卡的燈光設計帶到了新的高度。

　　同時(shí)，耕升GeForceRTX 4090 炫光OC也有著(zhù)不俗的性能表現，無(wú)論是理論性能測試還是游戲性能實(shí)測，都有著(zhù)超越同級競品的性能表現，可謂是有里有面，有顏值也有實(shí)力。綜合下來(lái)，是一款沒(méi)有明顯短板的RTX4090 顯卡，如果你想為自己的RGB機箱增添更多活力，那么耕升GeForceRTX 4090 炫光OC再合適不過(guò)了。目前這款顯卡已經(jīng)正式上市銷(xiāo)售，感興趣的朋友不要錯過(guò)！

THE END

免責聲明：本文系轉載，版權歸原作者所有；刊載之目的為傳播更多信息，如內容不適請及時(shí)通知我們。

相關(guān)熱點(diǎn)

甘肅首批兩座抽水蓄能電站集中開(kāi)工建設

　　新華社蘭州10月27日電（記者王銘禹）記者從甘肅省發(fā)改委新能源處獲悉，甘肅省張掖盤(pán)道山和肅南皇城兩座抽水蓄能電站27日集中開(kāi)工建設。這兩座抽水蓄能電站是《抽水蓄能...

業(yè)界

2022年第三季度財報海天味業(yè)發(fā)布很差的三季報

　　海天味業(yè)的“水逆”仍在持續?！　?0月26日，海天味業(yè)（603288.SH）發(fā)布了2022年第三季度財報。前三季度海天味業(yè)營(yíng)業(yè)收入190.94億元，同比增長(cháng)6.11%；實(shí)現歸屬凈利潤46.67億...

證券

最新文章

相關(guān)推薦

東京奧運會(huì )中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

微信顯示“正在輸入”，其實(shí)不是在回復消息，背后原因挺“傷人”

兩名航天員成功出艙航天員劉伯明成功開(kāi)啟天和核心艙節點(diǎn)艙出艙艙門(mén)

科技世界網(wǎng)創(chuàng )立于2009年，宗旨是科技創(chuàng )造財富，網(wǎng)絡(luò )改變世界。多年來(lái)力爭通過(guò)自主創(chuàng )新的技術(shù)實(shí)現為科技企業(yè)創(chuàng )造最大的價(jià)值。

關(guān)于我們 | 聯(lián)系我們 | 版權申明 | 投稿須知 | 網(wǎng)站地圖

認證聯(lián)盟：創(chuàng )宇信用百度企業(yè)

內容投訴：gold_ant@qq.com

數據合作：阿里云科協(xié)產(chǎn)業(yè)園

增值許可證：遼B2-20150256

關(guān)注我們

科技世界官方百家號

關(guān)注官方微信公眾號
探索科技與商業(yè)的邏輯

商務(wù)合作、媒體邀約
趕緊聯(lián)系我們

Copyright ? 2009-2022 twwtn.com 科協(xié)聯(lián)盟榮譽(yù)成員科技世界網(wǎng)僅提供信息傳播載體，所刊登文章僅供參考鄂ICP備2022015873號-1

人人狠狠综合久久亚洲88_国产超薄丝袜足底脚交国产_日本wvvw高清中文字幕_97国产品香蕉在线观看