隨著(zhù)RTX 4060顯卡的發(fā)布,40系顯卡已經(jīng)涵蓋從60-90級別的全覆蓋,對于5000元主流預算攢機的玩家,這張功耗更低,性能更強的60級產(chǎn)品是非常不錯的選擇。今天帶來(lái)的則是影馳GeForce RTX 4060 金屬大師顯卡的評測。
60級別的產(chǎn)品一直是最受玩家歡迎的,從Steam硬件調查榜可以看到,位列前五名的分別是GTX 1650、GTX 1060、RTX 3060、RTX2060,以及RTX 3060 Laptop。
而在游戲分辨率的調查中顯示,1080p分辨率仍以64.33%的絕對優(yōu)勢牢牢占據第一的位置。這張RTX 4060顯卡的推出,可以把光追帶給更多1080p的主流玩家。
金屬大師雖然一直是影馳的平價(jià)系列產(chǎn)品,但通體采用金屬打造,即便無(wú)光,依舊質(zhì)感滿(mǎn)滿(mǎn)。而在RTX 40系中,金屬大師也再次做了升級,下面先來(lái)看一下外觀(guān)。
1 影馳GeForce RTX 4060 金屬大師 顯卡概覽
RTX 30系中金屬大師采用了較為圓潤的設計語(yǔ)言,頗有一種剛柔并濟的美。而在RTX 40系中,該系列再次回歸了硬朗的金屬風(fēng)格。
影馳GeForce RTX 4060 金屬大師上手之后的第一感受就是“扎實(shí)”。顯卡采用雙風(fēng)扇設計,尺寸為228×113×41mm(不含擋板),占用雙槽空間,不大不小剛剛好,另外由于通體金屬材質(zhì),觸感冰涼。
根據官方介紹,金屬大師的設計靈感來(lái)源于科幻片種的能量魔方。筆者第一時(shí)間就聯(lián)想到了《變形金剛》中的火種源,其表面的紋路甚至都有一絲相似之處。
如果有心靈手巧的用戶(hù),可以在金屬大師的外甲上試試做戰損效果,光想想那種未來(lái)科技感,就已經(jīng)非常讓人心動(dòng)了。
影馳GeForce RTX 4060 金屬大師主動(dòng)散熱部分采用了兩個(gè)20mm厚,直徑92mm的11葉靜霜風(fēng)扇,獨特的三折扇葉可實(shí)現更強風(fēng)壓更大風(fēng)量,并且支持智能啟停。
在內部散熱上,影馳GeForce RTX 4060 金屬大師采用2根6mm鍍鎳復合熱管、大面積高效能均熱板和鰭片。
影馳GeForce RTX 4060 金屬大師采用一體成型背板,整體裝飾都以金屬大師系列logo為主??梢钥吹轿膊跨U空部位和擋板延伸出的圖案其實(shí)都是logo本身的變體。
影馳GeForce RTX 4060 金屬大師顯卡側面可以看到單8pin供電接口,這張顯卡TDP僅有115W,不過(guò)NVIDIA官方推薦的電源依然為550W。
這種情況一般為整機內配件都是旗艦的情況下,如果玩家目前的處理器為上一代或者較為入門(mén)的型號,可以適當降低電源。不過(guò)如果是新裝機的用戶(hù),電源最好還是直接上550W或更高,能夠為后續硬件擴展留下充足余地。
從側面也能看到,金屬大師的擋板、壓鑄件、背板采用聯(lián)動(dòng)設計,整體性更強。不僅增加顯卡的防護能力,防止PCB變行,還可以輔助散熱,加快熱量傳導。
視頻輸出接口上,采用了HDMI 2.1 + DP 1.4a*3的四接口設計。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。雖然接口依然支持高規格,但放在這張卡上其實(shí)有點(diǎn)奢侈了。
2 NVIDIA GeForce RTX 4060架構淺析
本次發(fā)布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,采用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了的760億個(gè)晶體管,而在RTX 30系顯卡中為280億個(gè)。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的著(zhù)色器數據吞吐量。
本次發(fā)布的RTX 4060共有3072個(gè)CUDA核心,提供了15-TFLOPS算力;24個(gè)第三代Ada RT Core擁有35 RT-TFLOPS;96個(gè)第四代Tensor Core可提供242 Tensor-TFLOPS。
另外在本次的規格說(shuō)明上,NVIDIA官方也特別表明了L2 Cache容量以及最終的等效帶寬,這是RTX 40在架構中變化比較大的地方,同時(shí)也是玩家對位寬減小有爭議的“罪魁禍首”。
我們以?xún)蓮垐D來(lái)簡(jiǎn)單說(shuō)明L2緩存的作用。
如果把GPU內核比作網(wǎng)店店主,那么L1緩存就是在日常工作的屋子中堆放的可發(fā)貨產(chǎn)品,但由于所有工作都要在這間屋子進(jìn)行,堆放產(chǎn)品的空間有限;所以大部分產(chǎn)品就需要到L2緩存中,它就好比在工作室隔壁的倉庫,雖然需要走出去,但仍然是很近的路程。
如果這個(gè)倉庫還是放不下,那么只能到更遠的顯存中去調取產(chǎn)品。當然如果有爆顯存的情況,那么這位“店主”可能還要打車(chē)去更遠的系統內存區調取數據。
這中間的路程和耗費時(shí)間就好比GPU額外的工作量,如果絕大部分數據只存放在L2緩存就可以拿到,那么將極大節省功耗。并且由于不再需要頻繁調取顯存中的數據,所以顯存位寬適當降低,對于運行效率也是沒(méi)有影響的。
在真正的GPU中,內核是所有計算發(fā)生的地方,而這就是L1數據緩存的作用所在。每個(gè)SM都有一個(gè)超低延遲的L1數據緩存,緊挨其處理內核,使L1成為GPU尋找信息的首選。
然而,由于L1緩存需要離內核非常近,不可能非常大。
如果在L1緩存中找不到內核計算所需的數據,GPU將在L2數據緩存中尋找。這個(gè)顯存系統位于GPU芯片上,并通過(guò)一個(gè)非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個(gè)GPC包括多個(gè)SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數據并將其放入內核。
如果在L2緩存中找不到信息(被稱(chēng)為緩存缺失),那么GPU將通過(guò)顯存接口在VRAM中尋找。這在整個(gè)GPU存儲子系統中產(chǎn)生了很多額外的工作量,并降低了性能和功耗效率。
完整的AD102核心
完整的AD106核心
RTX 4060使用的AD107核心
本次RTX 4060罕見(jiàn)地使用了AD107芯片,與RTX 4060 Ti并不相同。采用了3組GPC,平分16組TPC,并且NVENC單元變?yōu)?個(gè)。
這張RTX 4060的L2緩存為24MB,而上一代RTX 3060為3MB;與RTX 4060 Ti和RTX 3060 Ti相同,都達到了8倍的差距。
增加L2緩存的大小可以提高性能,降低延遲,并提高續航時(shí)長(cháng),數據訪(fǎng)問(wèn)在GPU上即可完成(否則GPU就要頻繁從顯存讀取數據,過(guò)分依賴(lài)顯存帶寬)。所以,這也是為什么在RTX 40系顯卡中,位寬帶寬普遍偏小的原因。
3 測試平臺簡(jiǎn)介
GPU-Z在2.54版本的更新中,已經(jīng)能夠識別RTX 4060 Ti和RTX 4060的信息。
影馳GeForce RTX 4060 金屬大師采用AD107核心,擁有3072個(gè)CUDA,Boost頻率為2460MHz,RTX 3060則為1777MHz,提升非常大。
采用8GB GDDR6顯存,位寬為128bit,顯存帶寬272 GB/s(最終等效帶寬453 GB/s),光柵單元和紋理單元為48和96。
這里注意一下,RTX 4060與RTX 4060 Ti的光柵單元都是48個(gè),所以在性能提升上,RTX 4060相較RTX 3060還是相當大的。
4 理論性能測試
下面先進(jìn)行的是用來(lái)衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實(shí)際測試結果如下:
在FS套裝測試中,影馳GeForce RTX 4060 金屬大師顯卡相比RTX 3060,其中FS提升28%;FSE提升22%;FUS提升10%,綜合提升20%。對比剛剛發(fā)布的RTX 4060 Ti,綜合成績(jì)相差23%左右。
而在針對DX12環(huán)境下的Time Spy和Time Spy Extreme測試中,影馳GeForce RTX 4060 金屬大師顯卡相較RTX 3060的提升分別為:TS提升19%;TSE提升18%,綜合約為19%。對比RTX 4060 Ti,綜合成績(jì)相差23%左右。
PortRoyal是3DMARK中專(zhuān)門(mén)針對光追性能的測試項,影馳GeForce RTX 4060 金屬大師顯卡相較RTX 3060的提升約為16%。對比RTX 4060 Ti,相差27%左右。
綜合來(lái)看,影馳GeForce RTX 4060 金屬大師顯卡的傳統理論性能相較RTX 3060的提升約為18%。
下面我們再來(lái)看看3DMARK中新增的一些具體應用場(chǎng)景的測試。
Speed Way測試是3DMARK最新更新的用于測試DirectX12 Ultimate 性能的顯卡基準測試。要運行此測試,顯卡必須支持 DirectX 12 Ultimate 并包含 6GB 及以上顯存。
這項測試結合了實(shí)時(shí)光線(xiàn)追蹤和傳統渲染技術(shù)來(lái)測量顯卡性能。場(chǎng)景含有光線(xiàn)追蹤反射、實(shí)時(shí)全局光照、網(wǎng)格著(zhù)色器、體積照明、粒子和后處理效果。所以SW的測試基本可以看做次世代3A游戲基準。
影馳GeForce RTX 4060 金屬大師顯卡對比RTX 3060,從1080p分辨率到4K提升依次為:14%/13%/13%。
另外我們使用3DMARK剛剛更新的DLSS 3進(jìn)行了相關(guān)性能測試。不過(guò)由于RTX 3060無(wú)法開(kāi)啟,這里使用DLSS2進(jìn)行對比測試。
在2K分辨率下,影馳GeForce RTX 4060 金屬大師顯卡DLSS開(kāi)關(guān)相比RTX 3060的提升為31%/17%;4K分辨率由于關(guān)閉情況下顯卡幾乎無(wú)法正常運行,僅看開(kāi)啟狀態(tài),提升約為58%。
5 常規游戲 性能測試
?。ㄔ谟螒驕y試中,如有提幀技術(shù),NVIDIA均開(kāi)啟DLSS質(zhì)量模式。)
在《極限競速:地平線(xiàn)5》中,測試成績(jì)非常有意思,我們細分析來(lái)看。影馳GeForce RTX 4060 金屬大師顯卡相比RTX 3060在1080p分辨率下提升明顯,達到33%;而在2K分辨率下提升為17%,4K分辨率下則被RTX 3060反超,雖然只有1幀,但也說(shuō)明大顯存在高分辨率下的優(yōu)勢相當明顯。
另外1080p分辨率中,RTX 4060與RTX 4060 Ti的分數相差不大,這是因為該分辨率下主要瓶頸在于CPU。
在《刺客信條:英靈殿》中,影馳GeForce RTX 4060 金屬大師顯卡相比RTX 3060的提升分別為:1080p提升22%;2K提升16%;4K提升11%,綜合提升16%。
在《無(wú)主之地3》中,影馳GeForce RTX 4060 金屬大師顯卡相比RTX 3060的提升分別為:1080p提升21%;2K提升20%;4K分辨率相差2幀。
《光明記憶:無(wú)限》的光追測試軟件是獨立于游戲的測試工具,比游戲中用到的光線(xiàn)追蹤技術(shù)更多,測試條件為“RTX最高/DLSS質(zhì)量”。
性能方面,影馳GeForce RTX 4060 金屬大師顯卡相比RTX 3060的提升分別為:1080p提升31%;2K提升20%;4K提升6%,綜合提升19%。
在另外一款國產(chǎn)游戲《邊境》的跑分軟件中,情況基本與《光明記憶:無(wú)限》相同,測試條件均在“RTX最高/DLSS質(zhì)量”下進(jìn)行。
在《邊境》中,影馳GeForce RTX 4060 金屬大師顯卡相比RTX 3060的提升分別為:1080p提升35%;2K提升24%;4K提升29%,綜合提升30%。
暴雪剛剛發(fā)布的游戲《暗黑破壞神4》已經(jīng)集成了DLSS 3,不過(guò)能夠明顯看到,在DLSS 3開(kāi)啟的情況下幀率下降。目前這種反常的表現尚不清楚原因,但大概率是游戲優(yōu)化存在問(wèn)題,我們也將持續關(guān)注暗黑4的后期動(dòng)向。
但是在1080p分辨率下,影馳GeForce RTX 4060 金屬大師開(kāi)啟DLSS 3已經(jīng)能夠達到200幀以上的極致體驗。
最后的測試中本該測一下“跑分軟件”《賽博朋克2077》的,不過(guò)最近游戲更新幾次后,崩潰問(wèn)題愈發(fā)明顯,到現在已經(jīng)完全無(wú)法進(jìn)游戲。所以我們只能看看早先的截圖,體會(huì )一下不同的光影模式。
從上至下依次為超級畫(huà)質(zhì)/光追超級/光追過(guò)載??梢钥吹焦庾愤^(guò)載相比光追超級更貼近于真實(shí)效果。它模擬了真實(shí)的光線(xiàn)路徑,其實(shí)相比之前的光線(xiàn)追蹤模擬了更多光線(xiàn)在不同表面的反射,完整的計算出了場(chǎng)景的真實(shí)光照,避免了上一代光追中出現“死黑”的情況。
這也是NVIDIA致力于打造的下一代光追場(chǎng)景,但是截止目前它對硬件計算的需求太過(guò)龐大,即便是旗艦顯卡,也無(wú)法在4K分辨率下流暢運行。
6 AV1編碼測試
本次AV1編碼測試選擇了剪映專(zhuān)業(yè)版,它可以輸出H.264/HEVC/AV1三種編碼格式的視頻。
剪映專(zhuān)業(yè)版目前自帶AV1編碼輸出,在實(shí)際測試中,我們導出一段1分鐘左右的視頻??梢钥吹絻蓚€(gè)文件容量相差103MB。
由于A(yíng)V1編碼特性,生成文件的比特率更低,但視頻清晰度則完全相同。所以如果生成同比特率,同容量的文件,AV1將會(huì )更清晰。
我們通過(guò)NVIDIA ICAT來(lái)進(jìn)行兩段視頻的畫(huà)面對比,圖中左側為H.264編碼,右側為AV1編碼。在100%的細節對比中,幾乎看不出任何區別。
7 D5渲染測試
D5是一款國內實(shí)時(shí)光線(xiàn)追蹤渲染器,支持多種建模軟件直讀,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已經(jīng)支持DLSS 3,下面我們分別看看幀數和功耗的情況。
選擇軟件自帶的默認場(chǎng)景【簡(jiǎn)約客廳】
在實(shí)時(shí)幀數表現上,由于D5采用實(shí)時(shí)GPU渲染,所以壓力全在顯卡??梢钥吹皆贒LSS關(guān)和DLSS 2的情況下兩款顯卡差別不大,但是采用DLSS 3幀生成后,影馳GeForce RTX 4060 金屬大師顯卡達到68幀。對于不要求高幀率的渲染軟件來(lái)說(shuō),能夠流暢轉動(dòng)視角就夠了。
功耗方面,影馳GeForce RTX 4060 金屬大師顯卡的TDP為115W;RTX 3060的TDP為170W。關(guān)閉DLSS的情況下,兩張顯卡幾乎都處于滿(mǎn)載狀態(tài)。
DLSS 2開(kāi)啟后能夠緩解一部分壓力,DLSS 3則能夠讓RTX 4060僅用60W流暢運行軟件。
8 RTX VSR(RTX Video Super Resolution)測試
目前RTX VSR(RTX Video Super Resolution)已經(jīng)在部分瀏覽器中進(jìn)行測試,首先玩家需要更新到NVIDIA最新驅動(dòng),在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。
RTX VSR是 AI 圖像處理的突破,它超越了傳統的邊緣檢測和特征銳化技術(shù),極大地提升直播視頻內容的質(zhì)量。
開(kāi)啟RTX VSR不僅需要最新版驅動(dòng),還需要使用RTX 40或30系列GPU,并且幾乎適用于Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容(瀏覽器也需要更新到最新版本)。
開(kāi)啟后,目前已知的打開(kāi)YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不確定,在全屏播放視頻時(shí),可以打開(kāi)任務(wù)管理器,看到GPU負載增加,即為開(kāi)啟成功。
?。c(diǎn)擊放大查看原圖)
我們打開(kāi)YouTube隨意觀(guān)看視頻,在打開(kāi)RTX VSR后,可以清晰明顯的看到水下珊瑚的質(zhì)量明顯提高,邊緣更為清晰,并且極大減少了失真現象。
9 溫度及功耗測試
功耗測試中,我們選擇FurMark軟件進(jìn)行拷機測試,并采用GPU-Z檢測溫度,功耗僅計算顯卡自身。
影馳GeForce RTX 4060 金屬大師顯卡通過(guò)20分鐘左右的拷機測試,溫度一直控制在61℃左右,熱點(diǎn)溫度在69℃左右。對于一張雙風(fēng)扇顯卡來(lái)說(shuō),這個(gè)溫度相當理想,看來(lái)通體金屬覆蓋確實(shí)更有助于散熱。
游戲動(dòng)態(tài)功耗測試
影馳GeForce RTX 4060 金屬大師顯卡 3A游戲平均功耗
RTX 3060 3A游戲平均功耗
在實(shí)際的游戲功耗測試中,我們選擇《刺客信條:英靈殿》自帶benchmark,畫(huà)面設置最高、2K分辨率,來(lái)拉滿(mǎn)兩張顯卡的性能極限,檢測我們實(shí)際應用場(chǎng)景的功耗。
可以看到兩款顯卡雖然均為60級別,但剛剛發(fā)布的RTX 4060平均功耗為113W,而RTX 3060則是158W,低了45W,對于同為60級別顯卡來(lái)說(shuō),這的確是一個(gè)驚人的成績(jì)。
10 宇宙魔方 Allspark
RTX 40系的兩張60級別顯卡分別定位:RTX 4060 Ti光追游戲1080p百幀;RTX 4060光追游戲1080p流暢,如果有DLSS 3加成的游戲,也能達到百幀左右。
從性能上來(lái)說(shuō),RTX 4060采用了與RTX 4060 Ti相同的48個(gè)光柵單元,所以相較RTX 3060的綜合提升在20%左右,而RTX 4060 Ti相比RTX 3060 Ti的綜合提升在12%左右。
拋開(kāi)顯存來(lái)說(shuō),這張RTX 4060稱(chēng)得上一張完美的迭代產(chǎn)品,但它再次回到了標準的8GB顯存,享受過(guò)12GB大顯存,確實(shí)讓人非常難受。
游戲方面主打1080p分辨率的60級顯卡,對顯存要求確實(shí)不高。但在生產(chǎn)力工具上,12GB顯存用處還是非常大的,這也是為什么RTX 3060 12GB被那么多用戶(hù)喜愛(ài)的原因之一。尤其是在人人都是創(chuàng )作者的時(shí)代,簡(jiǎn)單的后期工作幾乎成了必備技能。
除了性能提升顯著(zhù),這張RTX 4060的實(shí)際使用功耗在100W出頭?;臼腔氐?年前,GTX 1060的級別了。相比30系整體“爆炸”的功耗來(lái)說(shuō),本代產(chǎn)品的能耗比顯著(zhù)提升。雖然在入門(mén)級產(chǎn)品中用戶(hù)的感受不強,但相比RTX 30系動(dòng)輒300W、400W的實(shí)際使用功耗來(lái)說(shuō),長(cháng)期使用可以節省不少電費開(kāi)銷(xiāo),尤其是在南方電費比較貴的情況下。
本代金屬大師的外觀(guān)設計再次回到了有棱有角的硬朗風(fēng)格,不過(guò)相比20系的方正,這張4060金屬大師看起來(lái)更扎實(shí),聯(lián)動(dòng)、包裹的外甲設計,除了整體性更強之外,也更利于導熱。