距離RTX 4060發(fā)布已經(jīng)過(guò)去一個(gè)多月,今天為大家帶來(lái)的是技嘉GeForceRTX 4060 GAMING OC 8G顯卡評測。
歷代60級別顯卡都是最受歡迎的,它不僅擁有全新架構的特性,還擁有良好的性?xún)r(jià)比。畢竟5000元裝機才是絕大部分用戶(hù)的真實(shí)預算。
根據Steam硬件調查榜7月份的最新數據顯示,位列前五名的分別是GTX 1650、RTX 3060、GTX 1060、RTX2060,以及RTX 3060 Laptop。相比7月份的數據,RTX 3060從第三名升至第二,雖然僅提升一名,但以Steam的體量來(lái)說(shuō),漲幅超過(guò)0.1%已經(jīng)算是非常大的提升了。
而在游戲分辨率的調查中顯示,1080p分辨率仍以61.47%的絕對優(yōu)勢占據第一,雖然增幅最快的2K分辨率漲幅達到0.86%,但相較1080p仍然相差甚遠。
這張RTX 4060顯卡的推出,可以把光追帶給更多1080p的主流玩家。下面我們先來(lái)看看這款技嘉RTX 4060魔鷹OC的外觀(guān)。
1 技嘉RTX 4060魔鷹OC 顯卡概覽
這張RTX 4060顯卡由于規格縮減,整體在尺寸上小了不少,技嘉RTX 4060魔鷹OC的外包裝也小巧了許多。
本代技嘉魔鷹系列顯卡外觀(guān)同樣進(jìn)行了迭代,按理說(shuō)RTX 4060這個(gè)級別的產(chǎn)品,雙風(fēng)扇散熱足以。但三風(fēng)扇能提供更低的溫度,同時(shí)在滿(mǎn)載時(shí)風(fēng)扇轉速又不會(huì )太高,能夠有效降低噪音,延長(cháng)壽命。
技嘉RTX 4060魔鷹OC的整體尺寸為281×114×40mm,不超過(guò)300mm的尺寸能夠裝在絕大多數ITX機箱中,而且標準的雙槽厚度,在三風(fēng)扇顯卡中也相對小巧。
技嘉RTX 4060魔鷹OC主動(dòng)散熱部分采用三個(gè)8cm11葉風(fēng)扇,每一葉風(fēng)扇上都能夠看到5條凹槽,這是為了讓氣流由風(fēng)扇邊緣分流,并平滑地引導氣流通過(guò)表面上的3D條紋曲線(xiàn)。另外風(fēng)扇采用了正逆轉設計,每個(gè)風(fēng)扇的旋轉方向與相鄰風(fēng)扇不同??捎行p少擾流并增加氣壓。
風(fēng)扇采用納米石墨烯潤滑油,它可以延長(cháng)一般油封軸承風(fēng)扇壽命,達到如滾珠軸承一樣的耐用,而且更為安靜。
另外,智能啟停風(fēng)扇可在GPU溫度較低或處于較低負載時(shí),自動(dòng)停止運轉提供零噪音的舒適體驗。
技嘉RTX 4060魔鷹OC采用了一體成型金屬背板,尾部有大面積鏤空散熱,可以看到延長(cháng)的散熱鰭片,使風(fēng)流通過(guò),增強散熱性能。
在靠近視頻接口一側,可以看到雙BIOS的設計,SILENT會(huì )提供較安靜的使用體驗,出廠(chǎng)默認為OC性能模式。如果玩家需要較安靜的運行環(huán)境,可將撥桿調到右側,模式切換后需重啟才會(huì )生效。
技嘉RTX 4060魔鷹OC顯卡側面可以看到單8pin供電接口,這張顯卡TDP僅有115W,推薦電源450W即可。
視頻輸出接口上,采用了HDMI 2.1 + DP 1.4a*3的四接口設計。HDMI 2.1可支持4K 120Hz HDR、8K 60Hz HDR。雖然接口依然支持高規格,但放在這張卡上其實(shí)有點(diǎn)奢侈了。
2 NVIDIA GeForce RTX 4060架構淺析
本次發(fā)布的GeForce RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,采用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達到了的760億個(gè)晶體管,而在RTX 30系顯卡中為280億個(gè)。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升,最高可達到90-TFLOPS的著(zhù)色器數據吞吐量。
本次發(fā)布的RTX 4060共有3072個(gè)CUDA核心,提供了15-TFLOPS算力;24個(gè)第三代Ada RT Core擁有35 RT-TFLOPS;96個(gè)第四代Tensor Core可提供242 Tensor-TFLOPS。
另外在本次的規格說(shuō)明上,NVIDIA官方也特別表明了L2 Cache容量以及最終的等效帶寬,這是RTX 40在架構中變化比較大的地方,同時(shí)也是玩家對位寬減小有爭議的“罪魁禍首”。
我們以?xún)蓮垐D來(lái)簡(jiǎn)單說(shuō)明L2緩存的作用。
如果把GPU內核比作網(wǎng)店店主,那么L1緩存就是在日常工作的屋子中堆放的可發(fā)貨產(chǎn)品,但由于所有工作都要在這間屋子進(jìn)行,堆放產(chǎn)品的空間有限;所以大部分產(chǎn)品就需要到L2緩存中,它就好比在工作室隔壁的倉庫,雖然需要走出去,但仍然是很近的路程。
如果這個(gè)倉庫還是放不下,那么只能到更遠的顯存中去調取產(chǎn)品。當然如果有爆顯存的情況,那么這位“店主”可能還要打車(chē)去更遠的系統內存區調取數據。
這中間的路程和耗費時(shí)間就好比GPU額外的工作量,如果絕大部分數據只存放在L2緩存就可以拿到,那么將極大節省功耗。并且由于不再需要頻繁調取顯存中的數據,所以顯存位寬適當降低,對于運行效率也是沒(méi)有影響的。
在真正的GPU中,內核是所有計算發(fā)生的地方,而這就是L1數據緩存的作用所在。每個(gè)SM都有一個(gè)超低延遲的L1數據緩存,緊挨其處理內核,使L1成為GPU尋找信息的首選。
然而,由于L1緩存需要離內核非常近,不可能非常大。
如果在L1緩存中找不到內核計算所需的數據,GPU將在L2數據緩存中尋找。這個(gè)顯存系統位于GPU芯片上,并通過(guò)一個(gè)非常高速的橫梁系統連接到所有的GPC(圖形處理集群),每個(gè)GPC包括多個(gè)SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數據并將其放入內核。
如果在L2緩存中找不到信息(被稱(chēng)為緩存缺失),那么GPU將通過(guò)顯存接口在VRAM中尋找。這在整個(gè)GPU存儲子系統中產(chǎn)生了很多額外的工作量,并降低了性能和功耗效率。
完整的AD102核心
完整的AD106核心
RTX 4060使用的AD107核心
本次RTX 4060罕見(jiàn)地使用了AD107芯片,與RTX 4060 Ti并不相同。采用了3組GPC,平分16組TPC,并且NVENC單元變?yōu)?個(gè)。
這張RTX 4060的L2緩存為24MB,而上一代RTX 3060為3MB;與RTX 4060 Ti和RTX 3060 Ti相同,都達到了8倍的差距。
增加L2緩存的大小可以提高性能,降低延遲,并提高續航時(shí)長(cháng),數據訪(fǎng)問(wèn)在GPU上即可完成(否則GPU就要頻繁從顯存讀取數據,過(guò)分依賴(lài)顯存帶寬)。所以,這也是為什么在RTX 40系顯卡中,位寬帶寬普遍偏小的原因。
3 測試平臺簡(jiǎn)介
GPU-Z在2.54版本的更新中,已經(jīng)能夠識別RTX 4060 Ti和RTX 4060的信息。
技嘉RTX 4060魔鷹OC采用AD107核心,擁有3072個(gè)CUDA,Boost頻率為2550MHz,RTX 3060則為1777MHz,提升非常大。
采用8GB GDDR6顯存,位寬為128bit,顯存帶寬272 GB/s(最終等效帶寬453 GB/s),光柵單元和紋理單元為48和96。
這里注意一下,RTX 4060與RTX 4060 Ti的光柵單元都是48個(gè),所以在性能提升上,RTX 4060相較RTX 3060還是相當大的。
4 理論性能測試
下面先進(jìn)行的是用來(lái)衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實(shí)際測試結果如下:
在FS套裝測試中,技嘉RTX 4060魔鷹OC顯卡相比RTX 3060,其中FS提升31%;FSE提升29%;FUS提升14%,綜合提升25%。對比剛剛發(fā)布的RTX 4060 Ti,綜合成績(jì)相差18%左右。
而在針對DX12環(huán)境下的Time Spy和Time Spy Extreme測試中,技嘉RTX 4060魔鷹OC顯卡相較RTX 3060的提升分別為:TS提升20%;TSE提升20%,綜合為20%。對比RTX 4060 Ti,綜合成績(jì)相差22%左右。
PortRoyal是3DMARK中專(zhuān)門(mén)針對光追性能的測試項,技嘉RTX 4060魔鷹OC顯卡相較RTX 3060的提升約為17%。對比RTX 4060 Ti,相差25%左右。
綜合來(lái)看,技嘉RTX 4060魔鷹OC顯卡的傳統理論性能相較RTX 3060的提升約為21%。
下面我們再來(lái)看看3DMARK中新增的一些具體應用場(chǎng)景的測試。
Speed Way測試是3DMARK最新更新的用于測試DirectX12 Ultimate 性能的顯卡基準測試。要運行此測試,顯卡必須支持 DirectX 12 Ultimate 并包含 6GB 及以上顯存。
這項測試結合了實(shí)時(shí)光線(xiàn)追蹤和傳統渲染技術(shù)來(lái)測量顯卡性能。場(chǎng)景含有光線(xiàn)追蹤反射、實(shí)時(shí)全局光照、網(wǎng)格著(zhù)色器、體積照明、粒子和后處理效果。所以SW的測試基本可以看做次世代3A游戲基準。
技嘉RTX 4060魔鷹OC顯卡對比RTX 3060,從1080p分辨率到4K提升依次為:17%/16%/15%。
另外我們使用3DMARK剛剛更新的DLSS 3進(jìn)行了相關(guān)性能測試。不過(guò)由于RTX 3060無(wú)法開(kāi)啟,這里使用DLSS2進(jìn)行對比測試。
在2K分辨率下,技嘉RTX 4060魔鷹OC顯卡DLSS開(kāi)關(guān)相比RTX 3060的提升為32%/17%;4K分辨率由于關(guān)閉情況下顯卡幾乎無(wú)法正常運行,僅看開(kāi)啟狀態(tài),提升約為58%。
5 常規游戲 性能測試
?。ㄔ谟螒驕y試中,如有提幀技術(shù),NVIDIA均開(kāi)啟DLSS質(zhì)量模式。)
本次測試我們還增加了剛剛發(fā)布的《無(wú)畏契約》,作為一款競技網(wǎng)游,對于顯卡的要求并不高。我們的測試選擇英雄釋放技能,中等戰斗場(chǎng)面截取平均幀。
技嘉RTX 4060魔鷹OC顯卡在1080p分辨率下能達到700幀以上的成績(jì),即便是4K分辨率下,也能穩定在200幀以上。
另外《無(wú)畏契約》游戲內提供了減少延遲技術(shù),所有分辨率測試均開(kāi)啟Reflex + Boost選項,可以看到即便在4K分辨率下,延遲也僅有4.4ms左右。
暴雪剛剛發(fā)布的游戲《暗黑破壞神4》已經(jīng)集成了DLSS 3,不過(guò)能夠明顯看到,在DLSS 3開(kāi)啟的情況下幀率下降。目前這種反常的表現尚不清楚原因,但大概率是游戲優(yōu)化存在問(wèn)題,我們也將持續關(guān)注暗黑4的后期動(dòng)向。
1080p分辨率下,技嘉RTX 4060魔鷹OC開(kāi)啟DLSS 3已經(jīng)能夠達到200幀以上的極致體驗。即便在2K分辨率下,在開(kāi)啟最高畫(huà)質(zhì)的同時(shí),也能夠達到電競級幀率,這對一張主流甜品卡來(lái)說(shuō)足夠了。
在《極限競速:地平線(xiàn)5》中,技嘉RTX 4060魔鷹OC顯卡相比RTX 3060在1080p分辨率下提升明顯,達到33%;而在2K分辨率下提升為19%,4K分辨率下則被RTX 3060反超,雖然只有1幀,但也說(shuō)明大顯存在高分辨率下的優(yōu)勢相當明顯。
另外1080p分辨率中,RTX 4060與RTX 4060 Ti的分數相差不大,這是因為該分辨率下主要瓶頸在于CPU。
在《刺客信條:英靈殿》中,技嘉RTX 4060魔鷹OC顯卡相比RTX 3060的提升分別為:1080p提升24%;2K提升17%;4K提升11%,綜合提升17%。
在《無(wú)主之地3》中,技嘉RTX 4060魔鷹OC顯卡相比RTX 3060的提升分別為:1080p提升25%;2K提升22%;4K分辨率相差2幀。
《光明記憶:無(wú)限》的光追測試軟件是獨立于游戲的測試工具,比游戲中用到的光線(xiàn)追蹤技術(shù)更多,測試條件為“RTX最高/DLSS質(zhì)量”。
性能方面,技嘉RTX 4060魔鷹OC顯卡相比RTX 3060的提升分別為:1080p提升35%;2K提升23%;4K提升6%,綜合提升21%。
在另外一款國產(chǎn)游戲《邊境》的跑分軟件中,情況基本與《光明記憶:無(wú)限》相同,測試條件均在“RTX最高/DLSS質(zhì)量”下進(jìn)行。
在《邊境》中,技嘉RTX 4060魔鷹OC顯卡相比RTX 3060的提升分別為:1080p提升35%;2K提升27%;4K提升29%,綜合提升30%
最后的測試中本該測一下“跑分軟件”《賽博朋克2077》的,不過(guò)最近游戲更新幾次后,崩潰問(wèn)題愈發(fā)明顯,到現在已經(jīng)完全無(wú)法進(jìn)游戲。所以我們只能看看早先的截圖,體會(huì )一下不同的光影模式。
從上至下依次為超級畫(huà)質(zhì)/光追超級/光追過(guò)載??梢钥吹焦庾愤^(guò)載相比光追超級更貼近于真實(shí)效果。它模擬了真實(shí)的光線(xiàn)路徑,其實(shí)相比之前的光線(xiàn)追蹤模擬了更多光線(xiàn)在不同表面的反射,完整的計算出了場(chǎng)景的真實(shí)光照,避免了上一代光追中出現“死黑”的情況。
這也是NVIDIA致力于打造的下一代光追場(chǎng)景,但是截止目前它對硬件計算的需求太過(guò)龐大,即便是旗艦顯卡,也無(wú)法在4K分辨率下流暢運行。
6 AV1編碼測試
本次AV1編碼測試選擇了剪映專(zhuān)業(yè)版,它可以輸出H.264/HEVC/AV1三種編碼格式的視頻。
剪映專(zhuān)業(yè)版目前自帶AV1編碼輸出,在實(shí)際測試中,我們導出一段1分鐘左右的視頻??梢钥吹絻蓚€(gè)文件容量相差103MB。
由于A(yíng)V1編碼特性,生成文件的比特率更低,但視頻清晰度則完全相同。所以如果生成同比特率,同容量的文件,AV1將會(huì )更清晰。
我們通過(guò)NVIDIA ICAT來(lái)進(jìn)行兩段視頻的畫(huà)面對比,圖中左側為H.264編碼,右側為AV1編碼。在100%的細節對比中,幾乎看不出任何區別。
7 D5渲染測試
D5是一款國內實(shí)時(shí)光線(xiàn)追蹤渲染器,支持多種建模軟件直讀,包括SketchUp、3Ds MAX、Rhino、Revit、Archicad、Blender、C4D等。目前也已經(jīng)支持DLSS 3,下面我們分別看看幀數和功耗的情況。
選擇軟件自帶的默認場(chǎng)景【簡(jiǎn)約客廳】
在實(shí)時(shí)幀數表現上,由于D5采用實(shí)時(shí)GPU渲染,所以壓力全在顯卡??梢钥吹皆贒LSS關(guān)和DLSS 2的情況下兩款顯卡差別不大,但是采用DLSS 3幀生成后,技嘉RTX 4060魔鷹OC顯卡達到70幀。對于不要求高幀率的渲染軟件來(lái)說(shuō),能夠流暢轉動(dòng)視角就夠了。
功耗方面,技嘉RTX 4060魔鷹OC顯卡的TDP為115W;RTX 3060的TDP為170W。關(guān)閉DLSS的情況下,兩張顯卡幾乎都處于滿(mǎn)載狀態(tài)。
DLSS 2開(kāi)啟后能夠緩解一部分壓力,DLSS 3則能夠讓RTX 4060僅用60W流暢運行軟件。
8 RTX VSR(RTX Video Super Resolution)測試
目前RTX VSR(RTX Video Super Resolution)已經(jīng)在部分瀏覽器中進(jìn)行測試,首先玩家需要更新到NVIDIA最新驅動(dòng),在NVIDIA控制面板中的【調整視頻圖像設置】可以看到最新的RTX 視頻增強超分辨率。
RTX VSR是 AI 圖像處理的突破,它超越了傳統的邊緣檢測和特征銳化技術(shù),極大地提升直播視頻內容的質(zhì)量。
開(kāi)啟RTX VSR不僅需要最新版驅動(dòng),還需要使用RTX 40或30系列GPU,并且幾乎適用于Google Chrome和Microsoft Edge瀏覽器中的所有視頻內容(瀏覽器也需要更新到最新版本)。
開(kāi)啟后,目前已知的打開(kāi)YouTube或者B站,都可以享受到RTX VSR效果的加成。
如果不確定,在全屏播放視頻時(shí),可以打開(kāi)任務(wù)管理器,看到GPU負載增加,即為開(kāi)啟成功。
?。c(diǎn)擊放大查看原圖)
我們打開(kāi)YouTube隨意觀(guān)看視頻,在打開(kāi)RTX VSR后,可以清晰明顯的看到水下珊瑚的質(zhì)量明顯提高,邊緣更為清晰,并且極大減少了失真現象。
9 溫度及功耗測試
功耗測試中,我們選擇FurMark軟件進(jìn)行拷機測試,并采用GPU-Z檢測溫度,功耗僅計算顯卡自身。
技嘉RTX 4060魔鷹OC顯卡通過(guò)30分鐘左右的拷機測試,溫度一直控制在58℃左右,熱點(diǎn)溫度在68℃左右。三風(fēng)扇散熱的效果確實(shí)強悍,通常雙風(fēng)扇RTX 4060拷機過(guò)程中的核心溫度,已經(jīng)接近了這張魔鷹的熱點(diǎn)溫度。
游戲動(dòng)態(tài)功耗測試
技嘉RTX 4060魔鷹OC顯卡 3A游戲平均功耗
RTX 3060 3A游戲平均功耗
在實(shí)際的游戲功耗測試中,我們選擇《光明記憶:無(wú)限》自帶benchmark,畫(huà)面設置最高、光線(xiàn)追蹤最高、DLSS質(zhì)量、2K分辨率,來(lái)拉滿(mǎn)兩張顯卡的性能極限,檢測我們實(shí)際應用場(chǎng)景的功耗。
可以看到兩款顯卡雖然均為60級別,但剛剛發(fā)布的RTX 4060平均功耗為114W,而RTX 3060則是158W,低了45W,對于同為60級別顯卡來(lái)說(shuō),這的確是一個(gè)驚人的成績(jì)。
10 極致低溫 冷靜散熱
顯卡型號來(lái)到60級別,可以說(shuō)是大部分用戶(hù)最為關(guān)注的系列,它能夠享受新架構的特性和功能,價(jià)格又非常親民,對于5000元預算攢機的玩家來(lái)說(shuō),這張RTX 4060是當之無(wú)愧的首選。
本次我們評測的技嘉RTX 4060魔鷹OC為三風(fēng)扇顯卡,很多玩家戲稱(chēng)“三風(fēng)扇別把核心吹感冒”,但對于顯卡來(lái)說(shuō),60℃能工作,80℃也能工作,區別就是壽命長(cháng)短。畢竟長(cháng)時(shí)間在高溫環(huán)境下工作,對于元器件老化有很大影響。
性能方面,RTX 40系的兩張60級別顯卡分別定位:RTX 4060 Ti光追游戲1080p百幀;RTX 4060光追游戲1080p流暢,如果有DLSS 3加成的游戲,也能達到百幀左右。
技嘉RTX 4060魔鷹OC相比RTX 3060綜合提升在20%左右,拋開(kāi)顯存來(lái)說(shuō),這張RTX 4060稱(chēng)得上一張完美的迭代產(chǎn)品。對于很多自媒體,或日常有后期需求的玩家來(lái)說(shuō),12GB顯存確實(shí)能提供很大幫助。
除了性能提升顯著(zhù),這張RTX 4060的實(shí)際使用功耗在100W出頭,能耗比同樣顯著(zhù)提升。幾乎所有老用戶(hù)都可直接升級,無(wú)需更換電源。畢竟僅需450W的電源,大部分10系顯卡用戶(hù)就已經(jīng)安排上了。
目前這張技嘉RTX 4060魔鷹OC的售價(jià)為2549元,感興趣的用戶(hù)不妨關(guān)注一下。