大家好,非常榮幸能夠在英偉達與七彩虹的聯合邀請下繼續為大家帶來RTX 5070顯卡的首發測評。
上一張測過的RTX 5070 Ti雖然官方定位仍為2K卡,不過實際測試中,它在4K分辨率最高畫質下依舊能夠提供很高的幀率,因此,本次測試的七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡便當仁不讓的成為了全新一代2K卡皇。
今天就讓我們一起來看一看,在DLSS4 多重幀生成技術的加持下,全新RTX 5070顯卡的2K游戲表現到底有多強。那么廢話不再多說,我們開車吧。
七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡 外觀與參數
▲七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡采用了嘻哈風格設計,給人眼前一亮的感覺,上圖左邊為RTX 50系的iGame Ultra顯卡,右側為RTX 40系的iGame Ultra顯卡,你喜歡哪款呢?
▲七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡可以說是將嘻哈進行到底,不止以放縱不羈的字體噴涂了Ultra字樣,其下方更是有一個超大的ARGB燈板,單就燈效而言,本代iGame Ultra顯卡可以說是進步巨大。
▲直接放點亮的照片,類似霓虹燈的ARGB燈條貫穿顯卡側面,呈現出涂鴉藝術極強的視覺沖擊以及字體設計的美感,使之成為獨特的顯卡風景。
▲透過iGame Center軟件,不僅能夠調整七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡的燈效,還可以設置快捷的進行包括顯卡在內的硬件超頻,十分的方便。
▲另外,iGame系列大名鼎鼎的一鍵超頻按鍵在七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡上得到了延續,可以一鍵將顯卡的核心頻率由2325 MHz提升到2557 MHz,而在接口方面,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡則是中規中矩的3*DP 2.1b + 1*HDMI 2.1b接口的配置,使用DP接口時可以獲得滿血的4K 240Hz視頻輸出信號。
▲這款顯卡的詳細參數在這里,大家可以自行查看,我就不做復述了。
RTX 50系顯卡優勢分析
▲除了眾所周知的獨享DLSS 4多種幀生產功能與支持FP4數據結構之外,BlackWell架構的NVIDIA GeForce RTX 50系顯卡還有諸多架構性的優勢,在正式進行顯卡測試前,我還是簡單回顧下RTX 50系顯卡的優勢。
▲首先,BlackWell架構顯卡的CUDA核心既可以運算FP32數據類型,又可以運算INT 32數據類型,這意味著相較于Ada架構,Blackwell架構的INT32運算能力得到了翻倍增強。
▲其次,NVIDIA改進了SM中的著色器渲染管道,將不同的渲染類型分配給Tensor 核心與Shader 核心,以便進一步提升著色器與張量核心的運算效率,NVIDIA將其稱作RTX Neural Shaders(神經網絡著色器),得益于此,Blackwell架構的著色器渲染效率是Ada架構的兩倍
總的來說,Ada架構的SM是為標準著色器進行設計與優化的,而Blackwell架構的SM則是為了神經著色器而設計和優化的。
▲再次,BlackWell架構的NVIDIA GeForce RTX50系顯卡搭載了GDDR7顯存,使得顯存傳輸速率大幅提升,顯卡的游戲性能與AI性能也隨之大幅提升,另外,其顯存發熱則大幅降低,讓機箱散熱壓力得到了緩解。
BlackWell架構顯卡還有很多提升,這里就不多說了,我們進入顯卡的性能測試環節。
測試平臺簡介
▲本次測試,我搭建了一個比較純血的七彩虹iGame全家桶,其中機箱、電源、水冷三件套均為iGame全家桶,主板與CPU則是七彩虹iGame Z890 Flow V20與intel 酷睿U9 285K,并搭配了32GBx2 DDR5 6000MHz的內存。
▲而作為對照組,我使用的是RTX 4070 SUPER顯卡,從上面參數可以看到,RTX 4070 SUPER相較于RTX 4070有著巨幅的參數提升,CUDA數量直逼RTX 4070 Ti,一會我們就一起來看一看,本代RTX 5070顯卡,與上代RTX 4070 SUPER顯卡相比,能有多大的性能提升。
DLSS 4 讓幀率起飛
▲得益于Blackwell架構GPU專有張量運算核心等專有部分,RTX 50系顯卡才能獨占
DLSS Mutil Frame Generation 潛在多幀生成技術,它與DLSS Ray Reconstrucion 光線重構技術、DLSS Super Resolution 超分辨率技術與Deep Learning Anti-Aliasing 深度學習抗鋸齒技術共同構建了DLSS 4。
▲同時,DLSS技術還可通過 Super Resolution超分辨率技術,進一步降低實際渲染畫面時顯卡的壓力,比如顯卡在輸出4K分辨率的游戲畫面的時候,便可使用原生渲染方式,先渲染一幅1080P分辨率的畫面,再由 Super Resolution超分辨率技術將其提升至4K分辨率,然后再由多幀生成技術,最多生成出3個額外的幀。
▲因此,由GPU實際渲染的工作量僅為輸出畫面的1/16,而其余的15/16均由AI進行生成,進而大幅降低了高分辨率、高幀率游戲下,顯卡的壓力。
▲為了處理非常復雜的多幀生成過程,Blackwell架構的GPU采用了全新的硬件AI Management Processor,它可以將幀同步的邏輯轉移到顯示引擎上,能使GPU更加精確的管理顯示的時序。
得益于全新的Blackwell架構,DLSS 4在部分場景下幀率提升高達八倍,相較于DLSS 3,幀生成到多幀生成的速率也提升了1.7倍。
另外,顯卡同時處理語言模型與游戲引擎傳入GPU的數據時,可以更高效的分別RT 核心、CUDA 核心、Tensor核心間的工作負載與工作優先級,進而提升顯卡的整體效率。
▲除了潛在多幀生成技術之外,NVIDIA 還在DLSS 4中將之前的CNN Model改為了更為先進的Transformer Model,在使用DLSS 2與DLSS 3上的CNN卷積神經網絡是將本地像素數據聚合在一起,并以一個樹形結構進行分組分析,其計算效率已經很高,游戲畫質提升很明顯。
3DMark DLSS功能測試
技術介紹完成了,緊接著我們便開始進行性能實測吧,首先自然是3DMark的 DLSS功能測試。
▲在3DMark DLSS 功能測試1.5版本中,已經提供了對NVIDIA DLSS 4技術的支持,其中Frame Generation的2x意味著通過AI額外生成1幀,而3x意味著額外生成2幀,4x意味著額外生成3幀。這里,我將盡可能測試更多的模式,來看一看DLSS 4對幀率的提升有多明顯。
▲在2K分辨率下,未開啟DLSS時,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB的幀率為66 FPS,是對照組RTX 4070 SUPER幀率60 FPS的110%。而在開啟DLSS 4技術后,幀生成2X、3X、4X下,游戲幀率分別上升到了159 FPS、220 FPS、271 FPS,DLSS 4 幀生成4X下的幀率是未開啟DLSS時的410%,是RTX 4070 SUPER開啟DLSS 3后幀率121 FPS的224%。
《賽博朋克 2077》Benchmark
▲緊接著我們用實際游戲來體驗一下DLSS 4的表現,第一款游戲是《賽博朋克 2077》,這款游戲一直緊跟顯示技術最前沿,當時首測RTX 40系顯卡的時候,它便是最早支持DLSS 3潛在幀生成技術的游戲之一,而后的DLSS 3.5光線重建它也最早支持,而現在RTX 50系顯卡首發,它又當之無愧的成為了最早支持DLSS 4多幀生成技術的游戲大作之一,目前,正式版本的《賽博朋克 2077》已經可以選擇DLSS 4的各項功能了。
▲我這里分別測試了七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡在不同DLSS幀生成下的表現,且與RTX 4070 SUPER開啟DLSS 3時的幀率進行比較。
可以看到,在2K分辨率,光線追蹤:超速畫質下,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB開啟DLSS 4幀生成4X的時候,幀率高達176,近乎RTX 4070 SUPER所能提供幀率(99 FPS)的1.8倍。
▲另外,我還比較了DLSS開啟前后的游戲畫質:左側為DLSS開啟后的畫面,右側為原生畫面,肉眼可見左側畫面明顯更銳利清晰。
▲尤其在細節上,比如這個猴子旗子,左側的字體與團明顯更加銳化可分辨,而右側原生分辨率下字體已經明顯糊了,很難分辨上面寫了什么。
▲同樣的,LED燈與其下方的墻磚縫隙,也都是開啟DLSS后效果更好,尤其墻磚縫隙,辨別起來明顯比原生渲染要好很多。
▲緊接著,因為《賽博朋克2077》的Benchmark可以切換Transformer Model與之前的CNN Model,所以我還做了二者的畫質比較。
▲首先,二者的畫質都比原生分辨率好,不過在細節上,還是Transformer Model略勝一籌。
▲比如依舊是這個墻面,左右兩側的墻磚紋理都清晰可見,不過明顯左側Transformer Model的墻面的漫反射更為充分,把酒吧那種使人沉醉迷離的氣氛一下就烘托出來了。
▲還有這扇門,因為其上有波紋形的柱狀紋理,所以反射光線會非常復雜,但是門上的紋路并不會因為光照而看不清,相信憑借各位的生活常識,應該一下就知道Transformer Model的光線重構功能在處理這種暗光、復雜場景的能力,是明顯好于CNN Model的。
《霍格沃茲之遺》
▲《霍格沃茲之遺》可能是《哈利波特》粉絲這些年能玩到還原度最高的游戲了,這款游戲也進行了更新,正式版也已經支持DLSS 4多幀生成技術了。
▲在2K分辨率下,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡在僅開啟DLSS 4而不開啟幀生成時,游戲幀率為46 FPS,開啟DLSS 4 幀生成4x后,游戲幀率上升到了146 FPS,此時游戲幀率是RTX 4070 SUPER開啟DLSS 3后的1.8倍。
▲而在對游戲流暢度同樣很重要的1% Low FPS中,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB在開啟DLSS 4幀生成2K下可的1% Low FPS為109幀,遠超RTX 4070 SUPER開啟DLSS 3后的68幀。
《漫威爭鋒》
▲《漫威爭鋒》在最新的更新中,也已經將DLSS 4的幀生成選項集成到了游戲UI中,我們無需再使用NVIDIA APP進行設置了。
▲七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡在《漫威爭鋒》2K分辨率下,幀生成關閉時游戲幀率121 FPS,1% Low FPS為92 FPS,開啟DLSS 4 幀生成4x后,游戲幀率上升到了305 FPS,1% Low 幀也達到了191 FPS,游戲的流暢度提升了近3倍。而RTX 4070 SUPER的幀率為181 FPS,RTX 5070 Ti 的表現約為RTX 4070 SUPER的1.7倍。
▲2款顯卡在系統延遲方面表現都非常優秀,應該是NVIDIA Reflex技術的功勞。
《永劫無間》
▲網易旗下的武俠工作類吃雞游戲《永劫無間》目前也支持了DLSS 4與光線追蹤,而且就在前幾次更新中,也將DLSS4選項集成到了游戲菜單中。
▲在2K分辨率下,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB顯卡在僅開啟DLSS 4而不開啟幀生成時,游戲的幀率為200 FPS,1% Low為170 FPS,而在開啟DLSS 4 幀生成4x后,游戲幀率上升到了330 FPS,1% Low 幀也達到了263 FPS,游戲的流暢度提升了近1.65倍,對競技游戲更重要的1% Low幀更是提升了1.55倍。此時游戲幀率約為RTX 4070 SUPER的1.35倍。
▲兩張顯卡的系統延遲方面都表現很好,iGame GeForce RTX 5070 Ultra W OC 12GB在DLSS 4 幀生成4x的情況下也僅有25ms!
《暗黑破壞神4》
▲最后一款測試的DLSS 4游戲為《暗黑破壞神4》,目前,我們還是需要在NVIDIA APP中調整幀生成數量。游戲測試環境為2K分辨率,最高畫質+光線追蹤極致,玩家角色在圣光大教堂的臺階上來回跑動。
▲在2K分辨率下,iGame GeForce RTX 5070 Ultra W OC 12GB在僅開啟DLSS 4而不開啟幀生成時,游戲的幀率為59 FPS,1% Low為53 FPS,而在開啟DLSS 4 幀生成4x后,游戲幀率上升到了268 FPS,1% Low 幀也達到了180 FPS,游戲的流暢度提升了近5倍。此時游戲幀率約為RTX 4070 SUPER的1.7倍。
▲游戲系統延遲方面差別不大,兩款顯卡的延遲均在30ms左右,表現很好,本次測試無論是DLSS 4的幀率提升,還是游戲的延遲降低,相較之前RTX 5070 Ti首測時都有明顯的優化,可見DLSS 4對游戲性能的提升,會隨著NVIDIA 顯卡的驅動得到持續優化。
七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB常規游戲性能測試
雖然目前支持DLSS 4的游戲越來越多,不過受限于時間與經費的關系,我僅測試了5款DLSS 4的游戲。因此,我們還是要來測試一下3DMark的基準測試,以及其他的游戲。
3D Mark Time Spy
3D MARK Time Spy是一個DirectX 12 基準測試,支持原生新的API 功能,如異步計算,顯式多顯卡適配器技術和多線程,其測試分辨率為2K。
▲本電腦搭載七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB時的3D MARK Time Spy得分為22333分,其中顯卡得分22634分。
▲而RTX 4070 SUPER的3D MARK Time Spy顯卡得分為22634分,RTX 5070 得分是RTX 4070 SUPER的110%。
3D Mark Fire Strike & 3D Mark Fire Strike Extreme
3D MARK Fire Strike則是DirectX 11的 基準測試,標準版本分辨率為1080P,而其Extreme版本則是將分辨率提升至2K。
▲本電腦搭載七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB時的3D Mark Fire Strike得分為41256分,其中顯卡得分50080分。
▲而RTX 4070 SUPER的3D MARK Fire Strike顯卡得分為49435分,RTX 5070 略高于RTX 4070 SUPER的得分。
▲而在2K分辨率的3D MARK Fire Strike Extreme中,本電腦搭載七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB總得分為26765分,其中顯卡得分29063分。
▲而RTX 4070 SUPER的3D MARK Fire Strike Extreme顯卡得分為24792分,RTX 5070 得分是RTX 4070 SUPER的117%。
可見,分辨率越高,RTX 5070相較于RTX 4070 SUPER的優勢越明顯。
3D Mark Steel Nomad & Speed Way
3D Mark專為測試顯卡性能而提供的Steel Nomad 與 Speed Way測試,這兩個測試都會盡量排除其他硬件的影響,將所以測試都集中在顯卡上,所以也只會給出一個顯卡分數。
▲在3D Mark Steel Nomad測試中,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB得分5041,是RTX 4070 SUPER得分4563的110%。
▲而在3D Mark Speed Way測試中,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB得分5960,是RTX 4070 SUPER得分5197的115%。
其余游戲幀率表現
▲我還另外測試了其余6款游戲,均為2K最高畫質,DLSS質量模式,可見在所有游戲中,RTX 5070 相較RTX 4070 SUPER都有不同幅度的領先,尤其在《黑神話:悟空》與《光明記憶:無限》中,RTX 5070的優勢更為明顯。
七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB AI與生產力測試Al lmage Generation Benchmark
▲為了測試FP4數據類型對AIGC性能的提升,使用的是Procyon的Al lmage Generation Demo for NVIDlA進行測試,模型為Flux1DEV_ONNX,這里需要注意的是,此測試要求使用NVIDIA RTX GPU,且顯存容量最低為16GB,而無論是RTX 5070,還是RTX 4070 SUPER,搭載的都是12GB顯存。
▲不出意料,以FP8數據結構進行測試時,會出現Workload error,換句話說,就是爆顯存了。
▲而得益于全新的第五代Tensor核心,Blackwell架構顯卡可以處理FP4數據類型,FP4 提供了一種較低的量化方法,類似于文件壓縮,該方法能夠顯著減小模型大小,讓AI運算對顯存的要求更低,效率自然也大幅提升。
▲因此,在使用FP4數據結構時,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB順利的完成了測試,而RTX 4070 SUPER并不支持FP4數據結構,這里就不測試了。
可見,對FP4數據結構的支持,讓Blackwell架構的RTX 50系顯卡,在應對大體積模型時的表現要明顯好于RTX 40系及再之前的顯卡。
AI Text Generation Benchmark
▲而在AI Text Generation Benchmark中,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB在PHI 3.5、MISTRAL 7B、LLAMA 3.1、LLAMA 2這4個大語言模型下的得分分別為3934、3943、3517、3232分。
▲我這里對全部RTX 50系顯卡以及測試過的RTX 40系顯卡的得分進行了整理,做了這個表格,可以看到,七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB不僅在部分模型得分明顯高于RTX 4070 SUPER(LLAMA 2尤其明顯,性能甚至翻倍),甚至在部分項目上,要比上代的RTX 4070 Ti SUPER得分更高,可見NVIDIA在BlackWell架構上,對顯卡AI性能有著明顯的加強。
Blender Benchmark
▲Blender是一款開源 3D 創建套件。它支持3D 建模、動畫、視頻編輯等諸多功能,同時支持NVIDIA RTX 渲染OptiX AI 降噪,而Blender Open Data Benchmark將進行monster、junkshop、classroom三個場景的渲染測試,目前測過的各款顯卡數據如上圖。
V-Ray 6 Benchmark
▲最后我們測試了七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB的V-Ray 6 GPU RTX得分為6628分,這里我們依舊與其余幾張顯卡的得分進行比較,可見其性能甚至超過了上代的RTX 4070 Ti SUPER,BlackWell顯卡的生產力提升很大。
總結
好了,以上便是本次測評的全部內容了,總結一下,RTX 5070在僅開啟DLSS 4而不開啟多重幀生成時,游戲性能略高于上代RTX 4070 SUPER顯卡,而在開啟DLSS 4多重幀生成4X后,游戲幀率可以提升到RTX 4070 SUPER的約1.7倍,部分電競網游可以達到2K 300FPS以上的幀率,是電競玩家的絕配。
同時,在支持FP4數據類型后,配合RTX 5070雖然顯存容量為12GB,不過依舊可以運行很多大模型,這點在以往顯卡中是做不到的。另外,RTX 5070顯卡搭載的GDDR7顯存要比RTX 4070 SUPER搭載的GDDR6X顯存能效比高很多,大家無需擔心顯存發熱,機箱內的散熱壓力得到了明顯的釋放。
七彩虹作為顯卡銷量第一的品牌,在性能,設計,做工上一直在精益求精。本次測試的七彩虹iGame GeForce RTX 5070 Ultra W OC 12GB作為iGame系列中價格最親民的產品,設計上可以說是十分年輕化,燈效表現更是遠超前代,同時七彩虹還提供了包括主板、機箱、電源、水冷、內存在內的七彩虹iGame Ultra全家桶,我個人是非常喜歡這種全家桶的,有興趣的玩家可以一步到位打造自己的全套iGame桌面生態。
目前,這款顯卡將在七彩虹官網商城、京東、天貓、拼多多、抖音等電商平臺及全國授權零售經銷渠道正式開售,喜歡的朋友可自行選擇合適平臺進行購買。
好了,以上便是本次測試的全部內容,希望對你有所幫助,我是黃昏百分百,我們下次見。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.