說起玩“黑神話”的電腦配置,大家都在吹自己的4090顯卡。
可是比4090貴了幾十倍的H100,同樣是“GPU”,為啥卻不能用來玩游戲?
這個問題,猛一看,很弱雞啊。
但問到具體原因,很多人卻說不出個456來。
今天我就簡單捋捋,除了接口之外,其他更重要的原因↓
01、架構設計的差異
最核心的一點在于兩者的架構差異,架構決定了彼此的核心能力不一樣。
RTX4090采用了N記的Ada Lovelace架構,專注于游戲和高級圖形處理,這種架構在游戲性能上有賊拉牛B的優(yōu)化,包括高級的圖形渲染技術如光線追蹤和DLSS。
RTX4090總共包含 16384 個 CUDA 核心和 512個第四代 Tensor 核心,以及 128 個第三代 RT(光線追蹤)核心。
下面這個是其單個SM的架構圖,4090由128個這樣的SM組成。
提升游戲體驗的幾大黑科技,都是靠這些核“肝”出來的。
比如光追效果主要依靠RT核,而DLSS包括抗鋸齒、超分辨率、光線重建等等,主要依賴Tensor核心和CUDA核心提供的AI增強圖形效果。
玩燒機游戲的都懂,開不開光追效果,體驗完全不一樣。
而H100的則是基于Hopper架構,主要針對大規(guī)模并行處理和AI任務進行優(yōu)化,而非圖形渲染。
H100包括了16896個CUDA核心和528個第四代Tensor核心,注意,沒有對圖像渲染至關重要的光追核心(RT Core)。
下圖是H100單個SM的架構示意,H100由132個這樣的SM組成。
看對比圖就發(fā)現(xiàn)差別了,雖然H100擁有更多的CUDA核心和Tensor核心,但這些核心是面向復雜計算和深度學習模型訓練的。
比如,H100的CUDA核心支持FP64、FP32、TF32、BF16、INT8等多種數據類型的高效計算。
而4090的CUDA核心就不一樣了,人家主攻圖形密集應用,只針對單精度和雙精度做了優(yōu)化。
02、驅動和API的支撐大不一樣
H100除了內核優(yōu)化和設計的硬傷,還有一個大問題。
N記為游戲級GPU(也4090為代表的Geforce系列)提供了專門的游戲驅動,優(yōu)化游戲性能和兼容性。H100則沒有。
這就是導致H100無法支持DirectX、OpenGL、Vulkan等主流游戲API(嚴格說是理論上支持),也不支持Unity、虛幻、Godot這些主流的游戲引擎。
比如,黑神話悟空采用的就是虛幻引擎5。
基本上,這兩條就斷絕了拿H100玩游戲的任何念想。當然我們可以堆砌一些理由↓
成本的問題:我一個4090都買不起的小卡拉米,我會考慮拿貴幾十倍的H100來玩游戲嗎?
電源和散熱的問題:H100的功耗和熱輸出設計用于機架式服務器環(huán)境,對用游戲PC來說,有極大的挑戰(zhàn)。
所以呢,4090這種GPU,可以叫顯卡,或者圖形加速卡。
而H100這種GPU,更準確的叫法其實是GPGPU(General-Purpose GPU),我更愿稱之為AI加速卡。
好了,不扯了。
是時候把我的珍藏20多年的TNT2翻出來插上,暢玩《黑神話悟空》了
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.