查看: 443|回复: 30

【起飞!】RTX4090猛禽首发评测

[复制链接]

2

主题

5

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2022-11-27 10:10:43 | 显示全部楼层 |阅读模式
唠嗑环节

曾几何时,意气风发的黄仁勋从橱柜中掏出举世瞩目的RTX3090,就这样上一代卡皇登场了


可以说这本是辉煌的一代,因为这一代可以说相当的亲民,并且性能提升也非常可观
只可惜碰上了不好的时代,疫情  矿潮  大衰退  
30系显卡最终成了不体面的一代
于玩家而言,市面上出现大量的矿卡正在打击玩家的兴趣,同时有部分玩家也发现其实自己并不需要为高端GPU买单,购买高端显卡的欲望出现了大幅下滑,还有就是现在也并没有像曾经2017年时PUBG那样火而且吃配置的游戏了
但是今天,这40系卡的诞生条件似乎比30系差得多啊
不过未来依旧是难以琢磨的,40系始终还是如约到来了,40系是辉煌的一代?还是平淡的一代?亦或是崩坏的一代?让我们拭目以待
本文评测的型号为华硕RTX4090猛禽



这依旧是一个PCIe4.0的显卡

先来看看这张显卡的样子


说实话,我觉得这次的猛禽不如上代好看,不过也算耐看,也许看久了就习惯了。
这次4090猛禽的供电改成了单16Pin的供电


这次4090有5个视频输出接口:


两个HDMI2.1接口,三个DP1.4接口
但是别看它有5个输出接口,但是它最大支持的显示器数量为4个

其实这张卡挺大的,这里有个对比:


一张卡的长度几乎等于两张板子,我也拿这卡和键盘对比过,和一张87键的键盘长度基本一样
上一代的卡皇3090火神相比之下都显得体型娇小了




所以如果你是itx机箱准备上4090,那你就需要特别注意了,据我所知部分4090因为体型过大,是没办法进itx的。

来聊一聊这次40系的改动
全新的制程

这次RTX4090采用了台积电4nm工艺,其实就是5nm的马甲,密度也基本看齐5nm


对比上一代8nm来说提升非常显著,三星8nm是三星10nm的小幅加强版,和这个台积电5nm可差远了。先进的制程可以带来更低的功耗、更高的频率
这一次平均密度直接提升到了30系卡的2.8倍左右,直接比当年9系升级10系的密度提升还大了
可以说这是目前最先进的制程了,因为台积电3nm在现在这个时间点还未量产过任何商用芯片,这也可能是未来若干年里NVIDIA最激进的一次制程换代了
而且未来可能都很难再看到一次换代有如此大的提升了,我们这里可以大概判断一下,下一代显卡于2024年发布,但是24年最先进也就只有台积电3nm,密度对比4nm提升其实不大,所以下一代显卡可能还是4nm,我不认为NV会激进的在那个时间段用3nm来造消费级显卡
然后台积电2nm的对比3nm的密度提升也很小,但是功耗下降的多,适合用来拉高频率,但是台积电预计2025年才商用,这还是不延期,那么2026年的60系显卡可能还是3nm,或者说才用上3nm。2028年的70系显卡可能用上台积电2nm。
然而台积电2nm对比5nm的密度提升才40%左右.......


而2nm往后就更不难有制程大跃进了,只能是小步快走,
要想在未来显卡换代实现一次密度提高3倍以上这几乎不可能,除非未来NV的架构水平完全吊打AMD,以至于NV用低很多的制程也能把AMD按着打。所以保守的估计是未来若干年内都不会再有这样的制程进步幅度了。

全新的SM

依旧是一组SM内部128CUDA,说明这对比30系时没有做改变
不过Tensor core由第三代升级到了第四代,RT Core由第二代升级到了第三代,L1则维持不变是每组SM 128KB


依旧是和30系一样的双发射设计,有纯FP32单元,也有INT32/FP32的共用单元,比例依旧是1:1,而不是之前传言的2:1了
这种双发射设计可以在很大程度上提高吞吐,从30系的表现上就可以看出提升还是可观的
至于说坏处嘛,就是让整体规模看起来有水分了,毕竟10752CUDA对比4608CUDA的提升只有50%左右是说起来不好听,不过当这个问题成为惯例之后就不会有这种声音了。
在接触这些问题之前我曾看见有人说这代40的CUDA数量不再有水分,这个说法现在判定为假,NV怎么可能在消费级这边放弃这种设计,并且这种设计也许会延续下去,甚至可能A卡也会采用这种设计。

全新的RT Core




一眼看过去,第三代RT Core中图标都多了俩

在第二代RT Core中,Turing 和 Ampere GPU 中的 RT 核心包括专用硬件单元,用于加速边界体积层次 (BVH) 数据结构遍历,并执行对光线追踪至关重要的光线三角形和光线边界框相交测试计算。
BVH 遍历由Box Intersection Engine (左侧的包围盒组)加速,光线-三角形相交测试由Triangle Intersection  Engine (右侧的三角形)加速。
通过为这些非常重要的光线追踪功能提供特别加速,可以从 SM 中卸载⼯作,使其腾出时间来执⾏其他像素、 顶点和计算着色任务。在使⽤综合基准测试以及真实游戏和应用程序进行测试时,Turing 和 Ampere GPU 中的 RT Core 已被证明是迄今为止处理 RT工作负载的性能最⾼的引擎。
Ada lovelace在此基础上新增了Opacity Micromap Engine(左下角)和 Displaced Micro-Mesh Engine (右下角)的专用计算单元,其实就是新增了部分专用电路
Opacity Micromap Engine用于加速专门的计算 。 而Displaced Micro Mesh Engine则生成微三角形的网格,称为 Displaced Micro-Meshes。
Displaced Micro-Meshes 允许 Ada RT Core 对几何复杂的对象和环境进行光线追踪,同时显着减少BVH 构建时间和存储成本。最后,与 Ampere GPU ⼀代相比,Ada 第三代 RT Core 中的射线三角相交测试速度快 2 倍。
简单来说,有史以来最强大的光线追踪单元诞生了,能打败它的只能是NV的下一代光线追踪单元了。

再来简单对比一些基础参数


4090对比3090Ti的巨大提升点有几处:①.流处理器数量大幅提高 ②.频率大幅提高 ③.L2容量大幅提高
一眼就能看得出来这些细节的改动,我觉得这篇评测也不要说太多其他的东西了,后续我应该会在一些回答里做一些细节的解析,下面就开始进入测试环节吧。
测试平台介绍

下面就开始看具体测试数据吧,先来看看测试平台:
CPU:i9 12900KS
主板:华硕Z690 Hero
内存:芝奇幻峰戟DDR5 6600 C34
硬盘:西数SN850 1TB+威刚SX 8200 Pro 2TB
散热器:VK GL 360
电源:ROG雷神2 1600W
这次主要测试的显卡有ROG RTX4090猛禽,对比的显卡有七彩虹RTX3090火神、华硕RTX3090Ti水禽、华擎RX 6900XT OC,对比的全部都是现在的顶级显卡,应该能让你们很直观的看出差距。
游戏测试统一4K最高特效,不再对2K分辨率测试。不用Zen4来测是因为Zen4早就还回去了,而且听说Zen4搭配4090会有一些bug

首先来看理论性能测试,也就是3DMark的各项数据测试


RTX4090的提升非常大,几乎是傲视另外几张卡皇,传统光栅性能这一块对比3090火神的平均提升为86%,这个提升非常可观
而代表光追性能的3DMark Port Royal测试中,4090则达到了3090火神的1.95倍水平。
可能有人有疑问我为啥不写和3090Ti比而是让你们自己看? 因为我听说还有一张4090Ti,所以审判3090Ti的时候还没到,现在是审判3090的时候。
再来看看3DMark DLSS测试


我还能说啥? 暴杀3090,背刺任何一张最近买的老卡皇。

这张4090看起来挺猛啊,那就来看看实际游戏吧,考虑到4090过于强大,所以这次实际游戏测试只跑4K分辨率,并且所有游戏都将以高特效运行
网游测试





有粉丝说要我放一下 1% Low的数据,所以我这次在部分游戏这里放出1% Low的帧数表现,这是所有统计到的帧数里面最低的那1%算出来的平均帧,可以用来代表游戏体验的下限。
可以看到,四个网游,除了DOTA2(LOL估计也差不多),其余游戏都是4090吊打其他卡皇。
差距最大的是PUBG和CSGO,尤其是CSGO的1% Low帧数,直接翻倍了,坦克世界则提升不算明显。


你们知道为何一些网游提升不大吗?
—— 4090没吃满占用
而且我个人觉得40系首发这会驱动优化的并不好,后续还有一定的挖掘空间

单机游戏测试

单机也有1% low的统计




单机这边比网游要好,没有出现DOTA2那种提升极小的情况
就连上一代3090未完成的任务——4K高特效流畅赛博朋克2077,这一代4090就把它给完成了,平均帧83帧,就连1% Low都达到了54帧,可以说比较流畅了
其他倒是没有什么很值得一提的了,你们看看就行吧


沙盒游戏

依旧是那俩沙盒游戏


4090看起来表现很差,原因很简单,和网游一样没发挥出实力
光追&脑补

到这里就该测一测实际游戏中光追、DLSS以及光追+DLSS的表现了,先看纯光追的


2077和消逝的光芒2都支持光追,实际测试可以发现游戏帧数对比3090火神接近翻倍了,4K高特效开光追玩也能保证流畅了,还是不错的
DLSS则是另一番景象(A卡开启FSR)


开启DLSS之后,4090依旧没有办法实现3090的两倍性能,两个游戏对比3090火神分别提升了64%和87%,还好吧。

最后是光追+DLSS的测试


对比3090火神提升84%,对比3090Ti水禽提升66%。
这三组结果我觉得一般,没有体现出它全新Tensor core和RT Core的优势。

做个小总结
游戏方面除了DOTA2这种游戏之外,对比3090提升还是很大的,而且未来更强游戏性能的CPU将释放4090更猛的游戏表现,而今天最强的游戏平台12900KS+高频D5,让4090也只比3090提高高了40-70%左右的游戏性能

生产力测试

首先来看看在Octane render中的表现,这是目前最好的GPU渲染器之一


4090对比3090提升非常显著,直接翻倍了,对于这方面有需求的土豪用户来说,可以换卡了。

然后是Handbrake的视频转码效率:


GPU加速视频转码的效率不算很高,我觉得有这个提升已经很不错了。

然后再来看看Adobe三件套以及达芬奇中的测试表现:


PS这个软件真的一点都不吃显卡,你用核显可能结果都相差不多
而PR、AE、达芬奇中4090对比3090提升很小,可以说如果你现在就有3090,那你可以不换4090,因为效率提升实在是太有限了。

最后是主流三维软件的测试,运行SPECView2020,结果如下:


4090对比3090可以说是立竿见影式的提升了,甚至在部分软件中胜过了有更多OpenGL驱动的6900XT,这个表现是不错的。

温度、频率与功耗

其实这张卡的温度不高,功耗则维持450W左右变化,说明其实450W对这张卡已经够用了


1080p 4x MSAA下,GPU频率可以达到2.8GHz左右,结果温度才69度,这个温度表现可以说是非常好了
关于这一点,我听到的说法是AIC厂商之前以为40系是三星制程制造,所以这套散热在设计的时候就是为了更高功耗(600W)而设计的,但没想到最终40系是台积电4nm,功耗大幅低于预期,所以就出现了这套散热压4090温度不高的现象
同时也可以看到,显存功耗提示只有40W,这里我不确定是不是读取错误,因为同样是24GB 21Gbps的GDDR6X显存,3090Ti的显存功耗达到了120W,但是4090却提示40W,这两张卡显存都是镁光的
最重要的是并没有制程进步发生在这里,只可能有单纯的优化,这就让我怀疑这里的显存功耗读取错误了,因为如果真的办到了那简直是黑魔法,实在是太不可思议了。
我还是持保守意见,4090的显存功耗应该依旧是120W左右,那么分给核心的功耗就是 330W了,这点功耗给这么大规模跑2.8GHz,这台积电4nm太强了
我查了一下这张卡的vBIOS情况,结果提示功耗墙最高可以600W


但是我从没看到这张卡上过600W,最高只出现了470W。
于是我手动拉了一下Afterburner的功耗墙


功耗还是上不去,然后我就看到了GPU-Z提示是电压墙限制了


看来这张卡的限制还是很大的,未来要是解锁电压墙(1.05v),频率应该轻轻松松上3GHz+,因为温度这边还有压榨的空间。

4090+12900KS双烤时电源提示功耗为900W:


其中显卡是460W,CPU是280W,其余的是主板、散热器、内存、硬盘等硬件的功耗。
其实正常使用的话不会有这么高功耗,因为这涉及到CPU和GPU一起满载,这种平台的CPU和GPU一起满载的机会太少了,哪怕是工作用途这种情况也少,所以用个1200W的电源正常用也还是比较稳的。

简单拆解

其实4090的PCB也不长,4009猛禽的PCB甚至比3090猛禽的PCB还小


但是散热器很大


这次RTX4090猛禽的供电和散热可以说相当暴力了


采用了24+4相的供电,可以达到70A,这个堆料程度简直豪华,再把功耗拉高200W估计都够带
可以看到核心是AD102-300-A1,显存则是12颗来自镁光的21Gbps GDDR6X显存,这次依旧是单面显存,但是实际显卡跑起来的时候背面依旧烫的不行。
总结与购买建议



这次RTX4090的提升是非常大的
但是从游戏这方面来说,目前的处理器性能还不足以发挥出这张显卡的全部性能,所以如果你要考虑更换这张显卡,那么你需要连同板U也一起更新,像什么11代酷睿、10代酷睿、普通版ZEN3,这些产品不建议跑4090
带4090的建议是AMD的R7 5800X 3D、Zen4系列高端,以及intel的12代/13代酷睿高端产品,如果你的处理器不够强,那么你可能面临无法发挥出4090性能的境地。

对于生产力方面来说,4090在GPU渲染/计算方面提升巨大,如果你是相关用户,比如说用OC、Redshift等渲染器的用户,在预算允许而且急需提高效率的情况下可以考虑入手4090。
但是在GPU协助加速的领域提升不大,如果你是创意设计类工作,Adobe全家桶、达芬奇用户,如果你已经有了一个3090,那依我看没必要换4090,提升太小了。

这次4090的功耗达到了450W,倒也没像我最开始想的那种拉到600W去,当然对于4090这张卡来说拉到600W是可以办到的,只不过目前由于没有高功耗BIOS的原因,有电压墙的限制,频率和功耗都拉不上去
再加上我看450W下4090的频率也挺高了,都2.8GHz左右,你要拉到600W也就跑3.2GHz左右,提升不大,所以后续可以不折腾。
那么在这种情况下4090对电源的要求就和3090Ti一样了


最后是选择型号上的问题
除了ROG猛禽,我也了解了一下七彩虹的水神、战斧,我认为4090这张卡买入门级定位就好了
因为就如同前面所说,4090的散热体系是超模的,哪怕是入门级显卡的散热(就比如说战斧)都是完全能够胜任4090这张显卡,所以目前来看,就没有很必要去考虑高端定位的显卡了,除非你是追求外观或者高定位的人
目前首发,4090战斧的价格在一万二左右,4090超龙/猛禽这类卡都一万六左右了,但实际游戏表现几乎一样,所以如果不是预算特别高的可以不用考虑太豪华的版本。
回复

使用道具 举报

0

主题

59

帖子

117

积分

注册会员

Rank: 2

积分
117
发表于 2022-11-27 10:11:01 | 显示全部楼层
沙发[害羞]
回复

使用道具 举报

1

主题

5

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2022-11-27 10:12:01 | 显示全部楼层
这代有没有Titan?
回复

使用道具 举报

1

主题

47

帖子

94

积分

注册会员

Rank: 2

积分
94
发表于 2022-11-27 10:12:38 | 显示全部楼层
不知道,可能没有吧,但是听说会有一个满血AD102的型号,反正叫啥无所谓了,4090有个大哥
回复

使用道具 举报

0

主题

56

帖子

108

积分

注册会员

Rank: 2

积分
108
发表于 2022-11-27 10:13:25 | 显示全部楼层
首批货秒没,耍猴捏
回复

使用道具 举报

1

主题

2

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2022-11-27 10:13:31 | 显示全部楼层
为撒猛禽比战斧贵这么多[飙泪笑]
回复

使用道具 举报

0

主题

2

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-11-27 10:13:48 | 显示全部楼层
第二[害羞]
回复

使用道具 举报

0

主题

2

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-11-27 10:14:29 | 显示全部楼层
因为猛禽是顶级旗舰,战斧是丐中丐。猛禽定价15999,战斧定价12999,猛禽首发溢价,丐斧首发掉价。
回复

使用道具 举报

1

主题

2

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2022-11-27 10:14:47 | 显示全部楼层
黄老板被矿潮搞飘了,臭打游戏的静静看他装13[惊喜]
回复

使用道具 举报

2

主题

4

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2022-11-27 10:15:45 | 显示全部楼层
点赞,继续等吧。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表