今年年初,NVIDIA 发布了 RTX 5080 系列显卡,凭借全新的 Blackwell 架构和 DLSS 4 技术加持,带来了出色的 4K 游戏体验。
索泰最近发布了全新一代天启系列旗舰,索泰 GeForce RTX 5080 16GB 天启 OC 显卡,它能否延续 RTX 5080 的优异表现,接下来就跟着IT之家一起看看吧。
为了发挥出索泰 GeForce RTX 5080 16GB 天启 OC 显卡的全部性能,IT之家搭建了如上图所示的测试平台。
本次发布的索泰 GeForce RTX 5080 16GB 天启 OC 显卡沿袭了前代的机甲风格硬朗设计,配色也依旧以经典黑白撞色为主,加上小量的金色点缀件,形成强烈的视觉冲击。
据官方介绍,索泰这次选择与国内知名工作室“贝尔 MOD Studio”深度合作,在前代的机甲设计风格基础上,进行了更具美感的视觉呈现。银白色衬底金属风十足,黑色风扇深邃神秘,还加入了凸显气质和质感的金色进行点缀,配合显卡正面标志性的“天启之环”,创意大胆且辨识度很高。
显卡背板部分则采用了纯白设计,高强度合金材料的加固处理能够进一步增强显卡结构强度,更好辅助散热。背板上填充了多种机甲装饰纹理,配合右侧不规则的进风开口造型,帅气值进一步提升。
显卡尾侧还拥有一个大大的艺术字风格天启 Logo,被周围一圈黑色包边包裹着。
尺寸方面,索泰 GeForce RTX 5080 16GB 天启 OC 显卡的标称数据为 361*138*73mm,IT之家实测给大家做个参考,单卡重量则是 2.18kg,也是我们迄今为止收到过最重的 5080 显卡。
索泰 GeForce RTX 5080 16GB 天启 OC 显卡拥有高达 18+3 相供电,采用全贴片式的固态电感,并使用了中框紧压供电辅助散热设计,大量的 POS CAP 对供电进行后端滤波,达到更纯净的 GPU 和显存供电效果。显卡侧面能看到密集散热鳍片阵列,高强度合金压铸成型的中框,具有超强的抗扭、抗压能力,防止显卡变形,提升显卡整体结构强度。
据官方说法,这款天启显卡使用了特挑体质的 RTX 5080 核心,加上 18+3 相的供电,默认频率高达 2295-2730/30000MHz,也是市面上最高频的 RTX 5080 显卡。
另一侧可以看到显卡供电接口采用反扣式设计,插拔更轻松;还支持双 BIOS 开关,可一键切换静音 / 强效两种散热模式。
接口方面,索泰 GeForce RTX 5080 16GB 天启 OC 显卡提供了 3 个 DP2.1b 接口和 1 个 HDMI2.1b 接口,HDMI 被放在了最右侧,相比其它三个接口间距更大,便于用户分辨,小细节做得不错。
NVIDIA GeForce RTX 5080 搭载了全新的 Blackwell 架构,其在游戏性能与 AI 性能方面均有大幅提升。英伟达认为当下人们对画面质量的追求,其所需的运算性能已远超摩尔定律所能提供的范畴。在此情形下,引入神经网络渲染技术以提高帧率才能满足人们对于画质与帧率的高需求。
在计算架构上,Blackwell 引入第五代混合精度计算技术。新一代 Tensor Core 支持 FP4 自适应量化,借助智能数据压缩算法,显存占用降低 56%,同时维持模型计算精度,AI 推理速度提升至原来的两倍。实际测试显示,在 Stable Diffusion XL 等 AI 图像生成任务中,处理耗时仅为 Ada 架构的 38%,效率大幅提升。
第五代 Tensor Core 支持 FP4 浮点运算精度,这种低量化方法类似文件压缩,能减少模型推理的数据存储与计算量,提升计算效率,显存使用不到 FP16 的一半,却可让 GPU 性能提升 2 倍。
RT Core 提升了光线、路径与三角形相交的检测效能,能对大量几何图形细节光线追踪。在新一代 Blackwell 架构下,检测效率是上一代的 2 倍、初代 Turing 架构的 8 倍,还通过增强压缩减少 25% 内存占用,大幅提升光线追踪细节。
Blackwell 架构 GPU 搭载 GDDR7 显存,采用 PAM3 信号编码机制,与 GDDR6、GDDR6X 不同,每两周期传输 3 位数据,更省电且带宽提升,速度达 30Gbps。
在产品规格层面,索泰 GeForce RTX 5080 16GB 天启 OC 显卡依托最新一代 GB200-400 - A1 核心,采用 TSMC 4N 架构制程工艺。其内置 10752 个 CUDA 核心、336 个 Tensor 核心、84 个光追核心、336 个纹理单元以及 128 个 ROP 单元。与 RTX 4080 相比,核心规模提升约 10.5%,SM 和 TPC 群组数量也有所增加。显存升级为 256bit 16GB GDDR7,带宽达 960GB/s。TGP 功耗为 360W,比上代 RTX 4080 高出 40W。
在 3DMark Time Spy DX12 测试中:
索泰 GeForce RTX 5080 16GB 天启 OC 显卡得分 33003 分;
NVIDIA GeForce RTX 4080 SUPER 公版显卡得分 29220 分;
RTX 5080 相比 RTX 4080 SUPER 性能提升约 12.9%。
在 3D Mark Time Spy Extreme DX12 测试中:
索泰 GeForce RTX 5080 16GB 天启 OC 显卡得分 16626 分;
NVIDIA GeForce RTX 4080 SUPER 公版显卡得分 14541 分;
RTX 5080 相比 RTX 4080 SUPER 性能提升约 14.3%。
在 3DMark Portal Royal 实时光追测试中:
索泰 GeForce RTX 5080 16GB 天启 OC 显卡得分 22881 分;
NVIDIA GeForce RTX 4080 SUPER 公版显卡得分 18439 分;
RTX 5080 相比 RTX 4080 SUPER 光追性能提升约 24%。
另外,RTX 5080 系列显卡还支持了全新的 DLSS 4 技术,带来了强大的多帧生成功能,我们也通过 3D Mark 中的 NVIDIA DLSS 测试项目进行跑:
关闭 DLSS 时平均帧数为 51 帧;
开启 DLSS 4X 多帧生成时平均帧数为 244 帧;
DLSS 多帧生成下的性能提升达到了 478%,接近 5 倍的帧数提升,非常恐怖。
从一系列 3D Mark 的测试来看,索泰 GeForce RTX 5080 16GB 天启 OC 显卡相较于 Geforce RTX 4080 SUPER 显卡的理论性能平均提升幅度达到了 17%,相比 RTX 4080 的提升只会更大。全新 DLSS 4 技术加持下的多帧生成特性,带来的性能提升也相当可观,这让我们更加期待它在实际游戏中的表现如何了。
游戏测试方面,从 GeForce RTX 5080 的显卡定位来说,主打的肯定是 4K 全能游戏体验,而 2K 分辨率下则拥有更高的游戏帧数上限,让用户轻松享受高帧和更为流畅的游戏画面。因此我们着重测试了游戏在 4K 分辨率下的表现。
1、《CS2》
首先是《CS2》,以 4K 分辨率 + 高画质运行创意工坊 FPS BenchMark 测试地图:
RTX 5080 显卡游戏平均帧数 316 帧,1% Low 帧 147 帧;
RTX 4080 SUPER 显卡游戏平均帧数 259 帧,1% Low 帧 126 帧;
RTX 5080 相比 RTX 4080 SUPER 平均帧数提升了 22%,1% Low 帧提升了 16.6%。
2、《鸣潮》
《鸣潮》作为一款对性能要求较高的二次元端游,目前也支持了 DLSS 和插帧,这里我们和自己对比下,经过实测:
在 4K 分辨率 + 最高画质,不开启 DLSS 和插帧选项下,RTX 5080 显卡游戏平均帧数 60 帧,1% Low 帧 38 帧,游戏平均延迟 30ms;
在 4K 分辨率 + 最高画质,打开 DLSS 超级质量和插帧选项下,RTX 5080 显卡游戏平均帧数 159 帧,1% Low 帧 64 帧,游戏平均延迟 31ms;
可以看到,打开 DLSS 和插帧选项后,游戏平均帧数非常明显,达到了 2.65 倍,虽然是由于不开 DLSS 会强制锁 60 帧的缘故,但游戏体验确实流畅不少。重点则是游戏平均延迟只增加了 1ms,对操作完全没有影响。不过,开启 DLSS 和插帧后的 1% Low 提升相比平均帧数的提升差距较大,如果把插帧当作 2x 帧生成来看,跑满 4K / 160Hz 显示器刚刚好,而且 1% Low 帧也过了 60 帧。
3、《古墓丽影:暗影》
在体现传统光栅的游戏《古墓丽影:暗影》中,以 4K 分辨率 + 最高画质运行自带基准测试:
RTX 5080 显卡游戏平均帧数为 156 帧,1% Low 帧 130 帧;
RTX 4080 SUPER 显卡游戏平均帧数 135 帧,1% Low 帧 108 帧;
RTX 5080 相比 RTX 4080 SUPER 平均帧数提升了 15.5%,1% Low 帧提升了 20.3%。
4、《极限竞速:地平线 5》
在赛车竞技体育游戏《极限竞速:地平线 5》中,以 4K 分辨率 + 极端画质 + 帧生成运行自带基准测试:
RTX 5080 显卡游戏平均帧数为 201 帧,1% Low 帧 156 帧;
RTX 4080 SUPER 显卡游戏平均帧数 172 帧,1% Low 帧 138 帧;
RTX 5080 相比 RTX 4080 SUPER 平均帧数提升了 16.8%,1% Low 帧提升了 13%。
5、《荒野大镖客:救赎 2》
另一款开放世界游戏《荒野大镖客:救赎 2》中,以 4K 分辨率 + 最高画质运行自带基准测试:
RTX 5080 显卡游戏平均帧数为 114 帧,1% Low 帧 70 帧;
RTX 4080 SUPER 显卡游戏平均帧数 103 帧,1% Low 帧 68 帧;
RTX 5080 相比 RTX 4080 SUPER 平均帧数提升了 10.6%,1% Low 帧提升了 2.9%。
上一代 RTX 40 系列所支持的 DLSS 3 技术,实际效果已十分出色。而 DLSS 4 在此基础上,进一步挖掘帧生成的性能潜力。它运用全新多帧生成技术,借助第五代 Tensor Core 的强劲性能,依靠 AI 为每个渲染帧最多生成 3 个额外帧,与光线重建、超分辨率、DLAA 等 DLSS 技术协同工作,最高能让游戏帧率提升至传统渲染方式的 8 倍。
NVIDIA GeForce RTX 50 系列显卡搭载的第五代 Tensor Core,在 AI 处理性能上有了质的提升,相较前代提高 2.5 倍,显著降低游戏延迟,后续将通过实际游戏测试呈现延迟的具体变化。此外,Blackwell 架构的显示引擎对 DLSS 4 技术的支持也很关键,它提升了像素处理能力,让 DLSS 4 能更好适应高分辨率和刷新率要求,最高可将像素处理能力提升至原来的 2 倍。
DLSS 4 技术在模型架构上有重大创新。它整合了 DLSS 光线重建、DLSS 超分辨率以及 DLAA 等特性,由首个实时 Transformer 模型驱动。该模型通过自注意力机制,能评估每一帧或多帧画面中每个像素的重要性,更精准地理解场景中的复杂关系。这种设计不仅提高了生成像素的稳定性、减少了伪影,还在运动细节和边缘处理上效果出众,让画面更加平滑自然。实测部分我们选择了 3 款代表性的游戏进行测试。
6、《永劫无间》
实测环节我们还是以竞技游戏开场,《永劫无间》前不久已经支持了 DLSS 4 多帧生成功能,恰好可以作为一个典型竞技游戏,来测试下 DLSS 4 的性能提升和延迟表现如何。
首先,RTX 5080 在 4K 分辨率 + 最高画质下,游戏平均帧数为 190 帧,平均延迟 12ms;
随后,当我们在设置菜单中开启 2x、3x 和 4x 多帧生成选项并打开 DLSS 质量档后,游戏平均帧数分别提升到 253 帧、308 帧、370 帧,而游戏平均延迟方面分别为 18ms、20ms 和 22ms。另外,在开启多帧生成和 DLSS 选项后,游戏的延迟提升非常小,对操作体验几乎没有影响。
7、《赛博朋克:2077》
《赛博朋克:2077》相比《永劫无间》,对显卡的压力明显更大。在 4K 分辨率超级光追画质下,不开启 DLSS 和帧生成选项,游戏平均帧数分别只有 37 帧,游戏延迟也比较高。
不过,在游戏中开启多帧生成后,游戏帧数立刻显著提升,依次选择 2x、3x 和 4x 多帧生成,DLSS 质量选择 DLAA,游戏平均帧数分别提升至 62 帧、90 帧和 117 帧,从不能流畅游玩到变身电竞级高帧体验,多帧生成技术所带来的性能提升立竿见影。
8、《黑神话:悟空》
《黑神话:悟空》由于采用了全景光线追踪技术,并使用虚幻引擎 5 (UE5) 开发,即便官方做了细致的性能优化,但对于显卡的硬件性能压力依旧非常高。如果直接以 4K 分辨率 + 影视级画质运行,DLSS 等级选择 50% TSR,全景光线追踪开到最高并关闭帧生成,那么游戏平均帧数毫无悬念地低于 60 帧,毫无游玩体验。
而开启多帧生成选项并依次切换 2x、3x 和 4x 之后,游戏平均帧数分别提升到了 95 帧、135 帧和 171 帧,提升非常明显。
综合以上游戏实测的结果来看,在不支持 DLSS 4 的在线竞技游戏和光栅游戏中,RTX 5080 相比 RTX 4080 SUPER 在 4K 分辨率下游戏性能至少有 10% 的提升,平均提升了 16%,相对于 RTX 4080 的提升比较显著。
而在支持 DLSS 4 多帧生成技术的最新游戏中,RTX 5080 则凭借这一技术的独家优势,在游戏性能上碾压了不支持 DLSS 4 多帧生成 RTX 4080 SUPER。
总体来说,索泰 GeForce RTX 5080 16GB 天启 OC 显卡的实际表现还是比较不错的,得益于特挑核心和优秀的用料和散热,其性能释放非常出色,相比 RTX 4080 SUPER 这样的“强化版”也有平均 15% 的光栅游戏性能提升。RTX 50 系显卡带来的全新 DLSS 4 技术则是一大亮点,它通过多帧生成技术,让游戏实现性能跃迁,同时对游戏平均延迟的影响却十分有限,不仅拉高了游戏性能上限,也将整体游戏体验带到了一个新高度。