硬件

提升的4GB显存真的有用吗?技嘉RTX 4070 Ti SUPER冰猎鹰AI性能体验

YIHAN 原创 2024-05-27 00:16:48
评测

前言

NVIDIA在CES 2024上正式发布了全新的RTX 40 SUPER系列GPU,其中的RTX 4070 Ti SUPER是NVIDIA GPU中迄今为止唯一同时拥有Ti和SUPER命名后缀的型号。当然,这款显卡还有一个重大升级,就是不仅换上了RTX 4080同级别的AD103核心,还是RTX 4070系列中唯一拥有16GB超大显存的显卡,显存位宽升级到了256bit,这对AI创作或是4K游戏都是史诗级的提升,那相比RTX 4070 Ti,多出的这4GB显存到底能够带来多大的提升?今天就让我们随技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰(以下简称“技嘉RTX 4070 Ti SUPER冰猎鹰”)一探究竟~

测试硬件介绍

首先,照例给大家讲讲RTX 4070 Ti SUPER的规格,技嘉RTX 4070 Ti SUPER冰猎鹰同样采用了NVIDIA定制的台积电4N工艺,不过核心方面则是大升级,换上了更高级的AD103核心,已经跟RTX 4080站在同一梯队。

CUDA核心从RTX 4070 Ti的7680个提升至8448个,增幅足足有10%!其次这款显卡采用的是256bit位宽的16GB GDDR6X显存,相比之前4070 Ti的12G显存和192bit位宽来说,简直是史诗级提升。

好了,规格讲解完毕,下面直接开始技嘉RTX 4070 Ti SUPER冰猎鹰的介绍。正面是经典的三风扇设计,外观以白色为底色,辅以黑色的风扇,相当吸睛。表面还有几何图案与斜切纹理作为装饰,这也是表明这款显卡更像是为创作而生。

显卡配备了三把80mm的散热风扇,采用正逆风道的设计,能有效减少三风扇间的气流干扰,搭配吹透式设计,可以很好的提高散热效能。而且风扇支持智能启停技术,可以随着GPU的温度来达到停转或是高转速之间的变换。

背面使用的是全尺寸金属背板,可保证PCB不会因为重量问题出现弯曲、断裂等问题,并且做了喷砂处理,质感十足。

尾部还有大面积的镂空式设计,提升视觉效果的同时还能增强散热效果。

顶部是一整排的散热鳍片,下方还有“GIGABYTE”的RGB灯牌,辨识度拉满,配合技嘉官方的GCC软件,还能与其他硬件实现灯光同步效果,进一步提升主机颜值。

视角拉进,可以看到技嘉RTX 4070 Ti SUPER冰猎鹰采用的是12VHPWR 16Pin供电的设计,同时官方建议搭配GeForce RTX 4070 Ti SUPER显卡的为700W额定功耗的电源。

电源旁边有一个拨片,用于BIOS OC/SILENT两档模式切换,其中默认出厂预设为BIOS OC性能模式,SILENT模式则可提供较为安静的使用体验。

输出接口方面,仍然昰老配方:3个DP1.4+1个HDMI2.1的设计,可以实现3+1屏联屏输出。笔者这里建议大家使用顶部的第一个DP接口来连接显示器。

并且技嘉RTX 4070 Ti SUPER冰猎鹰明显比其他同级别显卡要轻薄,这对小机箱用户更加友好,小身板蕴藏大能量!

拆解这张显卡还是相当轻松的,技嘉RTX 4070 Ti SUPER冰猎鹰的PCB由2oz铜与低电阻式晶体管等耐久用料打造而成,相比其他普通PCB拥有更强劲的性能释放潜力与更长的使用寿命。

PCB的背面同样富有设计感,做工用料也是大厂级别。相比正面密密麻麻的排布显得整洁许多,背面基本上是各类控制芯片。不过从背面依然可以看到核心上安排了POSCAP(导电聚合物钽电容),有助于提升显卡的电气性能。

PCB的中央镶嵌着的是AD 103-275-A1核心,RTX 4080的同款芯片,由TSMC 4N工艺打造,295mm2的芯片面积内塞下了8448个CUDA 核心,相比原本的RTX 4070 Ti直接多了10%的CUDA,因此它的性能表现也更加出色,开启DLSS 3以后,直接秒杀上代旗舰RTX 3090 Ti。

核心四周为8颗显存,它们是由美光提供的GDDR6X显存,型号是3YU47 D8BZC,单颗显存容量为2GB,8颗显存共组成16GB。并且它们可以实现21Gbps的等效频率,让这款显卡能够应对更多复杂的场景。

供电规模方面,技嘉RTX 4070 Ti SUPER冰猎鹰采用10+2相供电设计,规模十分豪华,应对AD103核心绰绰有余。

并且技嘉给每相核心供电与显存供电均配备了一颗威世(Vishay)的SiC653A MOSFET,持续电流为50A。

再看看这款显卡的散热系统,经典的铜板直触GPU设计,并且技嘉在铜板上为显存、电感、MOS管接触的地方用上了高系数的导热垫辅助散热。就连核心处也是厚厚的一层硅脂,可见这个风之力散热系统真的是下足了功夫做散热。

散热鳍片做工上佳,采用回流焊工艺与热管连接,并大量使用扣Fin、折Fin设计增强结构强度以及增加接触面积。鳍片之下还有6根复合式热管加持,大大加强了散热效能。

正面则是我们之前就介绍过的3把80mm散热风扇,不仅支持3D启停技术,还有正逆转设计,时刻让显卡满血释放。

AI性能对比

看完了外观颜值,就该进入今天的正题了。还是介绍一下本次的测试平台,处理器是目前的旗舰之选Intel i9-14900K,内存则是两根金士顿的DDR5 6000 16GB组成32GB的超大容量,主板也是技嘉旗下的Z790电竞雕X,其他硬件则如下图所示:

理论性能对比

本期的重点是AI性能,先看理论性能测试。我们用UL Procyon最新的AI Image Generation Benchmark进行测试,其分为SD1.5与SDXL两项。其中RTX 4070 Ti在SD1.5模型测试下,得分2645,生成速度约2.36秒/图。

技嘉RTX 4070 Ti SUPER冰猎鹰则要强上不少,单是测试得分就比RTX 4070 Ti要高15%,达到了3109分,生成速度上也是略胜一筹,只要2.01秒就能生成一张图片。

换到对显存压力更大的SDXL测试里,UL Procyon会测试16轮,然后取平均成绩。其中RTX 4070 Ti测试得分2534,生成大分辨率图片时明显比SD1.5模型慢了许多,14.794秒才能生成一张。

反观技嘉RTX 4070 Ti SUPER冰猎鹰就不一样了,首先得分2736,比RTX 4070 Ti要高出200分左右,生成一张1024×1024的图片也快一些,只要13.705秒,整个测试用时219.279秒。

这里我们也给大家制作成了图表,方便大家对比两张显卡的性能。总的来说,技嘉RTX 4070 Ti SUPER冰猎鹰确实对得起自己的“SUPER”之名。在SD1.5模型的测试里,领先RTX 4070 Ti达18%,到了压力更大的SDXL模型测试里,性能也有接近10%的优势。性能的涨幅与CUDA数量基本保持一致,多出的4GB VRAM更是让这张卡在AI领域能够大放异彩。

图像生成速度测试

理论测试里,技嘉RTX 4070 Ti SUPER冰猎鹰可以说是一骑绝尘。那实测情况如何?用SD1.5的模型生成10张50步迭代的512 x 512的图片进行测试,RTX 4070 Ti用时38秒,技嘉RTX 4070 Ti SUPER冰猎鹰也要更快一些,33秒就能完成10张图片的绘制。

你以为30秒已经是它们的极限了吗?别急,NVIDIA在前段时间给Stable Diffusion“升了级”,带来了Stable Diffusion WebUI TensorRT扩展的更新版,包括SDXL、SDXL Turbo、LCM-LoRA加速以及优化的LoRA支持。据说,这个TensorRT不仅能提高了工作效率,还让Stable Diffusion更快地生成高质量的图像。

实测,在开启TensorRT Engines加速后,同样的配置,RTX 4070 Ti生成用时仅需23s,而技嘉RTX 4070 Ti SUPER冰猎鹰就更快了,15秒的时间就完成了操作,相比没开的情况下足足快了一倍,而多出的CUDA数量与更多的显存也让它比RTX 4070 Ti强了50%以上。

这里给大家放个汇总成绩对比,差距还是挺明显的。

不过要注意,这个测试结果是在这两张显卡基本“没跑满”的情况下的实力对比。毕竟SD1.5的模型加上512×512的尺寸对这两张显卡来说还是太容易了一些。所以,下面就要给两张显卡上点难度了,首先是在原来的基础上将生成的图片利用高清修复,将其分辨率提升至2K级别。

开启TensorRT加速的情况下,RTX 4070 Ti生成一张1280×720的图片,再将其放大至2K分辨率,完整用时需要3分49秒。

而技嘉RTX 4070 Ti SUPER冰猎鹰则1分50秒就能完成任务。相比RTX 4070 Ti要快52%左右。之所以能够快这么多,还是因为加了显存,Stable Diffusion在绘制图片的过程中回占用一定的显存进行扩散核编解码,而技嘉RTX 4070 Ti SUPER冰猎鹰因为有16GB的大显存与256bit的大位宽,因此在面对这种高压任务时,往往大显存能避免因为显存不足的情况发生,在绘制效率上更有优势。

性能对比如下:

生成的效果也不错,开启高清修复后的图片,在细节、分辨率上都有不小的提升。

第二项测试则是使用SDXL模型,生成10张50步迭代的1024×1024的图片,带“SUPER”后缀的技嘉RTX 4070 Ti SUPER冰猎鹰果然非同凡响,首先在生成速度上就已经遥遥领先了。2分46秒就完成了绘制,显存占用也只有9.3GB左右,整体表现上可以说相当出色了。

在看看它的前辈RTX 4070 Ti,4分49秒才完成,比技嘉RTX 4070 Ti SUPER冰猎鹰慢了约2分钟左右,究其原因还是因为显存不足导致的。从任务管理器中就可以看到,生成过程中,RTX 4070 Ti的显存占用偶尔会直接占满12GB,部分情况下还需要借用共享内存才能完成绘制,速度自然就慢了许多,这也是为什么更推荐玩家选择大显存的原因所在。

按照惯例,我们再试试那个“黑科技”。开启TensorRT以后,两张显卡的生成速度均有所提升,不过技嘉RTX 4070 Ti SUPER冰猎鹰依旧强势,拥有16GB的超大显存确实可以为所欲为。1分29秒就完成了10张图片的绘制,并且显存占用仅有9GB左右,对比未开启TensorRT的表现,速度堪称飞跃,基本是翻倍的提升!

反观RTX 4070 Ti,12G的显存还是有些捉襟见肘,在生成过程中,有时甚至需要用到共享内存,其速度自然不及显卡本身的显存快,因此生成速度上也就落后了一些,需要1分55秒才能完成绘制。

汇总对比如下所示,从这幅图就可以更直观的看出技嘉RTX 4070 Ti SUPER冰猎鹰16GB大显存的优势,能够大幅缩短生成时间,提高你的AI效率。

视频生成速度测试

再上点强度才行,今天我们就来试试视频生成测试!我们使用的就是由Stability AI开源的SVD(Stable Video Diffusion),它能够将一张静态的图片通过AI变成一个动态的视频,光是听介绍就知道,想要生成视频,配置门槛一定不低,毕竟文生图都要求8G显存了,生成视频所需要的显存自然也是水涨船高。这里笔者推荐想要使用SVD的玩家尽量保证自己的显卡在12GB以上。

话不多说,我们正式开始测试,我们在Comfy UI上搭建了一套流程图,首先用SDXL生成一张1024×576的图片,再根据这张图片进行AI生成视频,视频帧率为6,帧数为25,分辨率提升至1280×720。

实测RTX 4070 Ti生成这段视频需要大概220秒的时间,生成过程中,显存的占用率也直接拉满,基本上是顶着12GB的极限在使用。而技嘉RTX 4070 Ti SUPER冰猎鹰因为16GB的超大显存,明显更有优势,136秒就完成了这项工作,显存占用仅有12G。

综合来看,两张显卡之间的差距足足有40%以上,完全不是一个量级的存在!大显存在这种高难度的AI场景里更有用武之地。

图片生成视频的效果如下:

我们继续测试,生成更大分辨率的视频,这时候两张显卡的差距就体现出来了,RTX 4070 Ti会因为显存不足而直接报错,无法完成该项测试。

而更大显存的技嘉RTX 4070 Ti SUPER冰猎鹰依旧能够完成,将1024×576的图像生成一段1680×944的视频文件只需要4分钟左右,速度还是相当可观的。

汇总一下上面,技嘉RTX 4070 Ti SUPER冰猎鹰多出的4GB显存确实给AI创作带来了更多可能,特别是在生成视频这种压力更大的项目了,更大的显存配合更强的性能,简直换了一张卡一样,两张卡的性能差异也异常明显,说是“换代”般的提升也不为过。

这里也给大家看看生成后的效果,当你创作的作品忽然间动起来,真的非常惊艳,想要进一步探索AI的玩家真的不要错过这张显卡,更多的显存更大的位宽就是你驰骋AI的最佳利器。

更多性能对比

看完了出众的AI性能表现,再带大家看看技嘉RTX 4070 Ti SUPER冰猎鹰的硬实力。

首先是这张显卡的理论性能表现,从这部分的测试成绩来看,技嘉RTX 4070 Ti SUPER冰猎鹰表现亮眼,大幅领先RTX 4070 Ti,更大的显存与更高的位宽让它得以施展更强的性能,整体比RTX 4070 Ti要强10%以上。

另一个提升比较巨大的点在于DLSS,同样分辨率下,开启DLSS 2,技嘉RTX 4070 Ti SUPER冰猎鹰的帧数要比RTX 4070 Ti高近20帧,166 FPS的表现从理论上已经达到了2K高刷游戏的门槛。并且4K分辨率下,开启DLSS 2后已经有88 FPS,证明这款显卡其实是可以实现4K游戏的。

如果切换至DLSS 3,那技嘉RTX 4070 Ti SUPER冰猎鹰在2K分辨率下,开关DLSS 3的差距能够做到约3倍以上。4K分辨率开启DLSS 3的话,帧数更是能够做到116 FPS,基本已经满足4K高刷的游戏标准。

接着再聊聊大家比较关心的游戏体验,我们实际测试了2K和4K分辨率下的实际游戏帧数。对于这种级别的显卡我们显然不需要担心1080P分辨率下的游戏体验,直接跳到2K和4K分辨率。

2K分辨率,开启DLSS 2,技嘉RTX 4070 Ti SUPER冰猎鹰表现相当出色。相比RTX 4070 Ti强约10%,部分游戏能够接近15%的性能差。

4K分辨率我们也进行了测试,不得不说技嘉RTX 4070 Ti SUPER冰猎鹰这个16GB 256-bit的超大显存还是相当加分的。大部分游戏依旧领先RTX 4070 Ti 15%左右。

开启DLSS 3后,技嘉RTX 4070 Ti SUPER冰猎鹰更是一骑绝尘,无论是2K还是4K分辨率下都有质的飞跃。游戏帧数比DLSS 2下要高出一截,对比同样开启DLSS 3的RTX 4070 Ti也是遥遥领先,平均性能领先10%左右,与增长的CUDA数量基本一致。

生产力环节,简单的图像编辑与视频剪辑上,技嘉RTX 4070 Ti SUPER冰猎鹰凭借更强的硬件优势,还是要比RTX 4070 Ti强上一些,平均能够领先5-10%左右。

换到渲染测试里,优势就更明显了,AD103核心加上16GB的大显存,在渲染上要比RTX 4070 Ti强20%以上。以目前的表现来说,“SUPER”这个后缀真的让这款显卡有了更强的表现。

工业领域,OC渲染器里的表现同样精彩,对比RTX 4070 Ti,性能足足有20%以上的领先,完全超过了CUDA数量的涨幅。不得不说,技嘉RTX 4070 Ti SUPER冰猎鹰真的是加量不加价的优质之选。

写在最后

得益于Ada Lovelace架构带来的能效进步,RTX 40系显卡实现了更强的性能表现,而目前推出的”SUPER”系列更进一步,有着更高的频率、更大的显存甚至更出众的性能。技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰作为RTX 4070 Ti的升级版,虽然在规格上只差了不到10%,但在性能测试中,这张显卡的表现相当亮眼。

就拿本次的重点AI性能来说,技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰在性能上拥有706 TOPS的AI算力。反应到实际测试中,在低负载的AI项目里,能够领先RTX 4070 Ti 10-20%左右,而一定到了压力更大负载更高的高清修复或生成视频环节,新显卡多的4GB显存就展现出了不可或缺的作用,领先幅度甚至一度能够达到50%以上!

AI性能出众的同时,其他方面的表现也相当出色。2K分辨率下,所有游戏都能有超过百帧的水平,这样的表现不仅领先RTX 4070 Ti,就算与前代卡皇相比,也是轻松秒杀。加上新显卡升级了16GB大容量显存,弥补了RTX 4070 Ti在4K游戏下的遗憾,现在想要体验4K游戏,大显存大位宽的加持下,简直轻轻松松。

总的来说,技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰在各方面都展现出了“SUPER”显卡的实力。如果你想要体积小巧、又要出众颜值,还要保证性能发挥的AIGC创作利器,那技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰显卡应该就是你的绝佳之选,更强的核心更大的显存一定能满足你“既要、又要”的需求。

点击展开全文
打开APP,阅读体验更佳

网友评论

聚超值推荐

更多优惠

相关推荐

相关产品
取消