硬件

APP下载

请登录登录

首页
资讯栏目

手机笔记本影像 DIY外设家电办公企业要闻

特色栏目

聚超值 IT百科产品报价维修信息发布会视频专区热点视频图赏新品速递 AI

提升的4GB显存真的有用吗？技嘉RTX 4070 Ti SUPER冰猎鹰AI性能体验

YIHAN 原创 2024-05-27 00:16:48

评测

前言

NVIDIA在CES 2024上正式发布了全新的RTX 40 SUPER系列GPU，其中的RTX 4070 Ti SUPER是NVIDIA GPU中迄今为止唯一同时拥有Ti和SUPER命名后缀的型号。当然，这款显卡还有一个重大升级，就是不仅换上了RTX 4080同级别的AD103核心，还是RTX 4070系列中唯一拥有16GB超大显存的显卡，显存位宽升级到了256bit，这对AI创作或是4K游戏都是史诗级的提升，那相比RTX 4070 Ti，多出的这4GB显存到底能够带来多大的提升？今天就让我们随技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰（以下简称“技嘉RTX 4070 Ti SUPER冰猎鹰”）一探究竟~

测试硬件介绍

首先，照例给大家讲讲RTX 4070 Ti SUPER的规格，技嘉RTX 4070 Ti SUPER冰猎鹰同样采用了NVIDIA定制的台积电4N工艺，不过核心方面则是大升级，换上了更高级的AD103核心，已经跟RTX 4080站在同一梯队。

CUDA核心从RTX 4070 Ti的7680个提升至8448个，增幅足足有10%！其次这款显卡采用的是256bit位宽的16GB GDDR6X显存，相比之前4070 Ti的12G显存和192bit位宽来说，简直是史诗级提升。

好了，规格讲解完毕，下面直接开始技嘉RTX 4070 Ti SUPER冰猎鹰的介绍。正面是经典的三风扇设计，外观以白色为底色，辅以黑色的风扇，相当吸睛。表面还有几何图案与斜切纹理作为装饰，这也是表明这款显卡更像是为创作而生。

显卡配备了三把80mm的散热风扇，采用正逆风道的设计，能有效减少三风扇间的气流干扰，搭配吹透式设计，可以很好的提高散热效能。而且风扇支持智能启停技术，可以随着GPU的温度来达到停转或是高转速之间的变换。

背面使用的是全尺寸金属背板，可保证PCB不会因为重量问题出现弯曲、断裂等问题，并且做了喷砂处理，质感十足。

尾部还有大面积的镂空式设计，提升视觉效果的同时还能增强散热效果。

顶部是一整排的散热鳍片，下方还有“GIGABYTE”的RGB灯牌，辨识度拉满，配合技嘉官方的GCC软件，还能与其他硬件实现灯光同步效果，进一步提升主机颜值。

视角拉进，可以看到技嘉RTX 4070 Ti SUPER冰猎鹰采用的是12VHPWR 16Pin供电的设计，同时官方建议搭配GeForce RTX 4070 Ti SUPER显卡的为700W额定功耗的电源。

电源旁边有一个拨片，用于BIOS OC/SILENT两档模式切换，其中默认出厂预设为BIOS OC性能模式，SILENT模式则可提供较为安静的使用体验。

输出接口方面，仍然昰老配方：3个DP1.4+1个HDMI2.1的设计，可以实现3+1屏联屏输出。笔者这里建议大家使用顶部的第一个DP接口来连接显示器。

并且技嘉RTX 4070 Ti SUPER冰猎鹰明显比其他同级别显卡要轻薄，这对小机箱用户更加友好，小身板蕴藏大能量！

拆解这张显卡还是相当轻松的，技嘉RTX 4070 Ti SUPER冰猎鹰的PCB由2oz铜与低电阻式晶体管等耐久用料打造而成，相比其他普通PCB拥有更强劲的性能释放潜力与更长的使用寿命。

PCB的背面同样富有设计感，做工用料也是大厂级别。相比正面密密麻麻的排布显得整洁许多，背面基本上是各类控制芯片。不过从背面依然可以看到核心上安排了POSCAP(导电聚合物钽电容)，有助于提升显卡的电气性能。

PCB的中央镶嵌着的是AD 103-275-A1核心，RTX 4080的同款芯片，由TSMC 4N工艺打造，295mm2的芯片面积内塞下了8448个CUDA 核心，相比原本的RTX 4070 Ti直接多了10%的CUDA，因此它的性能表现也更加出色，开启DLSS 3以后，直接秒杀上代旗舰RTX 3090 Ti。

核心四周为8颗显存，它们是由美光提供的GDDR6X显存，型号是3YU47 D8BZC，单颗显存容量为2GB，8颗显存共组成16GB。并且它们可以实现21Gbps的等效频率，让这款显卡能够应对更多复杂的场景。

供电规模方面，技嘉RTX 4070 Ti SUPER冰猎鹰采用10+2相供电设计，规模十分豪华，应对AD103核心绰绰有余。

并且技嘉给每相核心供电与显存供电均配备了一颗威世（Vishay）的SiC653A MOSFET，持续电流为50A。

再看看这款显卡的散热系统，经典的铜板直触GPU设计，并且技嘉在铜板上为显存、电感、MOS管接触的地方用上了高系数的导热垫辅助散热。就连核心处也是厚厚的一层硅脂，可见这个风之力散热系统真的是下足了功夫做散热。

散热鳍片做工上佳，采用回流焊工艺与热管连接，并大量使用扣Fin、折Fin设计增强结构强度以及增加接触面积。鳍片之下还有6根复合式热管加持，大大加强了散热效能。

正面则是我们之前就介绍过的3把80mm散热风扇，不仅支持3D启停技术，还有正逆转设计，时刻让显卡满血释放。

AI性能对比

看完了外观颜值，就该进入今天的正题了。还是介绍一下本次的测试平台，处理器是目前的旗舰之选Intel i9-14900K，内存则是两根金士顿的DDR5 6000 16GB组成32GB的超大容量，主板也是技嘉旗下的Z790电竞雕X，其他硬件则如下图所示：

理论性能对比

本期的重点是AI性能，先看理论性能测试。我们用UL Procyon最新的AI Image Generation Benchmark进行测试，其分为SD1.5与SDXL两项。其中RTX 4070 Ti在SD1.5模型测试下，得分2645，生成速度约2.36秒/图。

技嘉RTX 4070 Ti SUPER冰猎鹰则要强上不少，单是测试得分就比RTX 4070 Ti要高15%，达到了3109分，生成速度上也是略胜一筹，只要2.01秒就能生成一张图片。

换到对显存压力更大的SDXL测试里，UL Procyon会测试16轮，然后取平均成绩。其中RTX 4070 Ti测试得分2534，生成大分辨率图片时明显比SD1.5模型慢了许多，14.794秒才能生成一张。

反观技嘉RTX 4070 Ti SUPER冰猎鹰就不一样了，首先得分2736，比RTX 4070 Ti要高出200分左右，生成一张1024×1024的图片也快一些，只要13.705秒，整个测试用时219.279秒。

这里我们也给大家制作成了图表，方便大家对比两张显卡的性能。总的来说，技嘉RTX 4070 Ti SUPER冰猎鹰确实对得起自己的“SUPER”之名。在SD1.5模型的测试里，领先RTX 4070 Ti达18%，到了压力更大的SDXL模型测试里，性能也有接近10%的优势。性能的涨幅与CUDA数量基本保持一致，多出的4GB VRAM更是让这张卡在AI领域能够大放异彩。

图像生成速度测试

理论测试里，技嘉RTX 4070 Ti SUPER冰猎鹰可以说是一骑绝尘。那实测情况如何？用SD1.5的模型生成10张50步迭代的512 x 512的图片进行测试，RTX 4070 Ti用时38秒，技嘉RTX 4070 Ti SUPER冰猎鹰也要更快一些，33秒就能完成10张图片的绘制。

你以为30秒已经是它们的极限了吗？别急，NVIDIA在前段时间给Stable Diffusion“升了级”，带来了Stable Diffusion WebUI TensorRT扩展的更新版，包括SDXL、SDXL Turbo、LCM-LoRA加速以及优化的LoRA支持。据说，这个TensorRT不仅能提高了工作效率，还让Stable Diffusion更快地生成高质量的图像。

实测，在开启TensorRT Engines加速后，同样的配置，RTX 4070 Ti生成用时仅需23s，而技嘉RTX 4070 Ti SUPER冰猎鹰就更快了，15秒的时间就完成了操作，相比没开的情况下足足快了一倍，而多出的CUDA数量与更多的显存也让它比RTX 4070 Ti强了50%以上。

这里给大家放个汇总成绩对比，差距还是挺明显的。

不过要注意，这个测试结果是在这两张显卡基本“没跑满”的情况下的实力对比。毕竟SD1.5的模型加上512×512的尺寸对这两张显卡来说还是太容易了一些。所以，下面就要给两张显卡上点难度了，首先是在原来的基础上将生成的图片利用高清修复，将其分辨率提升至2K级别。

开启TensorRT加速的情况下，RTX 4070 Ti生成一张1280×720的图片，再将其放大至2K分辨率，完整用时需要3分49秒。

而技嘉RTX 4070 Ti SUPER冰猎鹰则1分50秒就能完成任务。相比RTX 4070 Ti要快52%左右。之所以能够快这么多，还是因为加了显存，Stable Diffusion在绘制图片的过程中回占用一定的显存进行扩散核编解码，而技嘉RTX 4070 Ti SUPER冰猎鹰因为有16GB的大显存与256bit的大位宽，因此在面对这种高压任务时，往往大显存能避免因为显存不足的情况发生，在绘制效率上更有优势。

性能对比如下：

生成的效果也不错，开启高清修复后的图片，在细节、分辨率上都有不小的提升。

第二项测试则是使用SDXL模型，生成10张50步迭代的1024×1024的图片，带“SUPER”后缀的技嘉RTX 4070 Ti SUPER冰猎鹰果然非同凡响，首先在生成速度上就已经遥遥领先了。2分46秒就完成了绘制，显存占用也只有9.3GB左右，整体表现上可以说相当出色了。

在看看它的前辈RTX 4070 Ti，4分49秒才完成，比技嘉RTX 4070 Ti SUPER冰猎鹰慢了约2分钟左右，究其原因还是因为显存不足导致的。从任务管理器中就可以看到，生成过程中，RTX 4070 Ti的显存占用偶尔会直接占满12GB，部分情况下还需要借用共享内存才能完成绘制，速度自然就慢了许多，这也是为什么更推荐玩家选择大显存的原因所在。

按照惯例，我们再试试那个“黑科技”。开启TensorRT以后，两张显卡的生成速度均有所提升，不过技嘉RTX 4070 Ti SUPER冰猎鹰依旧强势，拥有16GB的超大显存确实可以为所欲为。1分29秒就完成了10张图片的绘制，并且显存占用仅有9GB左右，对比未开启TensorRT的表现，速度堪称飞跃，基本是翻倍的提升！

反观RTX 4070 Ti，12G的显存还是有些捉襟见肘，在生成过程中，有时甚至需要用到共享内存，其速度自然不及显卡本身的显存快，因此生成速度上也就落后了一些，需要1分55秒才能完成绘制。

汇总对比如下所示，从这幅图就可以更直观的看出技嘉RTX 4070 Ti SUPER冰猎鹰16GB大显存的优势，能够大幅缩短生成时间，提高你的AI效率。

视频生成速度测试

再上点强度才行，今天我们就来试试视频生成测试！我们使用的就是由Stability AI开源的SVD（Stable Video Diffusion），它能够将一张静态的图片通过AI变成一个动态的视频，光是听介绍就知道，想要生成视频，配置门槛一定不低，毕竟文生图都要求8G显存了，生成视频所需要的显存自然也是水涨船高。这里笔者推荐想要使用SVD的玩家尽量保证自己的显卡在12GB以上。

话不多说，我们正式开始测试，我们在Comfy UI上搭建了一套流程图，首先用SDXL生成一张1024×576的图片，再根据这张图片进行AI生成视频，视频帧率为6，帧数为25，分辨率提升至1280×720。

实测RTX 4070 Ti生成这段视频需要大概220秒的时间，生成过程中，显存的占用率也直接拉满，基本上是顶着12GB的极限在使用。而技嘉RTX 4070 Ti SUPER冰猎鹰因为16GB的超大显存，明显更有优势，136秒就完成了这项工作，显存占用仅有12G。

综合来看，两张显卡之间的差距足足有40%以上，完全不是一个量级的存在！大显存在这种高难度的AI场景里更有用武之地。

图片生成视频的效果如下：

我们继续测试，生成更大分辨率的视频，这时候两张显卡的差距就体现出来了，RTX 4070 Ti会因为显存不足而直接报错，无法完成该项测试。

而更大显存的技嘉RTX 4070 Ti SUPER冰猎鹰依旧能够完成，将1024×576的图像生成一段1680×944的视频文件只需要4分钟左右，速度还是相当可观的。

汇总一下上面，技嘉RTX 4070 Ti SUPER冰猎鹰多出的4GB显存确实给AI创作带来了更多可能，特别是在生成视频这种压力更大的项目了，更大的显存配合更强的性能，简直换了一张卡一样，两张卡的性能差异也异常明显，说是“换代”般的提升也不为过。

这里也给大家看看生成后的效果，当你创作的作品忽然间动起来，真的非常惊艳，想要进一步探索AI的玩家真的不要错过这张显卡，更多的显存更大的位宽就是你驰骋AI的最佳利器。

更多性能对比

看完了出众的AI性能表现，再带大家看看技嘉RTX 4070 Ti SUPER冰猎鹰的硬实力。

首先是这张显卡的理论性能表现，从这部分的测试成绩来看，技嘉RTX 4070 Ti SUPER冰猎鹰表现亮眼，大幅领先RTX 4070 Ti，更大的显存与更高的位宽让它得以施展更强的性能，整体比RTX 4070 Ti要强10%以上。

另一个提升比较巨大的点在于DLSS，同样分辨率下，开启DLSS 2，技嘉RTX 4070 Ti SUPER冰猎鹰的帧数要比RTX 4070 Ti高近20帧，166 FPS的表现从理论上已经达到了2K高刷游戏的门槛。并且4K分辨率下，开启DLSS 2后已经有88 FPS，证明这款显卡其实是可以实现4K游戏的。

如果切换至DLSS 3，那技嘉RTX 4070 Ti SUPER冰猎鹰在2K分辨率下，开关DLSS 3的差距能够做到约3倍以上。4K分辨率开启DLSS 3的话，帧数更是能够做到116 FPS，基本已经满足4K高刷的游戏标准。

接着再聊聊大家比较关心的游戏体验，我们实际测试了2K和4K分辨率下的实际游戏帧数。对于这种级别的显卡我们显然不需要担心1080P分辨率下的游戏体验，直接跳到2K和4K分辨率。

2K分辨率，开启DLSS 2，技嘉RTX 4070 Ti SUPER冰猎鹰表现相当出色。相比RTX 4070 Ti强约10%，部分游戏能够接近15%的性能差。

4K分辨率我们也进行了测试，不得不说技嘉RTX 4070 Ti SUPER冰猎鹰这个16GB 256-bit的超大显存还是相当加分的。大部分游戏依旧领先RTX 4070 Ti 15%左右。

开启DLSS 3后，技嘉RTX 4070 Ti SUPER冰猎鹰更是一骑绝尘，无论是2K还是4K分辨率下都有质的飞跃。游戏帧数比DLSS 2下要高出一截，对比同样开启DLSS 3的RTX 4070 Ti也是遥遥领先，平均性能领先10%左右，与增长的CUDA数量基本一致。

生产力环节，简单的图像编辑与视频剪辑上，技嘉RTX 4070 Ti SUPER冰猎鹰凭借更强的硬件优势，还是要比RTX 4070 Ti强上一些，平均能够领先5-10%左右。

换到渲染测试里，优势就更明显了，AD103核心加上16GB的大显存，在渲染上要比RTX 4070 Ti强20%以上。以目前的表现来说，“SUPER”这个后缀真的让这款显卡有了更强的表现。

工业领域，OC渲染器里的表现同样精彩，对比RTX 4070 Ti，性能足足有20%以上的领先，完全超过了CUDA数量的涨幅。不得不说，技嘉RTX 4070 Ti SUPER冰猎鹰真的是加量不加价的优质之选。

写在最后

得益于Ada Lovelace架构带来的能效进步，RTX 40系显卡实现了更强的性能表现，而目前推出的”SUPER”系列更进一步，有着更高的频率、更大的显存甚至更出众的性能。技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰作为RTX 4070 Ti的升级版，虽然在规格上只差了不到10%，但在性能测试中，这张显卡的表现相当亮眼。

就拿本次的重点AI性能来说，技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰在性能上拥有706 TOPS的AI算力。反应到实际测试中，在低负载的AI项目里，能够领先RTX 4070 Ti 10-20%左右，而一定到了压力更大负载更高的高清修复或生成视频环节，新显卡多的4GB显存就展现出了不可或缺的作用，领先幅度甚至一度能够达到50%以上！

AI性能出众的同时，其他方面的表现也相当出色。2K分辨率下，所有游戏都能有超过百帧的水平，这样的表现不仅领先RTX 4070 Ti，就算与前代卡皇相比，也是轻松秒杀。加上新显卡升级了16GB大容量显存，弥补了RTX 4070 Ti在4K游戏下的遗憾，现在想要体验4K游戏，大显存大位宽的加持下，简直轻轻松松。

总的来说，技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰在各方面都展现出了“SUPER”显卡的实力。如果你想要体积小巧、又要出众颜值，还要保证性能发挥的AIGC创作利器，那技嘉GeForce RTX 4070 Ti SUPER Eagle OC ICE冰猎鹰显卡应该就是你的绝佳之选，更强的核心更大的显存一定能满足你“既要、又要”的需求。

点击展开全文