引言:在NVIDIA发布GTX580显卡时,NVIDIA官方人员曾透露说今年内不会再有其它显卡发布,显然NVIDIA的这一说法只是一个外交辞令。在时隔不到一个月的今天,NVIDIA就马不停蹄地再次发布了基于GF110核心的旗舰级显卡GTX570,GTX570显卡的定位类似上一代的GTX470显卡,是一款仅次于旗舰GTX580显卡的次旗舰,不过作为与GTX470相同定位的GTX570,在性能上就要明显超越其上一代了,因为GTX570显卡与上一代旗舰GTX480一样拥有多达480个CUDA核心,而其他参数规格上虽有一定变化,但也是此消彼长,因此GTX570可谓是GTX480的一个升级改进版。
NVIDIA GeForce GTX 570 图片 评测 论坛 报价
其实定价为2999元的GTX570显卡,大可在GTX480显卡进入清货尾声时再发布上市,但是即将在下周发布的HD6970/HD6950显卡想必也让NVIDIA有一定压力,GTX480虽然价格降下来了,但是由于其历史遗留问题始终存在,也就很难让GTX480在与HD6950的对抗中取得上风,于是改进后各方面更为优异的GTX570成为对抗HD6950显卡的最佳选择。
NVIDIA旗舰级显卡参数一览 | |||
显示卡 | GTX 580 | GTX 570 | GTX 480 |
核心代码 | GF110 | GF110 | GF100 |
制造工艺 | 40nm | 40nm | 40nm |
CUDA核心 | 512 | 480 | 480 |
核心频率 | 772 MHz | 732 MHz | 700 MHz |
Shader频率 | 1544 MHz | 1464 MHz | 1400 MHz |
显存频率 | 4008 MHz | 3800 MHz | 3696 MHz |
显存容量 | 1536 MB | 1280 MB | 1536 MB |
显存位宽 | 384-bit | 320-bit | 384-bit |
显卡供电 | 6+8 pin | 6+6 pin | 6+8 pin |
GTX570和GTX580显卡一样,都是在上一代Fermi架构下的GF100核心基础上升级而来,想必不少网友在这种CUDA核心的删减及频率显存的变换中,对这几款显卡有点晕头转向了,在上面的图标中我们就将目前NVIDIA的几款旗舰级显卡的主要参数罗列出来,相信看完这个表对NVIDIA旗舰显卡会有比较清晰的了解。
本期测试显卡天梯指引位置如下:
在本期测试中,我们采用了显卡天梯图以便更直观的体现出显卡的具体性能以及对比测试显卡之间的性能高低。同时,通过这个显卡天梯图我们能一目了然的看到当前主流显卡之间的相对排位。
PConline显卡产品天梯图说明:为了让网友更直观地了解评测显卡的档次,我们引入了天梯图。在显卡天梯图中,我们按产品的性能划分产品档次,段位越高产品档次越高,性能越强。图中“红点”为该系列显卡“公版”产品所在位置。 若评测显卡高于同段位“红点”,则说明该卡的做工性能高于同系列公版产品,若低于同段位“红点”则说明做工缩水。同段位内位置越高,产品的综合实力越强。
延伸阅读:
GTX570:采用480个CUDA核心设计的GF110核心
NVIDIA将采用完整512个CUDA核心设计的GTX580显卡核心命名为GF110,意为GF100核心的升级版,此次NIVDIA这款作为替代GTX470的第二代DX11次旗舰GTX570,依然沿用的是与GTX580一样的GF110核心,不过与上一代GTX470相比,GTX570拥有了多达480个的CUDA核心,整体数量与上一代旗舰GTX480一样,显卡的频率也由GTX480的700/3696提高到732/3800,不过在显存规格上面GTX570相对GTX480却由之前的1536MB/384bit降低为1280/320bit。
从上面关于GTX570与GTX480的规格介绍中不难看出,GTX570与上一代旗舰GTX480的参数非常接近,可以说GTX570就是在GTX480的基础上升级改进而来的一款显卡,因此这也注定了两者在性能上将非常接近。
下面我们简单的来了解一下这两款核心所采用的GF110核心。
GF110核心架构
完整的GF110核心总共有16组SM,每一组SM包含32个CUDA核心,ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存。
GF110核心每一组SM阵列里包含有32个CUDA核心,每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。
另外,我们都知道DX11一个很重要的特点就是细分曲面,细分曲面把游戏画面切割成更小的三角形,这样使得整个画面更加逼真细腻,而细分曲面的实现则需要用到多形体引擎,多形体引擎的数量也直接关系到显卡在DX11游戏中的表现。AMD在实现细分曲面时是整个核心共用一个多形体引擎,例如上图NVIDIA也可以在GT200的基础上加上一个多形体引擎来达到变身DX11显卡。
NVIDIA这次并没有直接在GT200核心的基础上直接加入一个多形体引擎以达到DX11显卡要求,而是为了不使单一的多形体引擎成为显卡性能瓶颈在每一组SM中都加入了一个多形体引擎,这也是NVIDIA一直推迟GTX400系列显卡发布的重要原因。
GF110:与GF100一样的三级分层游戏架构
我们知道,GF110采用台积电40nm工艺制造,集成大约30亿个晶体管,包含512个CUDA核心。32个核心组成一个流式多处理器阵列(SM),然后再四个组成一个图形处理集群(GPC)。GF110就是这样的三层分级架构:4个GPC、16个SM、512个SP。
Fermi GF110是一个全新架构并非没有道理,不但是通用计算方面,游戏方面它也发生了翻天覆地的变化,几乎每一个原有模块都进行了重组:有的砍掉了,有的转移了,有的增强了,还有新增的光栅引擎(Raster Engine)和多形体引擎(PolyMorph Engine)。
光栅引擎严格来说光栅引擎并非全新硬件,只是此前所有光栅化处理硬件单元的组合,以流水线的方式执行边缘/三角形设定(Edge/Triangle Setup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作,每个时钟循环周期处理8个像素。GF100有四个光栅引擎,每组GPC分配一个,整个核心每周期可处理32个像素。
多形体引擎则要负责顶点拾取(Vertex Fetch)、细分曲面(Tessellation)、视口转换(Viewport Transform)、属性设定(Attribute Setup)、流输出(Stream Output)等五个方面的处理工作,DX11中最大的变化之一细分曲面单元(Tessellator)就在这里。GF100中有16个多形体引擎,每组SM一个,亦即每组GPC四个。需要说明的一点是AMD显卡在多形体引擎方面的设计采用的是所有SM共用一个多形体引擎,而NVIDIA采用的是每组SM一个,这样也就避免了多形体引擎称谓显卡性能瓶颈。
多形体引擎绝非几何单元改头换面、增强15倍而已,它融合了之前的固定功能硬件单元,使之成为一个有机整体。虽然每一个多形体引擎都是简单的顺序设计,但16个作为一体就能像CPU那样进行乱序执行(OoO)了,也就是趋向于并行处理。NVIDIA还特地为这些多形体引擎设置了一个专用通信通道,让它们在任务处理中维持整体性。
在每一组SM阵列里,纹理单元、一二级缓存、ROP单元和各个单元的频率也都完全不同于以往。每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。
ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。
除了ROP单元和二级缓存,几乎其他所有单元的频率都和Shader频率(NVIDIA暂称之为GPC频率)关联在一起:一级缓存和Sahder单元本身是全速,纹理单元、光栅引擎、多形体引擎则都是一半。
从NV30 GeForce FX 5800到GT200 GeForce GTX 280,NVIDIA显卡的几何性能只提高了不到3倍,而Shader性能提升了150多倍,但仅仅是从GT200到GF100,几何性能的增长倍数就达到了8x。
有了如此强大的几何性能,NVIDIA就可以使用细分曲面和置换贴图创建更复杂的人物、物体和场景,并保持和对手同样水平的性能,所以才有了16个多形体引擎和4个光栅引擎。
细分曲面是AMD DX11产品的宣传重点,但NVIDIA要做得复杂得多,而且理论上说效果更出色。接下来NVIDIA要做的就是让游戏开发商充分挖掘GF100架构的潜力,在保证性能的基础上做出更精致的游戏画面。
Fermi架构下的GF110核心更逼真的画面和更高效的计算
抖动采样(Jittered Sampling)实现更逼真画面
DX11详细定义了显卡需要提供的特性,但对渲染后端的工作涉及甚少,所以NVIDIA做了多形体引擎,还有抖动采样。抖动采样不是新技术,长期用于阴影贴图和各种后期处理,通过对临近纹素(Texel/纹理上的像素点)进行采样来创建更柔和的阴影边缘。它的缺点也是非常消耗资源。
DX9/10上抖动采样是分别拾取每一个纹素,DX10.1开始改用Gather4指令,NVIDIA则在硬件上使用单独一条矢量指令。NVIDIA自己的测试显示,这么做的性能大约是非矢量执行的两倍。
改进抗锯齿最高可实现32AA
CSAA是在G80 GeForce 8800 GTX上引入的,当时最高支持16x,如今不但提高到了32x,而且将色彩取样和覆盖取样分离开来,在32x CSAA中分别有8个和24个,无论性能还是画质都有明显提升。NVIDIA宣称,GF100 CSAA从8x到32x的平均性能损失只有区区7%。
在GF100上,Alpha to Coverage可以使用全部采样点(最多32个),而且有33个透明级别,透明多重采样抗锯齿(TMAA)的质量也因此得到了改进。
游戏计算(Compute for Gaming)
首先,CUDA架构的实现途径就多种多样,CUDA C、CUDA C++、OpenCL、DirectCompute、PhysX、OptiX Ray-Tracing等等不一而足。这其中既有NVIDIA自己似有的开发方式,也有开放的业界标准规范,开发商可以自由选择。
在游戏中,NVIDIA CUDA计算架构可以执行画质处理、模拟、混合渲染等等,实现景深、模糊、物理、动画、人工智能、顺序无关透明(OIT)、柔和阴影贴图、光线追踪、立体像素渲染等大量画面效果。值得注意的是NVIDIA这次新加入了队C++的原生支持。
《Metro 2033》里的景深效果
光线追踪演示DEMO
NVIDIA还宣称,GF100的游戏计算性能相比GT200有了大幅提高,比如PhysX流体DEMO演示程序3.0倍、《Dark Void》游戏物理2.1倍、光线追踪3.5倍、人工智能3.4倍。
立体多屏环绕技术3D Vision Surround
ATI Eyefinity可以支持六屏输出,而3D Vision Surround最多只能达到三屏,但它支持3D立体效果,是3D Vision技术的扩展增强版。遗憾的是,AMD Radeon HD 5000系列能单卡支持六屏输出,NVIDIA GF100却仍然只能同时驱动两台显示器,三台或者更多的话就需要两块GF100组建SLI系统。这样一来,双卡系统的性能当然会好很多,但成本也急剧增加。
但也正因为不是GF100架构的全新技术,GT200 GeForce GTX 200系列同样可以支持3D Vision Surround。事实上,NVIDIA在CES上展示的系统使用的就是两块GeForce GTX 285。
显示设备支持方面,3D立体系统需要三台同样支持3D Vision技术的液晶显示器、投影仪或者DLP,单个分辨率最高1920×1080;如果是非立体系统(此时叫作NVIDIA Surround),任何普通显示设备均可,单个分辨率最高2560×1600。
全面改进的散热:无热管真空腔均热板设计
由于GTX570显卡在散热器方面采用了与GTX580相同的设计模式,因此在这里我们以GTX580显卡为模板介绍显卡散热部分。
首先散热外壳就是其中的区别,显卡的散热外壳回归到螺丝固定的方式,虽然拆解不方便,但是相比GTX480的卡扣固定更加实用,毕竟卡扣固定有卡位脱落的风险,而且长时间使用后不容易出现漏风现象。
显卡散热特性展示
显卡的散热器主要有三大特色:真空腔均热板设计、改进的自适应散热风扇风速控制以及适应SLI组建的散热器外观设计。其中散热外壳的风扇部分的下斜设计就是考虑到SLI平台的显卡间间距小而为进风提供充足空间,考虑十分周到。
显卡散热器细节
拆开散热外壳后于GTX480显卡进行比较,可以发现两者的基本散热原理一样:通过涡轮散热风扇增压送风,散热模块吸取GPU热量、与此同时散热支架也在负责PCB主要部件的传热,然后风扇送风排出显卡外。不过Geforce GTX580显卡不像GTX480那样将散热模块与热导管外露直接与外部空气接触,而是仅有第二层PCI-E插槽的出风口,从这个设计可以看出该显卡的发热量与散热器的改进。
与GTX480的对比
与GTX480的对比
那么具体改进有哪些方面呢?首先在于涡轮散热风扇直径上的增大,相比GTX480,仔细观察两者的长度我们可以看到GTX580的涡轮散热风扇的直径更长,这使得送风量更大,对散热更加有利。
显卡的涡轮散热风扇直径更大
其次就是Geforce GTX580显卡采用了NVIDIA显卡首次应用的真空腔均热板散热设计,这在蓝宝石的毒药版显卡中经常应用到。真空腔均热板散热设计从原理上类似于热管,但在传导方式上有所区别。热管为一维线性热传导,而真空腔均热板中的热量则是在一个二维的面上传导,因此效率更高。具体来说,真空腔底部的液体在吸收芯片热量后,蒸发扩散至真空腔内,将热量传导至散热鳍片上,随后冷凝为液体回到底部。这种类似冰箱空调的蒸发、冷凝过程在真空腔内快速循环,实现了相当高的散热效率。
N卡首现真空腔均热板散热设计
真空腔均热板散热原理
从以上的原理可以看到真空腔均热板散热的工作流程,均热板底座受热,热源加热铜网微状蒸发器,然后冷却液(纯净水)在真空超低压环境下受热快速蒸发为热空气。采用真空设计使得热空气在铜网微状环境流通更迅速。此时热空气受热上升,遇散热板上部冷源后散热,并重新凝结成液体—散热,凝结后的冷却液通过铜微状结构毛细管道回流入均热板底部蒸发源处—回流,回流的冷却液通过蒸发器受热后再次气化并通过铜网微管吸热>导热>散热,如此反复作用。如此一来,一个散热模块其实内有乾坤,相信成本比热导管散热更高,但散热效果更好。
散热器支架
取出Geforce GTX580显卡的散热器支架,我们可以发现这个金属制的散热支架只要负责显存、供电元件的热量传递,然后通过涡轮散热风扇的送风传热到显卡外部。此外,Geforce GTX580显卡并没有加入散热背板设计,这也与GTX480一致。
Geforce GTX570:与GTX580如出一辙的外观设计
NVIDIA在第二代的DX11显卡的新品发布并没有像GTX480/GTX470那样同时发布,而是采用了一个短时间间隔的策略。毕竟如今NVIDIA不像半年前那样被AMD压得那么狼狈,反而显得运筹帷幄,不采取“一篮子装满鸡蛋”般的集中新品发布方式,循序渐进的方法更容易引起市场的长期注意力。
NVIDIA GeForce GTX 570 图片 评测 论坛 报价
按照GTX480与GTX470的命名规律,NVIDIA的GF110架构简化版将会命名为GTX570。这种“简化”除了体现在频率的降低外,还在于屏蔽了一组SM,以及取消了2个显存颗粒的规格。PConline评测室抢先得到了Geforce GTX570的原厂样卡,有趣的是,这次Geforce GTX570显卡的外观与Geforce GTX580相比显得换汤不换药。正面漾印着的绿色NVIDIA LOGO相比GTX580更加突出,也许这是一个区分的标志吧。
将两张新一代DX11旗舰级别显卡放在一起,我们的确只能通过正面的装饰处理来区分。因为两张显卡无论在外观设计构造上都保持一致的外观。当然,用户实际购买到的显卡是带有厂商品牌的贴纸以方便区分的。
或许正面不能看出两卡的区别,翻开背面来看,GTX580与GTX570还真是一个样,PCB长度、元件数量、分布以及用料做工均保持一致。
观察PCB上的标记,原来两块显卡均采用了同一款PCB的设计,均为代号P1261的公版样式,所以PCB的布局均保持一致,所以GTX480标志性的半月形PCB开孔在GTX500旗舰卡型不再出现,也侧面反映了GF110架构的散热要求比GF100低。虽然两者看似外观一样,但两卡的价格差达到了1000元,其中GTX570上市价位2999元,加上性能上的差距,GTX570在供电用料以及显存的布局上均有所节省。
接口的设计已经彰显着GTX580与GTX570的性能差距,其中后者的布局为6pin+6pin,而前者为8pin+6pin。多卡SLI的支持上两卡均内置了2个SLI金手指。
Geforce GTX570显卡沿用了GTX580的接口布局,同为双DVI+Mini-HDMI接口,这种组合虽然满足高清的需求,但通用性较差。用户购买时需要注意品牌的Geforce GTX570显卡是否赠送Mini-HDMI转HDMI的线缆,以免无形中加大了组建Geforce GTX570高清平台的成本。
Geforce GTX570:真空均热板再次运用
Geforce GTX570显卡沿用了GTX580显卡的整体设计,PCB代号也一样,所以在下面显卡拆解与散热分析过程中大家会似曾相识,下面我们就进行简单介绍。Geforce GTX570显卡的散热外壳回归到螺丝固定的方式,虽然拆解不方便,但是相比GTX480的卡扣固定更加实用,密封性更好。
Geforce GTX570显卡的散热器主要有三大特色:真空腔均热板设计、改进的自适应散热风扇风速控制以及适应SLI组建的散热器外观设计。其中散热外壳的风扇部分的下斜设计就是考虑到SLI平台的显卡间间距小而为进风提供充足空间,考虑十分周到。
Geforce GTX570显卡的散热原理为:通过涡轮散热风扇增压送风,散热模块吸取GPU热量、与此同时散热支架也在负责PCB主要部件的传热,然后风扇送风排出显卡外。而且风道设计方面与Geforce GTX580显卡一样,不像GTX480那样将散热模块与热导管外露直接与外部空气接触,而是仅有第二层PCI-E插槽的出风口,从这个设计可以看出该显卡的发热控制与散热器的改进。
此外,Geforce GTX570显卡沿用了Geforce GTX580显卡的真空腔均热板散热设计。原理上类似于热管,但在传导方式上有所区别,热管为一维线性热传导,而真空腔均热板中的热量则是在一个二维的面上传导,因此效率更高。具体来说,真空腔底部的液体在吸收芯片热量后,蒸发扩散至真空腔内,将热量传导至散热鳍片上,随后冷凝为液体回到底部。除了核心的改进外,散热上的进步使得GTX580的满载温度公认比GTX480低,在今天的GTX570中也一样。
此外,Geforce GTX570显卡相比GTX580的另外一项改进就是散热模块的纯铜核心接触面的凸出设计,使得与核心“亲密接触”,传热效率更快,不过边角弧形的形状设计使得核心接触面并不能完全覆盖核心。
取出Geforce GTX580显卡的散热器支架,我们可以发现这个金属制的散热支架只要负责显存、供电元件的热量传递,然后通过涡轮散热风扇的送风传热到显卡外部。此外,Geforce GTX580显卡并没有加入散热背板设计,这也与GTX480一致。
与GTX580统一的P1261公版PCB设计
下面来到了PCB的介绍部分,由于Geforce GTX570的PCB代号与GTX580的一致,所以细节部分也不需太多的赘述,我们主要介绍两者之间的不同。
这种不同体现在Geforce GTX570的PCB用料的节省上,由于Geforce GTX570显卡的GF110架构被屏蔽了1组SM,为480个CUDA流处理器,而GTX580为完整的512个。Geforce GTX570的PCB取消了2个显存颗粒,规格降低为320位宽、1280MB容量的GDDR5显存。由于规格的裁减,供电负载有所降低,Geforce GTX570显卡取消了2相的供电设计。
此外,两块显卡接口部分采用了可降低电磁干扰的金属屏蔽罩设计,保证了显示输出质量。
GTX580虽然赞誉声不断,但是NVIDIA为之加入的一个荷载监控芯片却引来了很大争议。这个芯片设计的初衷为实时监控显卡当前工作电流电压,并监控与控制电压上限,实现显卡的动态荷载控制。尤其对于拷机应用以及大型3D游戏来说,可优化显卡供电荷载,以免出现因为拷机而出现的电压过高、电流损失直接转化热量的现象。
不过由于针对Furmark这类功耗测试软件进行了“优化”,使得显卡并不能运行在真正的满荷载的环境下,我们原本也误以为显卡的功耗真的会“那么低”,但通过破解后进行测试,实际上与GTX480的差不多。由于Geforce GTX570的架构与PCB与GTX580一致,所以实际功耗上也是比较可观的。
Geforce GTX570显卡采用了完整的480个CUDA流处理器,核心代号为GF110,与GTX580一致,但是屏蔽了一组SM。核心晶体管数量依然高达32亿个。该卡支持最新的DirectX 11与Shader Model 5.0,还支持NVIDIA自身特色的CUDA、PhysX物理加速、3D显示与3D眼镜支持以及PureVideo高清硬件加速技术。10个GDDR5显存颗粒组成1280MB/320bit的显存规格,默认频率为732/3800MHz。GTX580的为772/4008MHz,显存规格为1536MB容量以及384bit。
Geforce GTX570显卡的供电设计相比GTX580的少了2相的用料是十分外显的,为4+2相供电设计。大量采用了高质量的陶瓷电感与铁素体电感,并加入了大量固态电容、贴片式钽电容与8pin封装的低电阻MagnaChip MOSFET,有效降低供电噪音,保证电流的纯净。
总的来看,Geforce GTX570显卡为GTX580不折不扣的升级优化版,但是由于依然基于了GTX580的高端血统,所以定位高端,成本的限制使得价格很难降低到主流玩家接受的价位。这就像GTX470或者GTX465与GTX480的关系。
显卡散热器
映众 GTX570显卡依然基于NVIDIA Geforce GTX570公版的散热器,一体化的密封散热器内置了真空腔均热板散热模块,相比热管散热器器散热效能会有一定的进步。此外,散热支架依然提供了显存、供电元件的传热功能,通过涡轮散热风扇进行排热。
首批上市GTX570:映众 GTX570显卡
映众 GTX570显卡
在这次GTX570的发布中,映众保持了较快的新品上市进度。这次发布的映众 GTX570显卡实际上与NVIDIA原厂GTX570公版一模一样,只是正面的贴纸有所不同。相比之下,映众 GTX570显卡的正面贴纸更显视觉冲击力。
接口布局
映众 GTX570显卡的接口布局与公版GTX570一致,均为双DVI+Mini-HDMI布局,用户购买时需要注意商家有没有附送Mini-HDMI转HDMI的转接线,以免需要额外付出购置成本。
显卡PCB
外接供电与SLI接口
至于在细节部分,映众 GTX570显卡基于6pin+6pin的外接供电接口以及双SLI接口,可满足组建三卡SLI平台的需求。显卡接口部分采用了可降低电磁干扰的金属屏蔽罩设计,保证了显示输出质量。
供电设计
映众 GTX570显卡的GF110架构基于40nm的工艺制程,核心晶体管数量高达32亿个,内置了480个CUDA流处理器。该卡支持最新的DirectX 11与Shader Model 5.0,还支持NVIDIA自身特色的CUDA、PhysX物理加速、3D显示与3D眼镜支持以及PureVideo高清硬件加速技术。10个GDDR5显存颗粒组成1280MB/320bit的显存规格,默认频率为732/3800MHz。
供电部分,显卡基于4+2相供电设计,而且大量采用了高质量的陶瓷电感与铁素体电感,并加入了大量固态电容、贴片式钽电容与8pin封装的低电阻MagnaChip MOSFET,有效降低供电噪音,保证电流的纯净。
首批上市GTX570:超图 GTX570显卡
这次发布的超图 GTX570显卡实际上与NVIDIA原厂GTX570公版一模一样,只是正面的贴纸有所不同。相比之下,超图 GTX570显卡的正面贴纸更显视觉冲击力。
接口布局
超图 GTX570显卡的接口布局与公版GTX570一致,均为双DVI+Mini-HDMI布局,用户购买时需要注意商家有没有附送Mini-HDMI转HDMI的转接线,以免需要额外付出购置成本。
显卡PCB
外接供电与SLI接口
至于在细节部分,超图 GTX570显卡基于6pin+6pin的外接供电接口以及双SLI接口,可满足组建三卡SLI平台的需求。显卡接口部分采用了可降低电磁干扰的金属屏蔽罩设计,保证了显示输出质量。
供电设计
超图 GTX570显卡的GF110架构基于40nm的工艺制程,核心晶体管数量高达32亿个,内置了480个CUDA流处理器。该卡支持最新的DirectX 11与Shader Model 5.0,还支持NVIDIA自身特色的CUDA、PhysX物理加速、3D显示与3D眼镜支持以及PureVideo高清硬件加速技术。10个GDDR5显存颗粒组成1280MB/320bit的显存规格,默认频率为732/3800MHz。
供电部分,显卡基于4+2相供电设计,而且大量采用了高质量的陶瓷电感与铁素体电感,并加入了大量固态电容、贴片式钽电容与8pin封装的低电阻MagnaChip MOSFET,有效降低供电噪音,保证电流的纯净。
首批高频版GTX570:七彩虹 GTX570显卡
这次发布的七彩虹 GTX570显卡实际上与NVIDIA原厂GTX570公版一模一样,只是正面的贴纸有所不同。相比之下,七彩虹 GTX570显卡的正面贴纸更显视觉冲击力。
七彩虹 GTX570显卡的接口布局与公版GTX570一致,均为双DVI+Mini-HDMI布局,用户购买时需要注意商家有没有附送Mini-HDMI转HDMI的转接线,以免需要额外付出购置成本。
显卡PCB
外接供电与SLI接口
至于在细节部分,七彩虹 GTX570显卡基于6pin+6pin的外接供电接口以及双SLI接口,可满足组建三卡SLI平台的需求。显卡接口部分采用了可降低电磁干扰的金属屏蔽罩设计,保证了显示输出质量。
供电设计
七彩虹 GTX570显卡的GF110架构基于40nm的工艺制程,核心晶体管数量高达32亿个,内置了480个CUDA流处理器。该卡支持最新的DirectX 11与Shader Model 5.0,还支持NVIDIA自身特色的CUDA、PhysX物理加速、3D显示与3D眼镜支持以及PureVideo高清硬件加速技术。10个GDDR5显存颗粒组成1280MB/320bit的显存规格,默认频率为750/3900MHz。
供电部分,显卡基于4+2相供电设计,而且大量采用了高质量的陶瓷电感与铁素体电感,并加入了大量固态电容、贴片式钽电容与8pin封装的低电阻MagnaChip MOSFET,有效降低供电噪音,保证电流的纯净。
首批上市GTX570:索泰 GTX570显卡
这次发布的索泰 GTX570显卡实际上与NVIDIA原厂GTX570公版一模一样,只是正面的贴纸有所不同。相比之下,索泰 GTX570显卡的正面贴纸更显视觉冲击力。
索泰 GTX570显卡的接口布局与公版GTX570一致,均为双DVI+Mini-HDMI布局,用户购买时需要注意商家有没有附送Mini-HDMI转HDMI的转接线,以免需要额外付出购置成本。
显卡PCB
外接供电与SLI接口
至于在细节部分,索泰 GTX570显卡基于6pin+6pin的外接供电接口以及双SLI接口,可满足组建三卡SLI平台的需求。显卡接口部分采用了可降低电磁干扰的金属屏蔽罩设计,保证了显示输出质量。
供电设计
索泰 GTX570显卡的GF110架构基于40nm的工艺制程,核心晶体管数量高达32亿个,内置了480个CUDA流处理器。该卡支持最新的DirectX 11与Shader Model 5.0,还支持NVIDIA自身特色的CUDA、PhysX物理加速、3D显示与3D眼镜支持以及PureVideo高清硬件加速技术。10个GDDR5显存颗粒组成1280MB/320bit的显存规格,默认频率为732/3800MHz。
供电部分,显卡基于4+2相供电设计,而且大量采用了高质量的陶瓷电感与铁素体电感,并加入了大量固态电容、贴片式钽电容与8pin封装的低电阻MagnaChip MOSFET,有效降低供电噪音,保证电流的纯净。
首批上市GTX570:翔升 GTX570显卡
这次发布的翔升 GTX570显卡实际上与NVIDIA原厂GTX570公版一模一样,只是正面的贴纸有所不同。相比之下,翔升 GTX570显卡的正面贴纸更显视觉冲击力。
翔升 GTX570显卡的接口布局与公版GTX570一致,均为双DVI+Mini-HDMI布局,用户购买时需要注意商家有没有附送Mini-HDMI转HDMI的转接线,以免需要额外付出购置成本。
显卡PCB
外接供电与SLI接口
至于在细节部分,翔升 GTX570显卡基于6pin+6pin的外接供电接口以及双SLI接口,可满足组建三卡SLI平台的需求。显卡接口部分采用了可降低电磁干扰的金属屏蔽罩设计,保证了显示输出质量。
供电设计
翔升 GTX570显卡的GF110架构基于40nm的工艺制程,核心晶体管数量高达32亿个,内置了480个CUDA流处理器。该卡支持最新的DirectX 11与Shader Model 5.0,还支持NVIDIA自身特色的CUDA、PhysX物理加速、3D显示与3D眼镜支持以及PureVideo高清硬件加速技术。10个GDDR5显存颗粒组成1280MB/320bit的显存规格,默认频率为732/3800MHz。
供电部分,显卡基于4+2相供电设计,而且大量采用了高质量的陶瓷电感与铁素体电感,并加入了大量固态电容、贴片式钽电容与8pin封装的低电阻MagnaChip MOSFET,有效降低供电噪音,保证电流的纯净。
显卡测试平台和方法说明
正式测试之前,先让我们一起来看看与这次评测有关的相关评测平台和评测方法。
硬件平台 | |
CPU | AMD Phenom II X6 1090T |
主板 | 技嘉890FX |
内存 | DDR3 1333 2GX2(8-8-8-24) |
硬盘 | 西部数据 WDC WD6400AAKS |
显卡 | GTX570(732/3800MHz) GTX580(772/4008MHz) GTX480(700/3696MHz) GTX470(607/3398MHz) HD5870(850/4800MHz) HD6870(900/4200MHz) |
软件平台 | |
系统软件 | Windows 7rtm旗舰版+DirectX 11 |
驱动程序 | NVIDIA 263.09 For Windows 7 AMD 10.10e For Windows 7 |
评测软件 | DX11: Heaven banchmark 2.1 尘埃2 异形大战铁血战士 失落的星球2 地铁2033 正当防卫2 战地:叛逆连2 鹰击长空2 石巨人 DX10: 3DMark Vantage 孤岛危机 孤岛惊魂2 使命召唤6 物理加速游戏: 蝙蝠侠 温度功耗: furmark |
为了不使CPU成为显卡性能瓶颈,我们选择了目前强大的AMD Phenom II X6 1090T处理器搭配技嘉890FX主板作为测试平台。另外,考虑到Windows7系统将逐渐成为今后的主流系统,同时它还支持Direct 11因此在测试中我们所用了Windows7 64位操作系统作为测试平台,另外考虑到显卡定位等综合因素,在测试分辨率上我们选择了1920x1080 4AA、2560x1600 4AA作为测试标准。在3DMark Vantage理论性能测试中,为了能更体现出显卡的行呢个我们选择Entry档作为测试标准。
Heaven benchmark 2.1对比测试
游戏引擎开发商Unigine推出的DirectX 11 GPU测试程序Heaven Benchmark自去年10月推出以来,就凭借对曲面细分等新特性应用的深度和广度成为媒体和玩家测试DX11显卡的重要工具。
Heaven benchmark 2.1
测试界面
在2.0版本的基础上,Heaven Benchmark 2.1测试工具加入了对OpenGL 4.0标准规范的支持,包括OpenGL模式下的硬件曲面细分技术。并且加入了对多种立体3D模式的支持,包括Anaglyph、Separate Images、NVIDIA 3D Vision、iZ3D等等。此外,2.1版本还进行了一些细节方面的优化和完善。
测试成绩:
DX11游戏《尘埃2》对比测试
在前作《尘埃》大获成功之后,这款与已故赛车手科林麦克雷合作的拥有十年发展历史的游戏又出新作——《尘埃2》在越野赛表现形式的多样性方面展开了探索。
尘埃2
该游戏的一大特色是将当代越野赛的一些真实事件记录在册,给玩家带来无数的变化,更有真实世界环境挑战的体验。世界巡游赛让玩家在富有侵略性的赛事中角逐,同时玩家还能在非常特别的新地点参与单人赛事,这些新地点包括峡谷赛事、丛林小径以及城市竞技场环境等等。
游戏自带Benchmark Test
笔者使用游戏自带Benchmark进行测试,测试环境均为Windows7,在1920X1080全高清下开启最高特效,游戏抗锯齿开启为4AA。
测试成绩:
DX11游戏《地铁2033》测试
作为一款恐怖FPS游戏,《地铁2033》拥有次世代顶级的画面表现,精确的实时光照,高精度的体积阴影,PhysX加速效果,尤其是整体大范围烟雾尘埃刻画更是出众,营造出了一个极具渲染力的恐怖末日游戏场景;游戏中,主角与其他角色的互动性较高,任务也具有一定的自由度;武器种类虽然较少,但细节表现还是较为优秀的。总体上,《地铁2033》凭借DirectX 11/10/9下的优异画面表现和超精细场景刻画,绝对是一款对游戏画面有追求的FPS玩家必玩的大作。
进入《地铁2033》游戏初始界面相信玩家可以感觉到本作的独到设计风格,落在相关选项上对象会有高互动的感应。
DIRECTX 11 OPTIONS(DIRECTX 11选项),RESOLUTION(分辨率),DIRECTX,ANTIALIASING(抗锯齿),TEXTURE FILTERING(纹理过滤),GAMMA(伽玛值)。测试中我们将所有的特效都开到最高,同时打开游戏物理加速。
测试成绩:
DX11游戏《异形大战铁血战士》测试
《异形大战铁血战士》是这款FPS游戏是由Rebellion公司开发的,本次的游戏的剧情没有照搬电影的剧情,而是将舞台设定为名叫BG-386的行星,相同的是人类在该星球发现了古代金字塔,而围绕该金字塔隐藏的巨大秘密异形、铁血战士以及人类3种族再次展开激烈的战斗。
异形大战铁血战士
游戏中除了提供单人故事模式以外,还提供多人对战模式,可以说多人对战模式才是这个游戏最能吸引玩家一直玩下去的地方。
纹理质量、分辨率、阴影复杂性、各向异性过滤、环境光散射,垂直同步的调整菜单。所谓的(环境光散射)Ambient Occlusion是指通过不特定的光源表现周边所有环境阴影的功能。比如在在墙和墙草和草之间相关物体们产生的光线的反射。在测试中我们将所有的特效开至最高。
测试成绩:
DX11游戏《失落的星球2》评测
失落的星球2
游戏采用CAPCOM独自研发并进一步强化的“MT-Framework 2.0”游戏引擎,呈现比前作更为细致美丽的画面,使用该引擎的还有《鬼泣4》和《生化危机5》,并且PC版本加入了DX11特效,成为一款具备DX11性能参考价值的游戏。本次测试,我们使用了官方的Benchmark Version进行测试,结果具备很大的权威性。
失落的星球2
测试成绩:
DX11游戏《鹰击长空2》评测
DX11游戏《鹰击长空2》
《鹰击长空2》是最新的DX11游戏,玩家将扮演飞行员,驾驶世界上最先进的飞机,担任一系列的战斗任务。该游戏运用了较多DX11中很重要的“细分曲面”特效,能较好地反映显卡的DX11性能。我们采用Benchmark进行测试。
测试成绩:
DX11《战地:叛逆连2》游戏对比测试
《战地:叛逆连2》(Battlefield: Bad Company 2),是EA DICE开发的一款第一人称射击游戏。游戏开发商美国艺电确定 2010年3月2日为游戏Xbox 360、PS3、PC版的首发日期。该作是EA DICE开发的第9款“战地”系列作品,也是《战地:叛逆连》的直接续作,在继承前作特性的基础上,加强了多人联机载具对战和团队合作元素的设定。游戏使用加强版的寒霜引擎,加入了建筑物框架破坏和物体分块破坏的支持。
游戏的选项主要分为一般设置和行动设置两部分。一般选项包括了游戏控制器的选择,玩家控制的习惯,以及声音和视频的设置,多种选项堆在一个窗口虽然稍稍令人有些眼花缭乱,但是却省略了不停翻页找选项的痛苦。至于行动设置部分,则就是图中的“步行”、“载具”和“飞行”的选项。《战地:叛逆连2》提供了多达15种。
测试成绩:
DX11StoneGiant《石巨人》DEMO测试
游戏引擎开发商BitSquid和游戏开发商Fatshark今日宣布,已为PC游戏爱好者准备了一款用于检验GPU之DX11能力的技术演示程序,名为“StoneGiant”。
该demo内建对DX11及曲面细分特性的支持,两周后面向全体玩家开放下载,BitSquid将于今年第三季为PC、PS3和Xbox360平台提供相应的BitSquid Tech游戏引擎。
由于目前《石巨人》的banchmark只提供了1280x768、1920X1080和1920x1200三个测试分辨率因此在这次测试中我们只选择了1920X1080作为测试分辨率。
测试成绩:
DX10 3D理论性能测试:3DMark Vantage
3DMark Vantage是一款完全针对DirectX 10开发的测试软件,只提供DX10的API,因此DX9的显卡就无缘测试了,而3DMark Vantage较权威地得出显卡的DX10性能,对于消费者了解显卡的理论性能有一定的指导意义。而3DMARK Vantage提供了4个等级的标准设置,分别是Entry(入门级别),Performance(性能级别),High(高端级别)和Extreme(极致级别)。根据本次测试显卡的定位,我们选择Performance(性能级别)对显卡进行测试。
测试画面
3DMark Vantage认为不同级别的测试模式,显卡和CPU之间的权重比例是不一样的,因此四个测评模式下的评分标准也不一致,下面我们来看看四个模式中,显卡和CPU的权重比为多少:
测试模式 | Entry | Performance | High | Extreme |
显卡权重系数 | 0.75 | 0.75 | 0.85 | 0.95 |
CPU权重系数 | 0.25 | 0.25 | 0.15 | 0.05 |
3DMark Vantage 总得分标准:
3DMark=1/(显卡权重系数 / 显卡总分+CPU权重系数 / CPU总分)
测试成绩:
DX10游戏《孤岛危机 弹头》对比评测
《孤岛危机》测试画面
《孤岛危机 弹头》自带的测试程序
基于CryengineII的《孤岛危机》至今仍是公认最变态的3D游戏,玩家们还戏称为“显卡危机”,可见其对显卡性能要求之高。我们采用的是Crysis游戏自带的Benchmark进行测试。
测试成绩:
DX10游戏《孤岛惊魂2》对比评测
游戏画面
FarCry2《孤岛惊魂2》是一款DX10游戏,我们采用自带BenchMark进行测试,模式为DirectX 10,品质为High。
孤岛惊魂2测试benchmark
测试成绩:
DX10游戏《正当防卫2》对比测试
《正当防卫2》依然采用了Rico Rodriquez作为本作的男主角,事情发生在前作发生的几年之后,Rico被要求在东南亚的一个小岛Panau上找到Tom Sheldon,并将其杀死。而具体的做法就是不停地破坏,制造混乱,然后团结某些力量获取情报,最后找到Tom,最终将其杀死。
在《正当防卫2》的高级显示设置里面,可以根据实际平台配置选择不同级别的特效,在这款游戏中我们将所有的特效都开至高,不过由于AMD显卡在这款游戏中没有GPU水面模拟和散景过滤两个特效选项,为了保持测试的公平我们在运用NVIDIA显卡进行测试时将这两个选项选择为“关”。在测试场景上面我们选择的是基准测试中的“黑暗之塔”。
测试成绩:
DX9游戏《使命召唤7》对比评测
销量突破千万份:《使命召唤7:黑色行动》
《使命召唤:黑色行动》是动视FPS游戏使命召唤系列的第七部续作,由Treyarch负责开发,最新数据显示该游戏销量突破了1000万,相当受欢迎。故事剧情设定在了上世纪后期的美国越南战争时期,游戏主要描述了战争期间的一个名称为Studies and Observations Group的组织,他们将在越南战争中承担最秘密、最危险的任务。
而且游戏场景还会穿插北极、古巴等一些冷战时期的热点地区。玩家投身越南丛林时将扮演MACV-SOG成员,专司敌后渗透、破坏、暗杀等不可告人的隐秘勾当。《使命召唤:黑色行动》将为你带来电影般的视觉冲击和紧张刺激的战斗。 测试成绩:
游戏截图
物理游戏《蝙蝠侠:阿甘疯人院》测试
《蝙蝠侠:阿甘疯人院》支持NVIDIA PhysX技术,提供超逼真的临场体验,加上游戏中充满高度互动性的物件,带领玩家进入蝙蝠侠在纽约市罪犯精神病院中的惊险搏斗。其中NVIDIA GPU的著色处理效能在游戏场景中创造了各种拥有物理互动反应的物件,这不仅让游戏的画面更精采,更可使游戏世界充满真实感和临场体验。
蝙蝠侠:阿甘疯人院
测试成绩:
显卡功耗温度测试
在测试之前需要说明的一点是,由于我们无法测试单张显卡的独立功耗,因此在测试中所有的功耗成绩均为整机功耗。
FurMark
我们采用严厉的FurMark进行烤机,5分钟后记录核心满载时的温度;然后待机5分钟,在GPU-Z的Sensor功能记录此时为待机核心温度。在两个测试环境下我们都使用功耗测试仪来检测功耗,测试环境保持在26摄氏度。
测试选项设置
测试成绩:
CUDA通用运算应用测试
NVIDIA CUDA架构目前在国内外数十款软件中均有应用,对于经常需要用到视频转码的用户来说最难熬的就是转码过程中等待的时间,而如果我们运用NVIDIA CUDA转码的话则会大大缩短转码的时间。基于此,下面我们就带目前市面上常用的Mediacoder进行了CUDA转码测试,以对比在运用GPU转码和CPU转码时所用的时间。
转码设置
需要说明的一点是,在这次测试中我们采用的是一段大小为60MB时间为2分钟的1080P高清视频转换成手机QVGA较高质量规格的视频。
CUDA转码结果与CPU占用截图
在CUDA转码测试中我们选用了最新版本的MediaCoder NT版本进行测试,由于该版本不支持X264转码,所以我们还在旧版软件下使用相同的转码条件进行对比。但是在新版本的MediaCoder软件中并不支持CPU实时占用率的显示,所以我们只使用任务管理器的CPU占用监控窗口来估测CPU占用状态。
X264转码与CPU占用截图
测试成绩:
CUDA应用测试
是否支持CUDA对视频转码效率的影响是显而易见的,使用CUDA转码转换视频比X264转码节省了3秒的时间,如果需要转码数小时的电视剧或者电影,那么节省的时间是不菲的。并且在GTX570的整个转码过程中,CPU的占用率比X264的更低,反而X264转码会导致CPU满载,可见通过CUDA能实现转码过程中用户进行多任务操作。
PConline评测室总结
不得不说NVIDIA对于这次GTX570显卡的上市略显低调,出现这种情况一方面无疑与GTX480库存还比较多有关,而另一方面也跟这款显卡本身有着密不可分的关系,首先GTX570仅是一款定位于次旗舰的显卡而不是旗舰,其次前面我们提到过GTX570可以说是在GTX480的基础上优化升级而来,本身的改进并不大,因此难免会有部分别有用心的人认为这不过是简单的升级名字而已。
我们不否认GTX570在参数上的变化确实不大,但是我们从GTX570作为GTX470的替代产品和NVIDIA第二代DX11显卡次旗舰的角度出发,综合其定位、价格和性能都是有可圈可点的地方。
首先,作为上一代次旗舰GTX470的替代者,GTX570其整体性能毫无疑问地领先GTX470,并且这种领先幅度相对上一代是非常明显和出众的,可以肯定的是在HD6870的推出GTX470显卡降价,以及AMD HD6950显卡呼之欲出的背景下,GTX570很好地弥补了NVIDIA第二代DX11显卡单一的情况。
其次,在性能方面我们看到,虽然GTX570显卡在显存容量上相对GTX480有所减少,但是凭借着其在频率上的优势也弥补了一些其在显存上的不足。从整体成绩来看GTX570几乎和GTX480一样,而这个成绩对于目前AMD的任何一款单核显卡来说都是无法企及的。因此在AMD HD6900上市之前GTX570即使是面对HD5870也是十分有优势的。
NVIDIA GeForce GTX570优缺点点评 | |
优点 | 缺点 |
1、显卡定位合理 2、显卡性能出众 3、价格相对合理 | 功耗控制问题依然存在 |
另外,由于GTX570在功耗控制方面采用了与GTX580相同的方法,而之前的破解方式对于GTX570来说无法测试出其满载真实功耗,NVIDIA的这一设计,虽然一定成分是为了给其显卡功耗带来比较好看的成绩,但也不能否认其保护显卡的用心,因此对于这个问题就见仁见智了。
我们再来说说GTX570显卡的定价,应该说目前2999元的价格对于GTX570来说还是比较合理的,毕竟这个价格和目前的HD5870价格相当甚至还要略低一些。相反GTX570的上市和GTX480价差100元的情况,倒是给GTX480带来了麻烦。
最后,在HD6900显卡发布之前,依靠目前的HD5800以及HD6800显卡恐怕还真是无法与之争锋。
附加测试DX11理论性能测试:3DMark 11
3DMark 11基于Futuremark自行设计的原生DX11引擎,可综合考察DX11 PC游戏平台的整体图形性能。
测试截图
测试成绩: