特立独行or全面发展?看AMD反攻NVIDIA

硬件 mayue 2010-07-13 19:45

第一页:HD5000接近完美,GTX400让人大失所望

    AMD发布Radeon HD5000全系列显卡之后,由于率先支持DX11、40nm低功耗低发热、Eyefinity多屏显示技术、次世代音频源码输出等诸多特色,用户关注度节节攀升,很多用户迫不及待的加入DX11军团,抢先体验新一代DX11显卡的魅力。

Radeon HD5000  

HD5000系列在各方面的表现都接近完美

    当然也有部分用户持观望态度,他们对NVIDIA的新一代产品抱有期望,希望能获得更好的性能、更低的价格、更全面的功能。但是NVIDIA让所有支持他的粉丝们大失所望了:千呼万唤始出来的GTX480,在性能方面并没有比HD5870强多少,根本不是HD5970的对手,而且功耗十分恐怖、发热和噪音令人担忧、功能方面也没能带来惊喜,价格更是高高在上!

 Radeon HD5000

GTX400过高的功耗和发热让人担忧

    事已至此,在产品和技术方面无力回天的局面下,NVIDIA重新启用自己惯用的营销手段,开始大力鼓吹GTX400系列唯一的优势:GTX400的理论曲面细分性能可以达到HD5000的十几倍!并以此为依据证明GTX400才是真DX11显卡,AMD的HD5000系列是伪DX11显卡。

    这种做法与去年NVIDIA推广PhysX的手段如出一辙,NVIDIA只能在屈指可数的PhysX游戏/Benchmark(测试包)和DX11 SDK(开发包)/Demo(技术演示)中以夸张的比分压制ATI显卡,而在实际游戏中,根本就不是那么回事。NVIDIA仅有的三款DX11显卡,在六款DX11游戏中的表现确实让人遗憾。

第二页:HD5000黄金架构,为DX11五大关键技术开路

    PhysX是NVIDIA的专利,可Tessellation不是。事实上Tessellation是ATI的原创技术,早在Radeon 8500时代ATI就着手研发曲面细分的硬件执行单元,该技术获得了微软的亲睐于是被应用在了Xbox360游戏机当中,此后的HD2000/3000/4000都植入了Tessellator单元。终于在DX11时代,微软认为Tessellation技术已经完全成熟,被正式纳入了DX11的规范当中。

 Radeon HD5000

等到DX11正式接纳曲面细分时,AMD已经是第六代技术了,真不容易

    曲面细分是DX11的五大关键技术之一,但并非全部,否则DX11就不会在业界如此备受期待了,毕竟曲面细分并不是什么最新技术。除了曲面细分外,DX11当中还包括了其它的四项关键技术特性:

 Radeon HD5000

DX11拥有五大关键技术特性

    目前总共有六款DX11游戏,其中《异形大战铁血战士》、《科林麦克雷:尘埃2》、《潜行者:普里皮亚季的呼唤》还有NVIDIA自己赞助的The Way游戏《地铁2033》,这四款DX11游戏只使用到了很少、很轻的曲面细分。但这些游戏无一例外的使用到了DirectCompute、多线程渲染、纹理压缩等其它的DX11先进技术。另外两款DX11游戏《BattleForge》和《战地:叛逆联队2》根本没有用到曲面细分技术,而仅仅是使用了DirectCompute 11来辅助运算HDAO等高级光影特效,并使用多线程渲染技术提高游戏的运行流畅度。

 Radeon HD5000

《尘埃2》当中大量使用了DX11的所有关键技术

    在现在和可预见的将来,这些游戏都是DX11功能在3D画面当中使用和平衡的最佳例子。只有充分利用ShaderModel 5.0、DirectCompute 11、多线程渲染、还有新纹理压缩等技术,才能大大优化DX11游戏的渲染效率,从而让GPU有更多富余的资源来渲染复杂的模型,然后再搭配一定程度的曲面细分技术,只需牺牲很小的性能,就能获得更加完美的DX11画质。

 Radeon HD5000

GTX400虽然拥有很多的曲面细分单元,但是流处理器和纹理单元较少

    NVIDIA想要把曲面细分性能做得很强,这本身并没有错,但最大的问题就是:NVIDIA为了曲面细分消耗了大量的晶体管,导致GPU复杂度大增,可实际运算能力并没有取得突破。曲面细分本身是固定的功能单元,它只能在游戏需要曲面细分时才会工作,而不像流处理器那样可以智能的分配去做各种各样的任务。

    NVIDIA片面注重曲面细分的结果就是,GTX400只能在纯粹的曲面细分SDK/Demo中取得比较好的成绩,在实际游戏中却毫无建树。而AMD则不同,HD5000的架构在设计之初就考虑到了DX11的五大关键特性,所有的固定功能模块(如曲面细分单元、纹理单元、光栅单元)都非常均衡,大幅加强了流处理器的数量和效率,对DirectCompute11和ShaderModel 5.0指令集专门进行了优化,这样的黄金架构在面对任何DX11游戏时都能得心应手,而不像NVIDIA那样极端。

第三页:没有曲面细分是不行的,但曲面细分也不是万能的

    事实的确如此,GTX400拥有极强的曲面细分性能,在微软DX11 SDK和NVIDIA自家Demo中的性能可达HD5800的10倍左右,在Heaven Benchmark 2.0中性能也领先于HD5900。但是,DX11游戏真的需要那么强的曲面细分性能吗,曲面分那么细有用吗?我们先来看一组截图:

 Radeon HD5000

Heaven 2.0 Tessellation Off,FPS=69

 Radeon HD5000

Heaven 2.0 Tessellation Normal,FPS=33

 Radeon HD5000

Heaven 2.0 Tessellation Extreme,FPS=16

    可以看出,曲面细分从无到有所带来的画质改进绝对是质变,石块、台阶、瓦片的立体感十分强烈,相应的光影效果也很到位。然后将曲面细分级别从Normal提升至Extreme时,凹凸立体感并没有太大变化,Normal模式已经足够出色了,过高的细分级别并不会带来更佳的画质,但却大大加重了显卡的负担,FPS损失非常惨重。

    Heaven是款不错的DX11 Benchmark程序,其1.0版本是基于HD5000而开发的,Tessellation只有Normal级别。在GTX480发布之后,很快就诞生了2.0版本,其测试场景并没有太大变化,最核心的内容就是将曲面细分提升至Extreme级别,大家可以发现,片面提升曲面细分的结果就是:除了FPS暴降之外很难看出画面有什么提升!

    当然,微软的几个DX11 SDK和NVIDIA自家的Demo也是同样的问题,下面是NVIDIA Island11 Demo的截图:

 Radeon HD5000 Radeon HD5000

关闭Tessellation与25级Tessellation的区别,即便小缩略图都能看出来

 Radeon HD5000 Radeon HD5000

默认50级与最高的100级的区别

    该Demo默认的曲面细分级别为50(可以认为是自动插入顶点的数目),将其加大到100级之后,GTX480依然能够流畅自如,而HD5870则只有个位数。但是,50级和100级的画面真有区别吗?恐怕拿着放大镜也很难看出来,事实上即便是25级的曲面细分,画面已经非常好了,到了一定的精度就不会有什么效果了。

DX11游戏不需要把曲面分太细

    在真正的DX11游戏中,开发商们不可能将曲面细分级别调太高,因为这样做的结果并不会让游戏画面变得更好,但却会大幅降低游戏FPS,游戏运行不流畅,可谓是得不偿失。游戏不同于技术演示Demo或者SDK,而是本着实用化的原则,追求高效率运行,而不是专用用来刁难显卡的。

    就拿目前已经发布的几款DX11游戏来说,对于曲面细分技术都只是蜻蜓点水、适可而止,即便如此已经可以让游戏画面得到很大的改善。就连最新的一款DX11 The Way游戏《地铁2033》,对于曲面细分的应用也不是很高,而GTX400在该游戏中的表现也并不比HD5800强多少。

    所以说,通过几款毫无实际意义的SDK和DEMO或者Benchmark来证明GTX400才是真DX11显卡是毫无道理的,游戏才是检验显卡性能的唯一标准,而HD5800面对所有的DX11游戏时都能有相当不俗的性能,以现有HD5000的曲面细分运算能力,是完全足以胜任今后较长一段时间内DX11游戏的需要。GTX480/470虽然拥有N倍于HD5000的曲面细分运算能力,但除了能够在为数不多的几款Demo当中蹂躏A卡外,似乎并没有其它用途。等到未来游戏真正需要更强的曲面细分性能时,当今的顶级显卡可能几百块钱都处理不掉了,未来的游戏同样需要更强的浮点运算能力,更均衡的纹理、光栅、几何性能,而不是片面注重某一特定技术的性能。

    至于DX11之争,就告一段落了,大家应该可以发现GTX400的性能不如预期,根本没有NVIDIA宣称的那么好。那么在功能方面双方孰优孰劣呢?

第四页:NVIDIA CUDA的优势正在消失,ATI Stream紧追不舍

    不可否认,NVIDIA在GPU通用计算方面做的很不错。虽然GPU通用计算最初是由ATI发起的,但却在NVIDIA手里被发扬光大,CUDA平台拥有众多的应用程序,而且还在持续不断的增多。

 Radeon HD5000

    AMD在收购ATI之后,由于人力和资源整合的关系,曾一度中断了GPU通用计算的研发。不过近年来,AMD在产品方面走出低谷,凭借HD4000和HD5000系列打了一场漂亮的翻身仗之后,逐渐加大了对Stream平台的合作与研发力度,支持Stream的GPU通用计算软件与日俱增。

 Radeon HD5000

    比如目前知名度最高的蛋白质折叠分布式计算软件、视频转码软件、DVD倍线高清软件、2D视频转3D立体软件,这些A卡都可以支持,ATI甚至在驱动程序当中就集成了视频转码选项和工具。

 Radeon HD5000

ATI驱动控制面板当中整合了视频转码器

 Radeon HD5000

MediaShow同时支持CUDA和Stream视频转码加速

 Radeon HD5000

TotalMedia Theatre 3同时支持CUDA和Stream视频倍线技术

 Radeon HD5000

PowerDVD 10同时支持CUDA和Stream将普通视频转为3D立体格式

 

    此外,还有一些视频编辑/编码软件都能够支持Stream加速技术,基本上知名的商业软件都能够同时支持CUDA和Stream加速,无论从速度还是效果来看Stream并不输给CUDA。可以说在GPU通用计算方面,NVIDIA的压倒性优势已经不复存在了,而且优势正在逐渐消失。

OpenCL和DirectCompute,为GPU通用计算提供无差别支持

    不管怎么说,CUDA相比Stream还是占据上风的,但随着DX11时代的来临,GPU通用计算的历史都将会被改写,因为两种新的API已经崭露头角,并得到了业界的一致认可,它们就是OpenCL和DirectCompute:

    1. OpenCL类似于OpenGL,是由整个业界共同制定的开放式标准,能够对硬件底层直接进行操作,相对来说比较灵活,也很强大,但开发难度较高;

    2. DirectCompute类似于DirectX,是由微软主导的通用计算API,与Windows集成并偏向于游戏和消费领域,在易用性和兼容性方面做得更出色一些;

    3. CUDA和Stream更像是图形架构或并行计算架构,NVIDIA和ATI对自己的GPU架构自然最了解,因此会提供相应的驱动、开发包甚至是现成的应用程序,通过半开放的形式授权给程序员使用。

 Radeon HD5000

    就如同GPU能同时支持DirectX与OpenGL那样,NVIDIA和AMD对DirectCompute和OpenCL都提供了无差别支持,真正的GPU通用计算之战,不在CUDA与Stream之间,而是OpenCL与DirectCompute之争,DX11时代才刚刚开始……

    也就是说,未来不管在3D游戏领域,还是在消费级通用计算类软件市场,CUDA和Stream的影响力都将会逐渐减弱,慢慢地被OpenCL和DirectCompute所取代。此时就不会再出现“NVIDIA和ATI对GPU通用计算谁支持更好”的问题,而是在执行GPU加速应用的时候,谁的性能更好?此时GPU硬件方面的架构和运算能力将成为关键!

第五页:PhysX江河日下!开放式物理加速更受欢迎

    在HD5000系列发布之前,最让AMD感受到压力的,不是NVIDIA的什么显卡产品,而是PhysX技术。由于不支持GPU物理加速的原因,A卡在PhysX游戏中的表现惨不忍睹,低端N卡都可以秒杀高端A卡,这让AMD感到很没面子。

 Radeon HD5000

大多数PhysX游戏都是虚幻3引擎的DX9游戏

    不过,此一时彼一时,支持PhysX的游戏毕竟是少数,自去年底《蝙蝠侠》之后就鲜有支持PhysX的游戏大作发布。尤其是当今所有的DX11游戏和Benchmark,居然没有任何一款可以支持PhysX,就连NVIDIA的The Way游戏《地铁2033》虽然使用了PhysX引擎,但并不支持GPU物理加速,N卡在该游戏中并没有多少优势。所以大家应该可以看到近期NVIDIA方面显得比较低调,并没有大肆宣传PhysX技术,因为确实没有什么可以拿得出手的游戏。

 Radeon HD5000

《孤岛危机》当中惊人的爆炸效果,是CPU软加速

    是什么导致PhysX出现了游戏荒呢?原来是封闭式的PhysX引擎遇到了瓶颈,此前绝大多数PhysX游戏都使用的是虚幻3引擎,为DX9C API,如果游戏开发商有意愿的话,可以支持PhysX GPU加速。但时代在发展,虚幻3引擎已逐渐落伍,Ageia时代的老PhysX引擎在效果方面也不尽如人意,很多游戏开发商自行研发的物理效果都非常出色,使用CPU软加速的Havok引擎也丝毫不逊于PhysX,不思进取的NVIDIA遭遇了不小的压力。

 Radeon HD5000

Radeon HD5000  

通过曲面细分技术也能实现水面和布料的物理效果

    到了DX11时代,DX11 API当中的两项关键技术——Tessellation和DirectCompute,都可以用来模拟部分物理效果,这样游戏开发商就没必要去自行研发物理引擎、或者去购买第三方物理引擎授权了,可以轻而易举的实现部分逼真的物理特效。如此一来,封闭的PhysX遭受冷落就不足为奇了。

    NVIDIA固步自封的做法导致PhysX物理引擎产生很多局限性,尤其是为了片面强调GPU物理加速的优势,去刻意弱化CPU软加速的性能表现,导致NVIDIA与AMD和Intel之间发生口水战。不管它们的真相到底如何,实际情况是即便不使用PhysX引擎,其它物理引擎使用CPU加速也能生成相当不错的物理效果。

    目前GPU在游戏中的负载很重,单显卡同时负责3D渲染和物理加速的话,即便旗舰级显卡也会有很大幅度的性能损失。而在游戏中多核CPU大部分时间都处在空闲状态,此时如果让CPU进行物理加速的话,电脑整体负载显然要更平衡一些。但NVIDIA绝对不会这样做的,因为NVIDIA只有GPU。而Intel在收购Havok之后也迟迟不肯开放GPU物理加速,只侧重于CPU软件速,因为Intel没有独立显卡。

    所以AMD要做的就是寻求第三方物理引擎的支持,于是在AMD的资助下,Pixelux将把PC平台上的DMM2引擎向游戏开发商免费发放,不收取任何授权费用,并包含最新高级版本的所有特性,当然其中包括GPU加速。AMD着重指出,以上谈到的所有Bullet引擎功能都可以在任何支持OpenCL或DirectCompute的硬件平台上运行。在AMD平台上,将使用ATI Stream技术予以实现。另外,AMD还已经开发出了实现Bullet引擎中光滑粒子流体力学(SPH)和柔性物体/布料模拟的GPU并行计算加速算法,近期将把该算法在OpenCL和DirectCompute中的实现代码以开源形式公开。

 AMD

    只有AMD会毫不偏袒的同时支持CPU和GPU物理加速,因为AMD同时拥有CPU和GPU两条产品线。AMD也特别愿意推广开放的、免费式物理引擎,事实上近几年来AMD在对待各种图形相关功能和技术时都是这么做的。现在这款名叫Bullet的跨平台开源物理引擎已经有《星球大战:原力释放》游戏所使用,Trinigy的Vision Engine游戏引擎也能支持,代表游戏是《工人物语7:王国之路》,相信未来会有更多的游戏开发商加入开源的阵营。

第六页:3D立体不是N卡的专利!A卡如今也支持

    NVIDIA还是有前瞻性的,一年前就发布了3D Vision立体显示技术,通过驱动底层的改造,让几乎所有的游戏大作能够支持立体显示,兼容性和显示效果都不错。但很可惜,即便像NVIDIA这样的图形显示巨头,在推广3D Vision时也遇到了重重困难:3D眼镜售价过高,120Hz显示器数量有限而且分辨率太低,难入高端玩家法眼。因此3D Vision技术在过去一年内的表现并不乐观,更多的人选择了观望。

    AMD方面则比较务实,AMD独立软件开发商公关主管Neal Robison在接受采访时表示:“我认为图形技术现在已经足够强大,可以带来非同凡响的3D体验。最大的问题是,在眼镜还是必需条件的情况下是否会有广阔的市场吸引力?主动快闪式眼镜100多美元的价格是否会让人们退避三舍?

 Radeon HD5000

催化剂10.3就能支持立体显示了

    终于,到了今年,在《阿凡达》3D电影取得巨大成功的带动下,整个IT产业都对立体显示产生了浓厚的兴趣,各种3D显示技术如雨后春笋般出现。AMD认为时机已经成熟,于是联合第三方合作伙伴共同推出了开放式的3D解决方案,目前AMD的催化剂驱动程序当中已经能够支持多种3D显示方案。

    Neal Robison说:“我们已经开发了四缓冲技术来支持立体3D游戏,所以第三方中间件开发商可以在120Hz刷新率下输出立体L/R图像。在三月份的GDC 2010游戏开发者大会上,我们还宣布了自己的开放式立体3D项目,期待与产业合作伙伴携手,在整个业界的参与下共同鼓励合作和标准开发,最终为用户提供更多的硬件和软件选择。”

 Radeon HD5000

蓝宝展示AMD的3D显示结合Eyefinity,三屏3D不再是NVIDIA的专利

 Radeon HD5000

微星一体机采用了AMD 3D显示解决方案

    NVIDIA 3D Vision立体幻镜技术已经赢得了广泛关注,不过高昂的价格使更多人都还在观望,而且它是一套封闭的系统,AMD则继续一贯的开放式态度,找上了制定蓝光3D规范的蓝光协会,并在争取更多业界合作伙伴。前不久微星发布的业界首款3D一体机就采用了AMD的3D解决方案,微星高层称AMD完全开放的策略是它们选择AMD放弃3D Vision最主要的原因。

    现在,N卡的又一项优势被攻克,A卡如今也能支持3D立体显示技术,显示效果丝毫不差于3D Vision,而且实现成本要更低一些。

第七页:Eyefinity技术大受欢迎,NVIDIA东施效颦

    Radeon HD5000系列除了DX11和低功耗低发热两大优势外,Eyefinity宽域多屏显示也是一非常诱人的技术,三屏幕环绕输出是游戏玩家梦寐以求的配置,超广的视野和震撼的显示效果让人欲罢不能。此前玩家只能通过购买价值不菲的Matrox 3D环幕仪来实现,现如今ATI单显卡就能支持,而且分辨率更高!

 Radeon HD5000

通过Eyefinity宽域技术玩极品飞车,超广的视野看起来非常爽

 Radeon HD5000

通过Eyefinity宽域技术玩英雄连,获得超宽的显示面积

    Eyefinity宽域技术是将多个显示器通过驱动模拟成为一个超大分辨率的单一显示器,该技术能够欺骗包括Windows在内的几乎所有软件和游戏,因此绝大多数支持宽屏显示的游戏都能够获得超大超宽的显示效果,而不用担心兼容性问题。

 Radeon HD5000

HD5000提供了丰富的输出接口,可以支持多种类型的显示器

    ATI HD5000系列GPU内建了多个TMDS数字显示通道,最多能够支持六屏显示,在主流显卡上也提供了至少三屏显示,为发烧游戏玩家提供了免费的多屏输出支持。

 Radeon HD5000

NVIDIA的三屏必须通过双卡SLI模式支持

    在看到HD5000系列的Eyefinity技术如此大受欢迎之后,NVIDIA不甘寂寞,也发布了三屏幕解决方案。但可惜的是,GTX400在GPU硬件设计上依然只能支持双屏输出,为了实现三屏必须使用两片显卡,以SLI模式,透过驱动模拟实现。

    如果双卡SLI真能支持三屏的话,对于不计成本的高端玩家来说,未尝不是一种较好的解决方案。但遗憾的是,GTX480发布至今已经有三个多月了,NVIDIA的三屏驱动都还没正式发布,唯一的一个内测版驱动还很不稳定,作为三屏演示时都经常出现蓝屏死机的问题,更别说让玩家长期玩游戏了。

 Radeon HD5000

HD5000单卡最多可支持五屏甚至六屏,N卡怎么办?

    NVIDIA声称SLI双卡可以获得更强的3D性能,从而得以在三屏模式下流畅运行游戏,实则是无奈之举,硬件不行就通过软件来弥补,这个驱动由于问题很多还拿不出手,大家都被忽悠了。而AMD的多卡互联则没有任何问题,通过CossFire X技术可以让Eyefinity扩充至十几个屏幕甚至而是多个屏幕,让N卡无地自容!

第八页:总结:AMD全方位发展HD5000最值得选购

    综合来看,GTX400系列显卡的发布,不仅没有帮助NVIDIA夺回性能之王的宝座、挽回败局,反而起到了绿叶衬红花的效果,进一步突出了AMD HD5000系列功耗、发热、噪音低,DX11性能出色,Eyefinity三屏效果出众……等诸多功能和特性。

 Radeon HD5000

HD5000:功耗低、性能强、价格合理、功能全面

    NVIDIA特立独行、骄傲自大的做法终于在世代交替之际吃了大亏,层出不群的马甲产品也让用户恼火不已。高端产品性能不济、中低端产品青黄不接,附加功能和技术又发展放缓,只能依靠营销手段来误导大众,清理库存。

    反观AMD,卧薪尝胆多年之后,带来的是一款款令人垂涎三尺的产品:不仅拥有超强的性能,而且良率、功耗、成本控制非常出色,新加入的Eyefinity宽域显示技术、次世代音频源码输出技术都很得人心,而且在GPU通用计算、3D立体显示、物理加速方面也取得了突破性进展,使得NVIDIA以往的优势都不复存在。

 Radeon HD5000

    双方此消彼长的结果,就是AMD大举收复失地,市场端的表现证明了一切。在双方显卡的性能差不多的情况下,仅靠一两个特殊的附加功能或技术是无法左右消费者的选择,只有各个方面均衡、全面的发展,积少成多、量变引起质变,才能博得用户的青睐。

    很显然,低功耗、低发热、低噪音、高性能、支持三屏、源码输出、3D立体、通用计算的HD5000系列,才是当前市场最完美的选择,而且AMD从上至下拥有丰富完整的HD5000产品线,用户在各个价位的都能找到适合自己的选择。

 

网友评论

写评论

相关推荐