【PConline 应用】距GTX980/970的首发已经过去一个多星期了,相信许多朋友通过我们的文章对他们已经有了一定程度的了解,但是在关注产品硬件方面特性的同时,我们也不能忽略其在软件方面的改进,今天我们就来重新梳理一下旗舰级Maxwell搭载的新技术。
GTX980/970 Maxwell架构回顾
如果说年初GTX750系列的发布是Maxwell的预演的话,那今天GTX980的横空出世就是Maxwell展现真正实力的时候了。
这次发布的Maxwell架构代号为GM204,按照上一代Kepler架构的传统,GM204是Maxwell属于次高端的架构,但是由于性能在目前顶级显卡对比中处于优势,所以NVIDIA维持GTX680的做法,将GM204打扮成GTX980作为新一代高端产品线出现。而Maxwell的完全体GM210,要等到下一年的产品线更新中才露面。
GTX980采用的是完整的GM204架构,该架构内置52亿个晶体管、16组SMM,1个SMM相当于4个SMX(控制逻辑单元),每个控制逻辑单元内置32个CUDA核心,总共2048个CUDA核心。这个数字低于发布前的预期,同时远远少于GK110的2880个,可见NVIDIA对其工作效率上的信心。

从一个单位的控制逻辑单元控制192个CUDA核心减少到32个CUDA核心,避免了Kelpler时代因控制逻辑单元太少以至造成CUDA冗余的情况,让CUDA的工作效率更加高,将CUDA核心充分调动起来,有助多任务下效率的提升。根据NVIDIA的官方说法,就是Maxwell每一个CUDA核心所贡献的性能是之前开普勒135%,也就是说提升了35%,那每一瓦这样的功耗所提供的性能,是之前开普勒的两倍。
硬件大幅的提升究竟能催生出什么样的软件黑科技呢?让我们继续往下看。
黑科技1—MFAA(多帧采样抗锯齿)
革新程度:★★☆☆☆
实用程度:★★★☆☆
黑科技程度:★★☆☆☆
抗锯齿技术作为影响游戏体验的一个重要因素,NV其实以前已经推出了很多种,MFAA其实就是在MSAA基础上进行二次改进的产物,但在画质上并没有提升,反而是在保证画质的同时降低了对硬件的需求。
通俗来讲,MFAA就是一个多帧数动态采样的抗锯齿技术。如上图,在第n-1帧的画面中进行采样,然后在第n帧的画面进行采样,将两个帧的画面进行临时过滤处理,再进行4倍放大,形成更细腻的画面。
因为采用了多帧采样的技术,所以变相的结果就是显卡核心在每一帧的运算量有所下降,整体流畅度有所提升,幅度能达到接近30%。但整合之后的显示效果与同等倍率的MSAA没有什么差别。
小编点评:MFAA基本可以看作MSAA的“偷懒版”,在保证画质不变的情况下提高了性能,也算是降低了开抗锯齿的门槛吧,但由于它是从两个帧中分别采样的,不知道在低帧率下是否会受到一定的影响。
黑科技2—DSR(动态超级分辨率)
革新程度:★★★★☆
实用程度:★★★☆☆
黑科技程度:★★★★☆
让1080P体验4K的显示效果,没错,这就是DSR技术的宣传口号。DSR,全称Dynamic Super Resolution,中文意思是动态超级分辨率,那么究竟它是怎么实现,又能达到什么样的效果呢?请继续往下看。
1080p模拟4k分辨率?听起来很有趣,毕竟像素点数目差那么多,怎么可能实现4k画质呢?
两张渲染的原理图已经很仔细的说明了DSR技术的细节,简单点说就是在渲染的环节用4K的采样点来代替1080p来渲染一次,再用1080p的分辨率来模拟显示4K的渲染效果。可以明显看到对于某些形状比较细小的物体的显示效果有较大的提升。从动态图的对比中我们可以看到现实效果有较大的提升,尤其是草的顶端,不连贯感和锯齿都大幅减少。
目前在Geforce Experience中已经提供这种功能,如果游戏支持DSR技术,那么就会自动开启,感兴趣的玩家可以自行感受下是否真的那么神奇。
小编点评:从目前官方公布的显示效果来看,DSR技术对显示效果的提升还是相当出色的,画面的细腻度有一定幅度的提升。但毕竟实际要以4K分辨率进行渲染,所以估计对硬件需求是按照4K分辨率下的需求来计算的。应该只会对一些硬件性能足够,但是暂时没有升级4K显示器的玩家比较有用。
黑科技3—VR DIRECT(虚拟现实设备优化)
革新程度:★☆☆☆☆
实用程度:★★★★☆
黑科技程度:★★★★☆
故名思议,VR DIRECT技术就是为目前热门的VR(虚拟现实)设备所量身打造的技术,其包含许多技术我们并不陌生,但是最重要的技术还要数NV为降低VR设备的显示延迟所作出的努力。
其实游戏画面处理好后,再显示到屏幕上,是有一定时间的,但是都是用毫秒作为单位。标准的显示延时是50毫秒,游戏软件的5ms基本可以忽略,显示器的13ms如果没有新的LCD技术也很难提升,很明显主要的提升空间就在于系统环节(驱动)和GPU处理的环节。
通过外部驱动以及GPU内部处理的流程的优化,VR设备的延迟已经从50ms缩减到了36ms,这看上去已经优化到最好的结果了。但这时NV又为我们介绍了一种全新的技术——ASYNCHRONOUS WARP(异步扭曲技术),可以很明显的看到游戏和驱动的处理环节已经消失了,GPU的处理环节也分成了两部分,而且前面一部分还会进行提前处理,此时的延迟率已经比最开始少了足足一半,提升幅度不能说不大。

小编点评:既然是一项针对VR设备的技术,那么也就意味着想要体验这项技术的话也就必须拥有一套,但现在VR设备的售价并不便宜。而且因为要实现25ms的超小延迟,游戏和驱动就不能像以前那样独立分工,而是必须紧密的结合到一起,所以游戏的支持就显得不可缺少。
黑科技4—VXGI(全3D全局光照技术)
革新程度:★★★★☆
实用程度:★★★★☆
黑科技程度:★★★★☆
从NV官方的的效果图中我们可以看到,地面的光照机器逼真,而且窗帘上因为材质的不同,只有反光能力较强的图案才有反射光的痕迹。而且我们可以看到最下部的地面上还有第二次反射出的窗帘的颜色,整体来说就是以假乱真。
那么,VXGI是怎样工作的呢?就有了下面的三部曲。
首先,对3D模型的原始网格线进行分析,然后计算出3D模型中不透明的部分,综合运算结果,将图形进行放大化,为下一步的渲染做准备。
第二步,进行光束射入的时候反射分析,通过不透明度的运算,从而计算出一个反射光的渲染方式。由于每个像素的反射情况不同,加上每帧数的动态效果都不尽相同,自然这个运算量是庞大的。
第三步,最后的追踪成像,将圆柱体分割成每一个可视的表面,然后进行网格化,根据光线的反射规律来堆积光照与透明效果,然后根据3D引擎进行渲染。

上图就是支持VXGI与不支持VXGI的效果对比。观察上图第三个效果,在精细VXGI处理后的反射表面,显得十分的真实。而粗略VXGI处理的已经有一定的光照效果,但是透明效果缺失,而且光照效果略感生硬。而没有进行VXGI处理的,就犹如一张画纸,没有任何立体感。
上图就是NV还原人类第一次登月而做出的DEMO,采用的自然是VGXI技术,两者的差别已经很小。其实左边的就是通过GPU渲染之后得到的画面,考虑到建模和真实的环境始终有一定的差别,这样的显示效果绝对可以称得上以假乱真了。
小编点评:这样逼真的画面也不是没有代价的,NV官方就已经说明,登月DEMO的流畅运行必须要借助两张GTX980合力才能完成。不过相信一众游戏厂商肯定会通过各种方法来让这个技术走向实用。
总结:光有硬件或者光有软件都不可能获得最佳的体验,只有真正的软硬结合才能发挥出最大的威力。这也就不难理解为何NV会在发布了GTX980/970这样的性能级产品之后,忙着推出如此之多的新技术了。其实本质就是硬件性能的再一次大幅度升级之后,厂商进一步提升画质的尝试,而且NV还专门开发了如VR DIRECT的技术,相信很快我们回来一个极度真实的虚拟世界。