下载

“百核加速”?CPU+独显实战异构计算

芝麻 2011-10-21 17:46:01
CPU内存硬盘应用
1前言:异构计算非APU独有回顶部

  【PConline 横评】AMD在推出APU之后,除了宣传其内置的高性能GPU外,还有一个“百核加速”的概念让大家印象很深。何谓“百核加速”?其实就是宣称APU内置的GPU能支持“异构计算”,实现对部分软件的加速,使CPU与GPU协同运算,提升电脑的运算效率。

   虽然GPU的“异构计算”很美好,也反映了未来发展方向,但理想与总是有的差距。在异构计算还仅仅停留在起步阶段的今天,“异构计算”是否有实用价值呢?它仅仅是APU独有的技术吗?今天我们一起来探讨一下。

CPU 独显实战异构计算

   首先,我们不能进入一个误区,AMD宣称的“百核加速”并非APU独有,现在任何一张主流的NVIDIA或AMD独立显卡都可以实现所谓的“百核加速”。因为主流的AMD或NVIDIA的显卡都支持“异构计算”,利用GPU来完成CPU的工作,但是由于GPU能做的事情相当少,所以异构计算应用目前还很少。

异构计算

  换句话说,AMD用“百核加速”来宣传APU,有点夸大其能力,下面我们通过CPU+独显与APU进行所谓的“百核加速”测试。评测还是基于价格相近的原则,CPU选择了Pentium G840,独显为GT430,APU选择了A6-3650和A8-3850作为其主力和最强的代表。

Intel高性能奔腾,Pentium G840:

Intel奔腾G840
Intel Pentium G840  图片  系列  评测  论坛  报价  网购实价

  Pentium G840系出名门,拥有Sandy Birdge微架构的先天优势,CPU效能更高。其CPU部分采用原生双核设计,默认主频为2.8GHz;核芯显卡为HD Graphics,具备6个EU处理单元,默认频率850MHz,最高可睿频至1.1GHz(GPU部分支持睿频,CPU部分不支持)。CPU和核心显卡共享3MB缓存,官方支持DDR3-1333内存。

AMD主力APU,AMD A6-3650:

AMD A6-3650
AMD A6-3650  图片  系列  评测  论坛  报价  网购实价

  AMD A6-3650是APU中的主力型号之一,CPU部分采用原生四核设计,本质上仍是K10微架构,主频为2.6GHz,不支持Turbo Core技术,每个核心拥有1MB二级缓存。GPU部分型号为Radeon HD 6530D,具备320个流处理单元,频率为443MHz。四核CPU性能加上独显核心GPU是其主要的卖点。

AMD最强APU,AMD A8-3850:

21
AMD A8-3850  图片  系列  评测  论坛  报价  网购实价

  AMD A8-3850为旗舰型号,CPU部分采用原生四核设计,基于Husky微架构(K10的改进版),默认主频为2.9GHz,每个核心拥有1MB二级缓存;GPU为Radeon HD 6550D,具备400个流处理单元,默认频率为600MHz。它的特点是四核CPU加上最强集成显卡。

CPU
Pentium G840 A6-3650 A8-3850
CPU微架构
Sandy Bridge Husky Husky
核心/线程 2/2 4/4 4/4
制作工艺 32nm 32nm 32nm
CPU频率 2.8GHz 2.6GHz 2.9GHz
内置GPU HD Graphics HD 6530D HD 6550D
GPU处理单元 6EU 320SP 400SP
GPU频率 850MHz 443MHz 600MHz
L2缓存 256KB x 2 1MB x 4 1MB x 4
L3缓存 3MB n/a n/a
TDP热设计功耗 65W 100W 100W
接口 LGA 1155 FM1 FM1
支持内存(最高频率) 双通道 DDR3-1333 双通道 DDR3-1866 双通道 DDR3-1866
参加价格 560元 799元 999元

  由于异构计算的实际应用十分有限,并且普遍的测试中有种偷换概念之嫌,例如一些软件中采用GPU加速支持(如OpenGL加速)后就会被说成异构的支持。我们认为理想化的异构计算是CPU与GPU在处理单个程序时均能实现最高工作能力下实现最快的完成速度,而不是将CPU闲置、GPU工作。

-----------------------------------------------------------------------------

  Intel核芯显卡是否支持异构计算?

  目前Sandy Bridge系列处理器内置的核芯显卡不支持异构计算加速,不过由于支持该技术的应用还相当少。如果确实是要用到这少部门应用,例如编程,可以添加一片主流独显。

-----------------------------------------------------------------------------

2罗马城非一天建成:异构计算现状回顶部

2、罗马城非一天建成:异构计算现状

  很久之前,就一直有这样的言论“CPU性能过剩、GPU协助电脑加速”,事实上随着软件的发展,主流CPU性能远没过剩,而GPU帮助CPU加速的应用仍相当少。到现在,CPU以及GPU仍做回“老本行”,譬如GPU不可能处理操作系统、应用软件的运行,CPU图形性能差等。

GPU异构计算为什么发展缓慢?

异构

  GPU异构计算前景是美好的,但是为什么一直没有实现?根本的原因就是软件系统的编译技术无法突破单方面为CPU设计的逻辑代码的接口,简单来说就是GPU“看不懂”软件系统的代码,只有通过CPU才能胜任。当然,如果GPU也是x86架构,那么一切都迎刃而解了。当然,事情并不会那么简单。

异构
异构的核心就是将GPU胜任CPU的工作,

  这是一个很简单的道理,CPU的本职工作就是运算,而GPU的本职工作是图形渲染。那么有没有一个应用程序接口来兼任两者的处理工作?实际上,很很多接口,比如NVIDIA的CUDA、AMD的Stream等,最开放的当属OpenCL接口。

异构

异构
早就数年前两大显卡厂商已提出通用运算的实践

  NVIDIA的CUDA、AMD的Stream实现软件的加速,这些都属于异构计算,我们不难看出,反正AMD的Stream已经是利用显卡GPU(GPU有数百核心)来进行软件加速的,那么还在APU还要大力宣传“百核加速”呢?呵呵,当然因为Intel的核芯显卡不支持嘛。

异构
真正支持异构计算的软件还少之又少

   其实,支持异构计算的软件足够多的话,那么必定所有的GPU都为受益者,而不仅仅是APU。无论是专注硬件技术的玩家,还是普通的消费者,他们都不会对仅仅限于理论层面的技术有兴趣,那是专业研发人员的事情。

  现在的现状是,所谓的“百核加速”,还不如一个高性能CPU来得实在。

3独显更牛!CPU+独显与APU实战异构计算回顶部

3、评测平台介绍及方法说明

AMD FM1(APU)平台
CPU
AMD A6-3650(4核/4线程)
AMD A6-3850
主板
华硕 F1A75-M PRO(A75)
内存 宇瞻 DDR3-1600 2G x 2(8-8-8-24)
硬盘
日立 1TB
显卡
Radeon HD 6530D(A6内置)
Radeon HD 6550D(A8内置)

Intel LGA1155平台
CPU
Intel Pentium G840(2核/2线程)
主板
华硕 P8H61-M PRO(H61)
内存 宇瞻 DDR3-1333 2G x 2(8-8-8-24)
硬盘
日立 1TB
显卡
影驰 GT430 512MB(810/3100MHz)

软件平台
操作系统
Windows 7 Ultimate X64 SP1
驱动程序
显卡:
AMD Catalyst 11.9
NIVIDIA ForceWare 280.26
评测软件 理论测试:
Fritz Chess
PCMark 7
应用测试:
PhotoShop CS5 64bit
WinRAR 4.00 64bit
CineBench R11.5
3D理论+游戏测试:
3DMark 11
Dirt3
魔兽世界:大地的裂变

  由于真正的异构计算的应用十分有限,除了HC Benchmark,其他一些支持GPU加速的应用,我们也只能通过同一价位下的APU平台、CPU+独显平台来进行GPU加速,看谁的加速性能更加强大。所以这次测试还是有比较大的局限性,但是也从侧面反映了异构运算的利用还是停留在理论阶段。

  由于这种GPU的加速在软件中以体验居多,所以在今天测试中我们以体验以及测试来进行双重介绍。

4、CPU+独显与APU实战异构计算

异构计算测试软件:HC Benchmark

  HC Benchmark是中国计量科学院制作的评测软件,根据介绍,HC Benchmar最大的特点就是可以智能的分配某一任务,适合CPU做的运算由CPU执行,而适合GPU的运算由GPU完成,并不是简单的均摊任务,所以效能非常高。

HC Benchmark

异构
CPU与GPU占用图示,CPU在空闲?

  HC BenchMark的测试分为4个方面,主要是针对应用的测试。Office方面主要是模拟word和excel的一些常用操作。video方面是通过Alva HD引擎进行480P视频差值运算。Web测试主要是针对IE内核Javascript引擎执行效率进行评测。最后还包括3D的构图测试。

异构
注:奔腾+独显GT430的测试全程用CPU运算

  虽然软件的出身十分专业,但是在测试中还是有几个值得商榷的地方的。首先就是,为何NVIDIA的独立GPU不能参与异构计算?而AMD的却可以呢?恐怕是软件没有针对N卡优化吧。另外,加上A卡后,奔腾平台同样可以“异构计算”,性能比APU强得多呢。

IE9 Fish Tank体验测试

  IE9最大的亮点就是加入了GPU加速技术;在IE9浏览器中,微软利用GPU加速让硬件性能得到更好的释放,从而全面提升网络浏览速度,使高清视频更流畅、色彩更真实、图形更清晰。当然,前提是你网速够快。

异构
IE9

  此外,微软提供了一系列GPU加速的测试的应用(并没有提到CPU与GPU的异构或者并行,因为根据官网的介绍,图形和文本的渲染工作已经从CPU转移到了显卡)。其中鱼缸Fish Tank的测试是最著名的,1000条鱼同时出现在屏幕是对GPU一个很大的负担。

异构
在测试前需要开启“加速的图形”

  在测试中,我们在1920×1200的显示器中设置最大化,选取1000条鱼,在FPS稳定的情况下再进行读数。

异构
IE9 Fish Tank测试(越高越好)

  可以看出,奔腾G840+GT430独显的帧数领先APU平台,并且达到了60fps的上限。可见,即使是开启GPU的加速,还是以GPU性能更强的取得性能上的优势,微软已经说明了这是利用GPU加速来进行渲染的。

Office 2010体验测试

  微软在公布Office 2010硬件需求的时候曾经表示,图形芯片会有助于提高部分特性的性能,换言之就是支持来自GPU的硬件图形加速,可凭借显卡的计算能力提高程序运行效率,比如PowerPoint动画、Excel复杂表格、Word插入图片等等。

异构
Office 2010

  要从Office 2010中得到效率之间的比较,从评测的角度上看,可以从进行工作时的CPU占用率来体现。

异构
Word 2010

  在Word 2010中,我们在一个新的文档中插入10张尺寸为2560×1600的图片,然后观察CPU的占用率,来比较各个平台对GPU加速的利用程度。CPU占用率越低代表GPU利用率越高,性能也越好。

异构 

  更强的GPU性能在渲染时的资源利用效率也更高,使得CPU占用率更低。整体上看,软件测试的GPU加速严格来说不算是异构计算,毕竟CPU还是存在空闲的,如果能够将CPU的资源也能调动起来,那么效率肯定能够进一步提升。

4PConline评测室总结回顶部

《暴风影音·锐》播放软件加速体验

  为了将异构计算实践化,AMD和暴风影音合作推出了《暴风影音·锐》加速版,并且带来了一项令人新奇的功能——动态视频美化。这项功能技术借助APU的异构计算性能,可对视频进行全局画质增强、拆分画质增强以及对比画质增强。通过使用该功能,暴风影音•锐加速版播放器的用户可对视频播放进行一键优化,将视频画面处理得更加清晰、平滑、炫丽,同时保证更为流畅的播放速度。

APU异构百核性能解析

APU异构百核性能解析

  这部分无法量化,而这款软件同样只支持APU和A卡,不支持N卡,N卡没法打开这个功能。这里的体验让人感到一种商业合作之嫌。当然,对于资深视频用户,会选择Potplayer、Kmplayer之类的更专业播放器,自己调节同样可以实现一些GPU的视频加速特效。

4、PConline评测室总结

异构计算软件少,CPU+独显比APU强:

异构
 

  本次的软件测试都是加入了GPU加速,有一些是用OpenGL接口实现,例如著名的图形处理软件Photoshop通过OpenGL接口实现,但也只是一小部分功能支持而已。总的来说支持软件少,APU的异构计算效率不如独显。

“百核加速”?哪里来的百核?

AMD A系列
百核加速?

  所谓的“百核加速”,实际上是AMD提出的融合Radeon HD显卡的流处理单元的个数,加上CPU核心数而来,因为GPU流处理单元高达数百个,而不是当今民用领域还没有实现的CPU的百核。本质上,这算是一种宣传手段而已,实际上支持GPU加速的应用非常少,CPU性能仍是主导,作为一个CPU,直接决定整机性能,抛开CPU性能不谈而去追求少之又少的GPU加速应用?

A卡
千核加速?

  假如一个流处理单元都能叫做核的话,那么玩家手中的HD6870显卡就能叫做千核了,NVIDIA显卡也有数百核呢。当然,由于NVIDIA以及AMD显卡之间统一渲染架构的实现原理不同,不能单看流处理器数目。

CPU性能仍是主导,GPU目前性能还只是游戏:

异构

  CPU依然是电脑的大脑,任何软件、游戏CPU都要参与其中,CPU性能如何决定了整机性能的基本水平。更先进的指令集、更先进的微架构,才能为用户带来实实在在的性能变化。Intel Sandy Bridge微架构衍生出来的Core i系列、新奔腾以及新赛扬为何受用户高端好评?就是因为其性能好、功耗低,用户能直接感受到。

  GPU对于一般用户的作用,除了一般的显示功能,还有就是3D游戏了,不过要玩爽3D游戏,建议选择500元以上的独显,比任何集显都要强得多,之前我们的评测也验证了。

总之,异构计算目前对一般用户帮助很小:

 

异构
支持异构计算的软件很少,目前别被这个忽悠了

  业界普遍承认,异构计算的真正大规模利用还不是现在,AMD以这个异构计算作为卖点,目前确实意义不大,大家别被“百核加速”忽悠了。但是AMD和NVIDIA等厂商提出GPU异构计算,这确实是未来发展的一种趋势。历史告诉我们,那是N年之前的事情了。

打开太平洋知科技,阅读体验更佳
前往太平洋知科技APP查看原文,阅读体验更佳
继续评论
前往APP
制作海报

产品概览

网友评论

写评论
APP内评论,得金币,兑好礼

相关推荐