----------------------------------------------------------------------------
本文更新历史
10月2日:更新A10-5800K CPU性能、通用计算性能及功耗测试。点击查看
9月27日:第一版发布,GPU性能揭秘。点击查看
----------------------------------------------------------------------------
【PConline 评测】APU是AMD处理器的发展重心,自从去年6月份推出以来便受到广泛关注;而今年10月2日,AMD将发布新一代APU(俗称“二代APU”,代号Trinity),CPU单元引入模块化“打桩机”架构,GPU单元也升级到HD 7000D系列。作为未来AMD对抗Intel的主流产品,大家都对二代APU充满期待。如今,新一代APU终于如约上市,我们在此为大家送上最强二代APU、A10-5800K的详细对比测试。

●二代APU带来哪些改变?
二代APU与一代产品相比无论CPU还是GPU架构都发生了明显的变化,其中CPU改为模块化设计的打桩机核心,GPU则从VLIW5升级到VLIW4体系(详情可查看文章延伸阅读部分);在功能方面,新一代APU支持Turbo Core 3.0、支持单主板三联屏、新增高清媒体加速器。

●APU A10?看二代APU的产品线
二代APU家族分为A4/A6/A8/A10四种型号,APU A10定位旗舰级,比A8要高,首批上市的型号有不锁倍频版的A10-5800K和锁定倍频的A10-5700。后者的CPU和GPU频率都比前者要低,热设计功耗为65W。

| “打桩机”架构第二代APU处理器参数对比 | ||||||
| 型号 | CPU 频率 | 二级 缓存 | 内置 GPU | GPU 频率 | 流处理器 | TDP |
| 3.8-4.2 GHz | 4MB | 7660D | 800MHz | 384 | 100W | |
| 3.4-4.0 GHz | 4MB | 7660D | 760MHz | 384 | 65W | |
| 3.6-3.9 GHz | 4MB | 7560D | 760MHz | 256 | 100W | |
| 3.2-3.7 GHz | 4MB | 7560D | 760MHz | 256 | 65W | |
| 3.6-3.8 GHz | 1MB | 7540D | 760MHz | 192 | 65W | |
| A4-5300 | 3.4-3.6 GHz | 1MB | 7480D | 723MHz | 128 | 65W |
●二代APU带来新的FM2接口
二代APU的接口由FM1升级到了FM2,两者互不相容。但以后的APU产品(三代、四代?)都会兼容FM2,这也就意味着,FM2接口周期寿命会比FM1长得多,可能像经典的AMx接口一样延续好几年,方便用户升级。

FM1与FM2接口的缺口位置不同
主板方面,AMD新推出了A85X芯片组,规格比之前的A75/A55更高。而A75/A55芯片组搭配FM2接口后,也能支持新一代APU,所以在新旧交替阶段,A55/A75会存在着FM1、FM2两种接口,大家在选购时要注意区分。
●新一代APU旗舰:APU A10-5800K
A10-5800K是新一代APU旗舰型号,定位比APU A8要高,主频3.8GHz,可以Turbo到4.2GHz,融合的GPU为HD7660D,虽然不是期待中的GCN架构,但性能依旧强悍
| 前后两代APU旗舰型号对比 | ||
| CPU型号 | A10-5800K | A8-3870K |
| CPU微架构 | Piledriver | Husky |
| 处理器接口 | FM2 | FM1 |
| 核心数/线程数 | 4/4 | 4/4 |
| 制作工艺 | 32nm | 32nm |
| Turbo Core | 3.0 | 不支持 |
| CPU频率 | 3.8-4.2GHz | 3.0GHz |
| GPU/核显 | HD 7660D | HD 6550D |
| GPU架构 | VLIW4 | VLIW5 |
| 流处理器 | 384 | 400 |
| GPU频率 | 800MHz | 600MHz |
| L2缓存 | 2M x2 | 1M x4 |
| 支持内存 | DDR3-1866 | DDR3-1866 |
| TDP热设计功耗 | 100W | 100W |
●二代APU的亮点在哪?性能如何?

新一代APU新增了不少指令集
新一代APU的亮点在于GPU部分的性能提升,可以用“暴涨”来形容;CPU部分支持Turbo Core 3.0,最大Turbo到4.2G,但TDP热设计功耗保持不变;此外还有许多细节方面的改进,例如支持高清视频加速(解码、编码)等等,这些我们都将在接下来的评测中详细介绍。>>
-----------------------------------------------------------------------------------
PConline为您准备了全方位的新一代APU系列报道:
----------------------------------------------------------------------------------
针对网友提出的疑问及观点,我们将在这里集中解答
1、69楼网友提出的疑问:这次的二代APU能不能和独显交火?
PConline编辑回复:可以交火,但是和一代APU一样,最高只能支持到HD6670,交火后性能预计在HD6750和HD6770之间。
2、124楼网友提出的疑问:每个模块共享2M? 难道可以理解成2核4线程?实际上是个真物理4核,那两个模块,每个模块管理2个核心?还是1个模块管CPU,1个模块管GPU? amd不会出超线程的?
PConline编辑回复:AMD把每两个核心归类成一个模块,共享2M缓存,实际上还是四核结构。GPU模块是独立开的,和模块化结构关系不大。具体可以参考下面的结构图:

1、入门独显下岗:新一代APU GPU性能测试
| 硬件平台(FM2) | |
| CPU | AMD A10-5800K(2模块/4核) |
| 主板 | 技嘉 GA-F2A85X-UP4 |
| 内存 | 芝奇 DDR3-1600 4G x 4(8-8-8-24),双通道,划分1GB作为显存 |
| 硬盘 | 主盘:三星830固态硬盘(256GB) 副盘:西部数据 1TB 黑盘 |
| 显卡 | HD 7660D(384SP,800MHz) GT630(GDDR3,700/1066MHz) GT630(GDDR5,810/3200MHz) HD6570(GDDR3,650/1333MHz) HD6570(GDDR5,650/3600MHz) |
| 驱动 | AMD催化剂12.8 for win7 64bit |
| 硬件平台(FM1) | |
| CPU | AMD A8-3870K(4核/4线程,3.0GHz) |
| 主板 | 华硕 F1A75-V Pro |
| 内存 | 芝奇 DDR3-1600 4G x 4(8-8-8-24),双通道,划分1GB作为显存 |
| 硬盘 | 主盘:三星830固态硬盘(256GB) 副盘:西部数据 1TB 黑盘 |
| 显卡 | HD 6550D(400SP,600MHz) |
| 驱动 | AMD催化剂12.8 for win7 64bit |
| 硬件平台(LGA1155) | |
| CPU | Intel Core i5-3450(4核/4线程,3.1-3.5GHz) Intel Core i5-3570K(4核/4线程,3.4-3.8GHz) |
| 主板 | 华硕 P8Z77-V Deluxe |
| 内存 | 芝奇 DDR3-1600 4G x 4(8-8-8-24),双通道,划分1GB作为显存 |
| 硬盘 | 主盘:三星830固态硬盘(256GB) 副盘:西部数据 1TB 黑盘 |
| 显卡 | HD Graphics 2500(6EU,650-1150MHz) HD Graphics 4000(16EU,650-1050MHz) |
| 驱动 | Intel核芯显卡驱动v15.26.8.64.2696 |
A10-5800K采用了HD 7660D融合GPU,我们拿第一代APU的HD 6550D来进行对比。另外i5 3450、i5 3570K分别是Intel新一代HD Graphics 2500/4000的代表。为了能准确定位HD 7660D的性能,我们还加入了一些市面上在售的入门级独立显卡GT630和HD6570(HD6570为单显卡性能测试,不组建双交火)。
● DX10游戏理论性能:
| 3DMark Vantage 1.10 | |
| 软件简介 | 3DMark Vantage是一款基于DirectX 10的3D性能基准测试软件,主要包括了显卡测试和CPU测试两个部分。 |
| 软件设置 | Performance |
| 测试方法 | 只进行显卡测试,记录得分 |
| 软件截图 | ![]() |

3DMark Vantage测试成绩
●DX11游戏理论性能:
| 3DMark 11 1.02 | |
| 软件简介 | 3DMark 11是一款基于DirectX 11的3D性能基准测试软件,内置了三大测试项目:图形性能测试、物理性能测试和综合测试。 |
| 软件设置 | Performance |
| 测试方法 | 只进行图形性能测试,记录得分 |
| 软件截图 | ![]() |

3DMark 11测试成绩
测试小结:3DMark系列是大家熟知的测试工具,测试结果能比较完整地反映显卡的游戏性能。从测试结果来看,A10-5800K融合的HD 7660D GPU相比上一代旗舰HD 6550D有了明显的进步,得分提高25%-30%,完胜DDR3版本的GT630、HD6570,与DDR5版GT630独立显卡接近。下面我们将通过实际游戏测试进行检验。>>
●单机游戏:《街头霸王4》
| 单机游戏:街头霸王4 | |
| 游戏简介 | 作为格斗游戏代表作之一,《街头霸王》系列一直被玩家们所熟知,街霸四承袭系列作传统2D玩法,并加入3D绘图技术,使得画面效果大大提升 |
| 游戏设置 | 1440x900分辨率,关闭垂直同步,0AA,画面设置Model Quality和Particles为Mid,其余全部为High |
| 测试方法 | 使用自带Benchmark进行测试,记录平均帧数得分 |
| 游戏截图 | ![]() |

《街头霸王4》测试成绩
●单机游戏:《尘埃3》
| 单机游戏:尘埃3 | |
| 游戏简介 | 《尘埃3》保持了赛车游戏专业性强、模拟度高的风格,车身的精细程度大大强化,测试中不同级别的显卡可以拉开分数差距。 |
| 游戏设置 | 1440x900分辨率,关闭垂直同步,0AA,画面特效设置为中等画质 |
| 测试方法 | 使用自带Benchmark进行测试,记录平均帧数得分 |
| 游戏截图 | ![]() |

《尘埃3》测试成绩(HD Graphics 2500无法完成测试)
●网络游戏:《魔兽世界》
| 网络游戏:魔兽世界 | |
| 游戏简介 | 《魔兽世界》是最受欢迎的网络游戏,拥有巨大而完善的故事背景和庞大的历史架构的魔幻世界,各种设定更为广大玩家接受和推崇。 |
| 游戏设置 | 分辨率设置为1440x900,画质特效全部为优良。 |
| 测试方法 | 从祖达克的古达克所飞行点到希姆托加飞行点进行飞行,用Fraps记录平均帧数 |
| 游戏截图 | ![]() |

《魔兽世界:大地的裂变》测试成绩
●网络游戏:《英雄联盟LOL》
| 网络游戏:英雄联盟LOL | |
| 游戏简介 | 《英雄联盟》腾讯运营的英雄对战网游。由DOTA原班人马精心打造,将DOTA经典玩法从对战平台延伸到网络世界 |
| 游戏设置 | 分辨率设置为1920x1080,画质特效全部为高 |
| 测试方法 | 进入实战训练营(召唤师峡谷),点击“开始”,从自动镜头开始移动到停止移动、画面变暗,用Fraps记录这段时间的平均帧数 |
| 游戏截图 | ![]() |

《英雄联盟LOL》测试成绩
测试小结:除了在《街头霸王4》测试中,DDR5版本的GT630领先幅度较大之外,其余项目HD 7660D的得分超越同为DDR3显存的GT630、HD6570,逼近DDR5版本GT630。从这些测试中我们也可以看出,不同的显存对显卡的影响很大。新一代APU的出现将对现有的低端独立显卡造成不小的冲击。>>
2、全新模块化设计:新一代APU CPU性能测试
| AMD FM2平台(Llano) | |
| CPU | APU A10-5800K(2模块/4核) |
| 主板 | 技嘉 GA-F2A85X-UP4 |
| AMD FM1平台(Trinity) | |
| CPU | APU A8-3870K(4核/4线程) |
| 主板 | 华硕 F1A75-V Pro |
| Intel LGA1155平台(IVB) | |
| CPU | Intel Core i3 3220(2核/4线程) Intel Core i5 3450(4核/4线程) |
| 主板 | 华硕 P8Z77-V Deluxe |
| AMD AM3+平台(Bulldozer) | |
| CPU | AMD FX-4170(2模块/4核) AMD FX-6100(3模块/6核) |
| 主板 | 华硕 Crosshair V Formula |
| 共用配件 | |
| 硬盘 | 主盘:三星830固态硬盘(256G) 副盘:西部数据 1TB 黑盘 |
| 显卡 | HIS IceQ X2 HD7970(1180/6000MHz,3GB) |
| 内存 | 芝奇DDR3-1600 4Gx4(8-8-8-24,双通道) |
| 电源 | 酷冷至尊M2 Slilent Pro 1000W |
| 软件平台 | |
| 操作系统 | Windows 7 Ultimate X64 SP1 |
| 驱动程序 | 显卡: AMD催化剂12.8 for win7 64bit |
| 评测方案 | 多线程性能测试: 物理运算测试: |
CPU性能测试部分,我们选择上一代APU旗舰A8-3870K来比较两者之间的差别,另外加入了同为双模块设计的FX-4170与定位较高的FX-6100;竞争对手方面,则挑选了i3 3220和i5 3450。通过本次测试,我们可以全面了解新一代APU的性能。
2.1、CPU理论多线程性能
测试项目包括科学运算测试软件wPrime和AI(人工智能)运算测试软件Fritz Chess,两款软件均对多核CPU进行大量优化,对CPU性能有较大的指导意义。由于只是理论运算,我们把它们归类为CPU理论性能测试。
●Fritz Chess国际象棋:
| Fritz Chess 4.3(国际象棋) | |
| 软件简介 | 测试CPU的AI运算性能、多线程处理能力。 |
| 软件设置 | 默认设置,使用CPU的最大线程数 |
| 测试方法 | 直接按Start开始测试,记录得分 |
| 软件截图 | ![]() |

《国际象棋》测试成绩
●wPrime 2.05质数计算:
| wPrime 2.05 | |
| 软件简介 | wPrime是一款通过计算质数来测试计算机运算能力等的软件,由于wPrime可以支持多线程并行运算,因此更能反映出多核、多线程CPU之间的性能差距。 |
| 软件设置 | 设置Set Thread Count,使用CPU的最大线程数 |
| 测试方法 | 运行1024M,记录用时 |
| 软件截图 | |

wPrime 2.05测试成绩
测试小结:Fritz Chess和wPrime是测试CPU多线程性能的代表性软件,在这一轮新一代APU的表现没有想象中那么好,Fritz得分与A8-3870K基本相同;wPrime则落后了不少,模块化设计的CPU(A10-5800K、FX-4170、FX-6100)在这一轮测试中的表现都不太理想。
-------------------------------------------------------------------------------
2.2、3DMark系列物理运算测试
这部分的测试主要考察CPU在游戏中的物理运算和人工智能运算能力,我们选取了权威的3D测试软件3DMark Vantage和3DMark 11,它们分别是DX10和DX11 两个时代的测试软件。
●3DMark Vantage:
| 3DMark Vantage 1.10(物理运算) | |
| 软件简介 | 3DMark Vantage是一款基于DirectX 10的3D性能基准测试软件,主要包括了显卡测试和CPU测试两个部分。 |
| 软件设置 | Performance |
| 测试方法 | 只进行CPU物理运算部分测试,记录得分 |
| 软件截图 | ![]() |

3DMark Vantage测试成绩(CPU得分)
●DX11测试软件3DMark 11:
| 3DMark 11 1.02(物理运算) | |
| 软件简介 | 3DMark 11是一款基于DirectX 11的3D性能基准测试软件,内置了三大测试项目:图形性能测试、 物理性能测试和综合测试。 |
| 软件 设置 | Performance |
| 测试方法 | 只进行 CPU物理运算部分测试,记录得分 |
| 软件截图 | ![]() |

3DMark 11测试成绩(CPU得分)
测试小结:3DMark系列能全面挖掘CPU的潜力,已经成为考量整机性能的一个重要指标,我们选择其中的物理运算部分进行测试,单纯地对CPU性能进行对比。在这两项测试中A10-5800K的得分都比A8-3870K要高一些,与FX-4170分数接近。>>
2.3、常用软件性能测试
文件压缩/解压缩和图片处理是普通用户的常用操作,我们选择了著名的WinRAR以及PhotoShop进行这部分的评测。
●WinRAR文件压缩
| WinRAR 4.20(文件压缩测试) | |
| 软件简介 | WinRAR 是非常流行的压缩软件,支持CPU多线程运算。4.20版本改进了算法,能更有效地利用CPU 资源 |
| 软件 设置 | 压缩方式选择“最好” |
| 测试方法 | 使用WinRAR压缩一个803MB的程序文件夹,压缩方式选择“最好”,用秒表记录压 缩所用时间,测试三次取平均值。 |
| 软件截图 | ![]() |

WinRAR 4.20测试成绩
●PhotoShop图片处理:
| PhotoShop CS6(图片处理) | |
| 软件简介 | Photoshop是最著名的图像处理软件之一,集图像编辑修改、图像制作、广告创意 、图像输入与输出于一体,深受广大平面设计人员和普通用户的喜爱。 |
| 软件 设置 | 创建一 个复杂的图片处理动作 |
| 测试方法 | 对数十 张高分辨率照片进行动作批处理,记录用时 |
| 软件截图 | ![]() |

PhotoShop CS6测试成绩
测试小结:WinRAR和PhotoShop是网友较为常用的软件,对CPU微架构、核心数、内存性能和缓存都比较敏感,在WinRAR测试项目里,A10-5800K的表现比A8-3870K要好,FX系列CPU由于具备三级缓存,测试结果更加优秀;PhotoShop方面,自从更新到CS6版本后能更好地利用推土机FX的CPU性能,A10-5800K同样为模块化设计,得分高于A8-3870K也在意料之中。
-------------------------------------------------------------------------------
2.4、专业软件性能测试
这部分的测试内容包括Cinebench R11.5 3D渲染测试和TMPGEnc 视频转换测试,对于常进行3D图形渲染或视频转换的专业用户说来,很有指导意义。
● Cinebench 3D渲染:
| CineBench R11.5 64Bit(3D渲染) | |
| 软件简介 | CineBench R11.5为目前最新版的Cinebench系列测试软件,它采用了3D设计软件 CINEMA 4D的3D引擎,支持多线程同时运算,可以用来评测多核处理器的效能。 |
| 软件设置 | 默认 |
| 测试方法 | CPU的多核心运算,记录得分 |
| 软件截图 | |

CineBench R11.5 3D渲染测试
● TMPGEnc视频转换:
| TMPGEnc 4.77(视频压缩/转换) | |
| 软件简介 | TMPGEnc是著名的视频编码/解码软件,支持多种格式。对多核心处理器进行优化,并加入了SSE4等新指令集的支持,能充分发挥CPU的性能,减少大量的编码时间。 |
| 软件设置 | 1080P 转换为480P,H.264 |
| 测试方法 | 转换《变形金刚2》的片段,记录用时 |
| 软件截图 | |

TMPGEnc视频转换测试成绩
测试小结:面向专业用户的3D渲染和视频转换软件,对多核/多线程CPU做了较充足的优化。Cinebench测试项目A10-5800K与FX-4170得分很接近,略低于A8-3870K,和多线程测试的情况接近;视频转码则是以较大的优势抛离上一代APU,因为在新一代APU里加入了新的指令集,有利于视频编码解码。>>
2.5、CPU游戏性能测试
CPU在游戏过程中主要负责物理效果演算和AI运算,与GPU的分工明显不同。简单点说,就是“场景内角色越多,CPU性能要求越高”,我们平常游戏组队进入大型副本围殴BOSS的时候出现的“卡机”现象,就是CPU性能不足的表现。
为此,我们选取了《星际争霸2:自由之翼》、《生化危机5》和《马克思佩恩3》进行CPU游戏性能的测试,前两款虽然不是最新的游戏,但因为场景内怪物/角色非常多,对CPU提出了很高的要求,测试结果能很好地反映各CPU的游戏性能差距。
● DX9游戏《星际争霸2》 :
| 星际争霸 2(DX9游戏) | |
| 游戏简介 | 《星际争霸2》是最受欢迎的PC竞技游戏之一,游戏加入了大量AI运算,对CPU性能提出更高的要 求。 |
| 游戏设置 | 1920x1080 超高,关闭垂直同步 |
| 测试方法 | 我们采 用测试录像进行测试,选取中间激烈战斗部分,耗时1分钟,用Fraps记录平均帧数。 |
| 游戏截图 | ![]() |

《星际争霸2》测试成绩
-----------------------------------------------------------------------------
关于游戏帧数(FPS)的意义
游戏帧数是反映游戏是否流畅运行的标准,大 多数情况下可这样归类,没有可玩性:帧数低于30FPS;可以 接受:帧数30-50;流畅运行:帧数50-60;完美运 行:帧数大于等于60。也就是说一般情况下帧数大于60意义不大,这时可以调 高游戏画质获得更加的视觉效果。
-----------------------------------------------------------------------------
● DX10游戏《生化危机5》:
| 生化危机 5(DX10游戏) | |
| 游戏简介 | 《生化危机》系列是家用游戏机上百万销量大作,现在最新作《生化危机5》已推出PC版,并支持DX10技术,使其画质再度提升。 |
| 游戏设置 | 1920x1080 0AA,全高,关闭垂直同步。 |
| 测试方法 | 自带Fix Benchmark |
| 游戏截图 | ![]() |

《生化危机5》测试成绩
● DX11游戏《马克思佩恩3》:
| 马克思佩恩3(DX11游戏) | |
| 游戏简介 | 《马克思·佩恩3》是著名第三人称射击游戏《马克思·佩恩》系列的正统续作, 该游戏对整机的性能要求很高 |
| 游戏设置 | 1920x1080分辨率,画面设置全部为“High”,0AA,关闭垂直同步 |
| 测试方法 | 试玩第二章第二小节片段,从进入场景到从跳落地面为止,用Fraps记录平均帧数 |
| 游戏截图 | ![]() |

《马克思·佩恩3》测试成绩
测试小结:游戏测试部分受核心架构与处理器频率的影响比较大,A10-5800K可以Turbo到4.2GHz,使得游戏测试项目受益不少,三轮游戏测试下来A10-5800K的得分比A8-3870K高出15%左右。>>
3、GPU加速实战:OpenCL通用计算性能测试
通用计算是指用GPU来辅助CPU工作,通过强大的并行数据处理能力来获得数倍甚至数十倍的性能提升,与AMD提出的“异构运算”是同一个概念,只不过异构运算的目标要更长远一些。

实际上,这种加速是通过OpenCL通用计算技术实现的。对于我们DIY玩家来说,我们最关心的,就是用显卡通过OpenCL执行一些与显示/图形无关的任务,比如文件压缩、图片处理、视频装换等等。目前AMD、NVIDIA和Intel的显卡都能支持OpenCL,在AMD来说是从9.11版的催化剂驱动开始支持,NVIDIA则是195.62版驱动开始支持,而Intel的OpenCL支持刚刚起步,必须使用三代Core i的核显和相应的驱动才行。
●Luxmark OpenCL理论性能测试:
| OpenCL性能:LuxMark GPU测试 | |
| 软件介绍 | LuxMark是一款由Jromang编写的OpenCL测试工具,基于开源的LuxRender引擎,能够有效地测试GPU和CPU的OpenCL运算性能。 |
| 软件设置 | 选择中等难度场景,运行GPU only测试,记录得分 |
| 软件截图 | ![]() |

Luxmark OpenCL测试成绩
●WinZip文件压缩:
| WinZip 16.5 文件压缩性能测试 | |
| 软件介绍 | WinZip是一款非常经典的压缩软件,可以快速简易地压缩出ZIP等压缩文件,新版本添加了OpenCL支持,可以用AMD的显卡为文件压缩/解压缩加速。 |
| 软件设置 | 分别在开启/关闭OpenCL加速的情况下对一个804MB的文件夹进行压缩,记录用时 |
| 软件截图 | ![]() |

WinZip文件压缩测试
●Musemage图片处理:
| Musemage图片处理性能测试 | |
| 软件介绍 | Musemage 是全球第一款基于GPU加速的全功能图片处理软件,用户界面简洁易用并且功能强大 |
| 软件设置 | 使用三张同一场景、不同曝光度的图片,用Musemage自动生成高动态范围(HDR)图片,记录用时 |
| 软件截图 | ![]() |

Musemage图形处理测试
●vReveal视频处理:
| vReveal视频处理性能测试 | |
| 软件介绍 | vReveal的主要功能是修复视频中的诸多常见问题,比如色彩、模糊或抖动等等,通过简单的操作就能优化视频质量 |
| 软件设置 | 文件源为一段16s的1080P视频录像,通过vReveal“一键修正”功能优化画面,再转码成480p avi格式,记录用时。 |
| 软件截图 | ![]() |

vReveal视频处理测试
测试小结:对比A10-5800K和A8-3870K,新一代APU由于新增高清媒体加速器,比第一代产品多出AVX、AES等指令集,性能优势明显,其中视频处理开启OpenCL之后消耗的时间缩短到不足三分之一,确实是很大的进步。
Intel核芯显卡对OpenCL的支持刚刚起步,Luxmark的理论测试得分明显不敌APU,并且现阶段能将Intel的“通用计算”性能应用到实际环境的软件还比较少。不过从测试中我们也发现,单就CPU性能而言,Core i5已经领先,希望Intel能加大对OpenCL的支持力度吧。>>
4、高频率不等于高功耗:新一代APU平台功耗对比
新一代APU有个明显的特征,默认频率都很高,而且与一代产品一样采用32nm工艺,那么它会不会成为一代“电老虎”呢?为此我们安排了功耗测试。考虑到APU实际使用环境,除了传统的独显平台之外,我们还增加了整合平台功耗对比。平台的搭建与前面测试GPU、CPU性能的配置相同,这里就不再累述。
| 功耗对比测试 | |
| 测试方法 | 用功耗仪记录在单位时间内的平均功耗 |
| 测试范围 | 网页浏览(CPU、GPU空闲状态)、游戏娱乐(GPU满载)、Prime95烤机(CPU满载) |
| 测试工具 (功耗仪) | ![]() |
4.1、整合平台功耗对比

浏览网页时的整合平台功耗(CPU、GPU空闲)

玩游戏时的整合平台功耗(GPU满载)

Prime95烤机时的整合平台功耗(CPU满载)
4.2、独显平台功耗对比

浏览网页时的整合平台功耗(CPU、GPU空闲)

玩游戏时的整合平台功耗(CPU+独显负载)

Prime95烤机时的整合平台功耗(CPU满载、独显待机)
测试小结:整合平台选择的是前后两代APU进行对比,可以看到虽然CPU频率远远高于上代产品,GPU性能也提升了25%,新一代APU A10平台却比上一代旗舰APU A8平台“节能”了不少;
独显平台搭配的是非公版HD7970,这时候的平台功耗大部分来自独立显卡,同样的A10-5800K的平台耗电量也比A8-3870K要低,可以看出AMD在功耗这方面是有下一番功夫的。>>
PConline 评测室总结
●新一代APU融合的GPU,当之无愧成为新的最强融合显卡
新一代APU A10-5800K融合的HD 7660D的性能比第一代APU A8-3870K融合的HD 6550D强不少,性能提升在25%左右。我们把前面的测试数据做一下整合,以A8-3870K(融合HD 6550D GPU)为基准,得出今天参与测试显卡的综合性能对比:

GPU性能对比
| 参与测试的入门显卡参考售价 | ||
| 显卡型号 | 参考售价 | |
| GT630(SDDR3) | 399元 | |
| GT630(GDDR5) | 459元 | |
| HD 6570(SDDR3) | 369元 | |
| HD 6570(GDDR5) | 449元 | |
融合显卡HD 7660D的性能已经远远抛离竞争对手的核芯显卡,和上一代“最强融合GPU”HD 6550D相比也有24%的性能提升,完胜DDR3显存的GT630、HD6570。逼近DDR5版本GT630。因为这次测试的目的是为了给HD 7660D做一个性能定位,所以我们没有进行双交火测试,新一代APU和上一代产品一样,能通过与HD6570/HD6670组建双交火来提升性能。
●CPU性能变化不大,与FX-4170处于同一水平

CPU性能对比(包括搭配HD7970独显时的游戏性能)
也许是模块化设计的原因,新一代APU相比上一代产品的CPU性能提升不太明显,综合来看A10-5800K的CPU性能与FX-4170接近。AMD认为,现阶段的CPU性能对大对数用户而言已经足够,特别是整合平台,GPU的提升带来的体验更加明显,所以AMD把产品重点放到了GPU的提升上。
●高频率不等于高电量,新一代APU的功耗控制能力比上一代产品好

整合平台功耗对比

独显平台功耗对比
虽然A10-5800K与A8-3870K的TDP热设计功耗都是100W,但得益于32mn工艺的成熟、漏电率得到较好的控制,新一代APU总功耗比上一代产品要低一些,特别是整合平台,这个差距达到13%,如果使用新一代A6/A8产品会如何呢?确实值得期待。虽然总体来说功耗控制还比不上采用更高制程的Intel 22nm CPU,但新一代APU却在融合了更高的CPU频率和更强的GPU核心后降低了功耗,也看得出AMD正在努力。
●新一代APU上市后,市场格局会发生什么变化?

A10 APU的售价为750-850元,但从产品定位来看,在i3与i5之间;打桩机FX将重点与i5竞争,短时间内Intel Core i7的地位不会受到威胁。降价的可能性不大;现在的CPU市场正趋于稳定,在未来半年的时间里,Intel也没有新品发布,能否抓紧这个机会抢得先机,就要看接下来AMD的市场策略了。
●选购建议

1.竞争力分析
性能上:相比一代APU有小幅度提升,CPU性能与FX-4170接近,GPU性能大幅度强化,可以媲美GDDR5版GT630。
价格上:按照AMD的定位,A10-5800在Core i3与i5之间,售价为750-850元,初上市估计在900元左右。
功耗上:新一代APU的功耗控制能力比上一代产品要好,特别是在整合平台提升很明显。
A10-5800K刷新了第一代APU创下的“最强融合GPU”称号,足以媲美GDDR GT630,在整合平台的优势更加明显了;不过CPU方面的提升不大。
2.用户群体
整合平台、HTPC用户。
3.选购建议
售价为800元左右的A10-5800K,价格比较合理,包括了价值500元级别的CPU和400元级别的独立显卡。不过初期上市可能会因货源紧张,商家把价格抬高,用户可以先观望,待800元左右方值得出手。此外,用户可以留意新一代的A6/A8,这些主流产品性价比同样会不错。[返回频道首页]
--------------------------------
相关活动:
2012年10月11日,AMD将会隆重和京东商城进行新一代APU的独家首卖活动,同时为消费者送出秒杀、超值抢购等五重大礼!请大家快来关注这个首卖活动吧http://sale.360buy.com/act/CUyn3BpjHhXdf2k.html
延伸阅读:新一代APU带来哪些改变?
1、改变一:抛弃K10,CPU部分采用打桩机架构
二代APU的CPU部分从原来的K10核心升级到Piledriver(打桩机)核心,也就是说,二代APU开始将全线采用模块化设计,和“以往”的APU已经是完全不同的产品了。

"打桩机"核心架构解说
●模块化设计的打桩机架构
二代APU所沿用的打桩机核心,拥有2个模块4个内核,每个模块内共享2MB L2缓存,据AMD的介绍CPU性能与一代APU相比会提高26%。

“打桩机”核心的主要改进
●全新指令集的加入
打桩机核心加入了对AVX/AVX1.1、FMA3、AES和F16C指令集的支持。事实上AVX、AES指令集是Intel在Sandy Bridge上的最主要更新,AVX能大幅度提高CPU的浮点运算性能,AMD从“推土机”架构开始就已经支持这项技术。

大名鼎鼎的AVX、AES指令集其实在推土机核心上就已经被支持
但从实际指令集来看,AMD根据AVX编码方式扩展出了XOP、FMA等一系列更完善的指令集,在保证了兼容性的基础上,强化了整数运算效能。FMA3可以说是FMA4的简化版,只需用到3个指令,使代码更短且硬件执行上稍微简单一些。
●频率更高、功耗不变

前后两代APU的改变

二代APU的主要改进点
第二代APU依然采用32nm工艺制作,虽然晶体管数量也增加到13.03亿,核芯面积大了一些,不过相比一代产品应该成熟了许多:IPC(每周期指令)性能提升、漏电率下降、频率提高。二代APU的默认频率可达3.8-4.2GHz,GPU频率类似,最高800MHz。另一方面,平台功耗却得到了控制,与上一代产品一样保持TDP 65W和100W。当然这只是设计上的数值,具体功耗要实际体验才能知道。
●AMD Turbo CORE 3.0技术
采用“打桩机”微架构的二代APU支持AMD Turbo CORE 3.0技术,可以对 CPU / GPU 进行协同调度,其中CPU 单核心/多核心、偏重GPU应用以及CPU/GPU同时高负载时候的频率都不尽相同,以此来达到不同应用环境下的最佳性能发挥,这一点倒是和Intel的Turbo Boost 2.0很相似。

Turbo Core 2.0的工作方式

官方文档的Turbo Core 3.0解说
以APU移动版本A10-4600M为例,从以上官方的Turbo CORE 3.0功能解说可以看出,在不同的负载情况下,Turbo Core 3.0会对CPU/GPU频率进行调整,A10-4600M的CPU提升幅度可达19%,GPU最高提升幅度20%。前后两代Turbo Core的区别在于Turbo Core 2.0不会对CPU/GPU进行超频。>>
2、改变二:融合GPU升级到VLIW4体系
GPU方面,上一代Llano APU使用的是HD5000/6000独显的VLIW5体系,最多有5组SIMD阵列,400个流处理器,而Trinity APU使用的是VLIW4体系(首先在HD6900独显上使用),流处理器最多只有384个,看起来是减少了,但是效率更高,而且SIMD阵列提高到6组,最高频率也提高到800MHz,远比一代APU Llano最高600MHz的频率要高,这也是二代APU Trinity性能变化最明显的地方。

二代APU核心架构示意图
●流处理器减少,效率反而提升
二代APU融合的GPU;最多只有384个流处理器,但得益于较先进的VLIW4体系(也就是HD 6900系列显卡的架构),性能会比一代APU的VLIW5体系强一些。不过这次更新并没有升级到最新的GCN架构,也许是AMD有自己的考量吧。

VLIW4体系架构示意图
●支持多屏幕数字输出
二代APU支持DP1.2、HDMI、DVI等数字接口,轻松组建多屏显示,UVD功能的升级也让二代APU的视频播放质量进一步改善,包括有视频防抖、视频色彩增强、极速编码、Quick Stream(无中断的流媒体缓冲播放)等主要针对多媒体的功能。

从AMD透露的资料来看,新一代APU最高可以支持到四屏输出(一个DP接口可以转换成两个视频输出),与一代产品相比明显提升了不少,当然,实现这些功能的前提是主板要支持。
●支持AMD多屏宽域输出
二代APU搭配FM2接口主板可以实现AMD的多屏宽域输出,可以把多个显示器连成一个大型的桌面来使用,从而实现横向或者纵向超过3000像素的分辨率,带来震撼的画面体验。

多屏宽域输出
多屏宽域输出原本是独显专用的技术,现在二代APU也能实现了,可以预见这会是最廉价的专业级多屏解决方案,但这需要主板方面的支持,需要至少3个视频输出源。
3、改变三:接口更换到FM2
二代APU的总体架构由“K10+VLIW5”体系升级到了“Piledriver+VLIW4”,接口也升级到全新的FM2,与FM1互不相容,是的,FM1接口的一代APU、速龙II升级要换主板了。

两代APU的接口不同
Trinity 二代APU与Llano 一代APU的最明显的区别是针脚结构,Trinity APU采用了Socket FM2接口,共计904针,与采用Socket FM1接口、共计905针的Llano APU相比,不仅针脚数不一致,就连针脚的排列都有所不同,因此两代APU平台是互不兼容的,至少不能插在对方的插槽中。

二代APU会配备更高级的A85X芯片组
由于二代APU采用全新架构,AMD也准备了配套的FM2接口的A85X主板。新一代接口的互不兼容本来可以理解的,但A75/A55芯片组换上FM2接口后,是可以完美支持二代APU的,也就是A75/A55芯片组是支持的,AMD采用新接口有点难以理解。也许是AMD对各大主板厂商的特别关照。
以后是否会有FM2转FM1或者FM1转FM2的转换器?这个就很难说了。另外AMD已经明确表示,未来的FMx接口将兼容FM2,这就大大延长了FM2平台的周期寿命,FM2平台的用户在将来可以很方便地升级新处理器。
●APU产品逐渐走向成熟,生态圈逐步建立
从AMD的路线来看,二代APU是AMD走向成熟的标志,把GPU核心与模块化架构相结合,在此基础上再逐步进化完善,最终形成异构运算体系。与2011年相比,2012年针对异构运算加速的产品逐渐增多,一个良好的生态圈正在建立。

支持APU加速的产品逐渐增多

Win8的出现会让APU变得“强势”吗?
按计划Windows8将在10月份发布正式版,恰好是二代APU上市的时间段。Windows 8中广泛应用的硬件加速功能,能否让二代APU的优势得以发挥,现在还无法定论,不过从二代APU的更新来看,AMD是下定决心要走异构运算的道路了,模块化设计的APU可以说是异构运算体系的雏形。