老迈G92核心Tesla秒杀英特尔Xeon5620?

企业 正睿评测室 2010-09-08 11:53
1产品外观回顶部

  NVIDIA上一代GPU的G92核心曾被网友们进行了诸多恶搞,但其确实有够长命了(网友语:被延长)。在Intel的众核MIC架构正式登场前,在通用计算领域,传统CPU比起GPGPU确实有些不够看。即将于明年一季度携AVX指令集登场的Sandy Bridge又会如何呢?

  正睿®I249788S-H-TC4高性能Tesla GPU计算系统采用塔式机构设计,具备充分的可扩展性。从正面拍摄图可以看出,它具备8个热插拔盘位,2个前置USB接口,网卡、电源、硬盘LED指示灯。

  在前面板有钥匙孔和防尘罩。前者可以保障数据安全,防止在未经得管理员同意的情况下被人恶意拆取硬盘,盗取数据。后者可以在保证散热良好的前提下,有效的减少灰尘进入机箱内部。

服务器正面
正睿 I249788S-H-TC4  图片  评测  论坛  报价

  正睿®I249788S-H-TC4的背部有6个USB后置接口,1个VGA显示接口,1个COM口和P/S2键鼠接口,6声道音频输入输出接口,1个远程管理口。两个千兆网络接口,满足文件服务器、网格计算等对网络带宽的要求较高的应用需求。

背部接口和散热器
背部还配备了2个可热插拔的抽风扇,将机箱内部的热空气抽出机箱,达到更好的散热效果。

散热风扇
热插拔散热风扇

  正睿® I249788S-H-TC4服务器打开后,给人赏心悦目的感觉。即使是内部部件非常的多,结构布局看起来仍然非常清爽,各个部件的位置和走线井井有条,对于散热和后期维护都很有帮助。国产服务器品牌厂商正睿对服务器整体设计的进步,不得不令人刮目相看。

内部结构
服务器内部结构

  它标配两颗英特尔32纳米制程工艺的至强®E5620处理器,系统达成总计8核心,16条计算线程。每颗处理器拥有5.86GT/s QPI总线带宽、12MB超大智能缓存容量、支持睿频(智能加速)、虚拟化技术、TXT安全技术和AES-NI加密技术。

标配CPU
Xeon E5620

  正睿® I249788S-H-TC4服务器的硬盘热插拔模块,为机箱前置的硬盘热插拔提供供电和数据传输支持。

热插拔硬盘模块
热插拔硬盘模块

  

2产品外观及主要参数回顶部
 

  在服务器内部,由4个9cm的热插拔风扇组成风墙为服务器内部各个部件提供散热保障的同时也保持了较低的噪音。

机箱内部热插拔散热器
机箱内部热插拔散热器

  正睿® I249788S-H-TC4服务器采用1400瓦的1+1冗余电源设计。它也支持热插拔功能,在电源故障的情况下,只需要抽取损坏的故障电源模块,将新电源更换到到原有位置即可,整个更换过程不会导致服务器因此而停机。

热插拔电源
热插拔电源

  正睿® I249788S-H-TC4 服务器标配4块Nvidia Tesla C1060 GPU计算模块,它以大型并行计算的多核心处理器为基础,搭配标准的CUDA C编程环境,颗简化的多重核心的编程作业。满足高效能运算业界无止境的效能需求,胜任运算要求最苛刻并且不断持续攀升的产业应用需求,包括药物研究、油气与天然气勘探、以及运算型的金融应用等。

Tesla C1060
NVIDIA Tesla 1060

  接下来,我们看看这款正睿® I249788S-H-TC4服务器的性能评测部分。

  一、配置平台

  1,测试平台配置

测试平台

  2,硬件配置截图

CUDA-Z识别图
CUDA-Z识别图

  此版本可以显示GPU核心运算能力和性能、显存容量和带宽。它显示了所有CUDA技术的单精度浮点和整数运算性能。同时它也显示了支持双精度操作的Tesla C1060计算模块的最新特性。该软件还可以生成一个HTML格式和TXT纯文本文件报告,方便用户参考。

  打开CUDA-Z软件后,可以很清楚地看到上面的4个选项卡,分别是Core(核心)、Memory(内存,这里值本地显存)、Performance(性能)、About(相关信息)。通过这4个界面,我们可以很清楚地了解到自己的NVIDIA显卡在通用计算方面的性能,当然这些都是硬件配置和理论性能。

  

3性能测试回顶部

  二、CPU性能测试

  1,GPCBenchmarkOCL_cn OpenCL通用计算基础测试v1.0

  首款国人开发的支持GPU的OpenCL通用计算测试程序OpenCL General Purpose Computing Benchmark (简称GPCBenchMarkOCL)是由国内几名高性能计算从业人员和爱好者合作编写的,目的是为了评估在不同的OpenCL平台上一些基本算法和应用的性能。与目前流行的一些OpenCL、DirectCompute通用计算测试程序的不同在于,目前这些测试程序测试项目过于单一,基本上就是某一两种算法的性能测试,甚至干脆就是理论峰值计算性能的测试。

  而实际上,OpenCL计算设备包括GPU的计算性能是受非常多因素影响的,除了计算单元的频率和数量之外,还有计算单元架构、Global memory(显存)带宽、Local memory(GPU内的片上存储器,NVIDIA称为Shared memory,AMD称为Local Data Share)带宽和Bank conflict、存储器合并访问情况、存储器同步成本、缓存等各种因素。因此某些纸面计算性能非常高的GPU执行某些计算时性能却不一定好;又或者,某GPU在执行某种计算时虽然性能落后于另一架构的GPU,但是在执行另一种计算时性能反而超前。GPCBenchMarkOCL集合了高性能计算领域多种常见的基础算法和应用,能比较全面地评估GPU及其它OpenCL计算设备在通用计算应用中的性能。

 通用计算测试
GPCBenchmarkOCL_cn OpenCL通用计算基础测试v1.0    (值越大越好)

OPENCL基础测试
性能对比

数据对比
I249788S-H-TC4 AMD Phenom II X4 945 性能差距

  2,APDFPR 5.00 professional edition

APDFPR
该系统解码速度为3.4亿次

  Advanced PDF Password Recovery (APDFPR)是用来解密受保护的 Adobe Acrobat PDF 文件的程序,它们设置了“用户”和/或“属主”口令,防止文件被打开或编辑、打印、选择文本和图形等等。

  企业版(Enterprise Edition):包括一个新的“rainbow攻击”子系统 -- 它是用包含特殊 "Thunder tables" (tm) 的DVD 承载的,允许在几分钟而不是几天内解密所有的 40 位PDF 文件。 版本 5.0 支持 Adobe Acrobat 9 创建的 PDF 文件(256 位 AES 加密),支持多核心和多处理器,并且能使用 NVIDIA 显卡的硬件加速。 

测试结果
测试数据

测试数据
对比系统得分

4总结回顶部

  总结:

  从拆解评测中可以看到正睿® I249788S-H-TC4 Tesla高性能计算系统在电源、硬盘散热器等部件全采用热插拔设计,使计算机管理员在数据维护时,更加简便。它做工扎实、内部结构布局合理,令人赏心悦目的同时,稳定性也更有保障,并且它采用了80puls金牌认证电源,更加节能。

  从性能评测的结果数据可以一目了然地看到正睿® I249788S-H-TC4 Tesla高性能计算系统较常规的x86架构的计算机在诸多应用计算对比测试中有绝对的性能优势。比如在APDFPR5.00 professional edition软件的密码破译应用的性能差距居然达到20倍之多,原来需要24小时才能完成的工作,在现在仅需1小时左右即可完成,大幅提高了工作效率。

  在以后的通用计算测试中,我们准备逐渐开始测试一些经典的通用计算项目,如基于GROMACS分子动力学引擎的Folding@home项目等,这些项目能够检测到GPU在复杂运算环境下实际能力。

更多应用
GPU计算的诸多应用范围

  正睿作为国产服务器品牌厂商经过多年积累与沉淀,在不断推出新解决方案的同时,也打破了国际品牌对产品技术和价格的垄断,给国内的用户带来了实惠,获得市场的广泛好评。在这里,我们也感谢通过正睿® I249788S-H-TC4的测试,让读者朋友们更深入地了解到更多关于Tesla计算的产品和应用。[返回频道首页]

网友评论

写评论

相关推荐