下载

千万玩家 心悬一线:“开普勒”显卡大揭秘

阿乐 2012-03-14 16:16:52
显卡应用
1从NVIDIA的做事风格说起回顶部

期待奇迹,期待开普勒:

  这几天,关注显卡的玩家内心肯定都会有一种难以抑制的躁动,行业里面透露出来的各种信息,都在强烈的暗示着NVIDIA的下一代28纳米“开普勒”显卡终于要到来了。“开普勒”的硬件规格,当前“先知”们已经基本达成了一致的观点,但“开普勒”的真实性能却依然有点“虚无缥缈”,在无休止的猜测、“烟幕弹”背后,透露出来的玩家心态其实出奇的一致:期待NVIDIA迟到了三个月的“开普勒”能够创造一个横空出世的“奇迹”,为行业注入久违的激情与活力,为巅峰图形性能带来一场精彩的“翻盘”之战。

NVIDIA开普勒显卡
“开普勒”能否创造奇迹?

  在平淡的生活中,大家都期望出现创造奇迹的英雄,对于计算机图形技术行业、全球亿万玩家而言,“开普勒”就正是这个被赋予众望的角色。时至今日,“开普勒”距降临地球已经无限接近了(具体发布日期已经是一个众所周知的秘密),为了满足广大玩家的好奇心、提前迎接“开普勒”,我们今天就将这款业界透露出的各种信息进行了一次汇总,并根据我们的经验进行一番鉴别,体前来一场“开普勒”大爆料,大家一起来权且看看。

NVIDIA开普勒显卡
“开普勒”即将降临地球

从NVIDIA的做事风格说起:

  判断“开普勒”的性能实力,可以先从NVIDIA的做事风格说起。与Intel、AMD这种成熟的IT巨头不同,NVIDIA还是一家个人风格非常明显的公司,更类似于乔布斯时代的苹果公司。NVIDIA的创始人兼“主教”黄仁勋,给人的感觉是有强烈的挑战性和开拓性,既讲究实力,更远比竞争对手擅长于利用公关、媒体。这种做事风格,让活跃在“Wintel”两巨头间的NVIDIA总能有征服业界的实力产品、有需要对手们时刻紧盯提防的“绩优”概念、有创造性的发展开拓方向,而且总能为行业带来惊喜和意外,让业界每次都主动对NVIDIA充满期待。

NVIDIA开普勒显卡
NVIDIA的“主教”黄仁勋

  计算机图形芯片(GPU)是NVIDIA的起家行业,早在十多年前,NVIDIA凭借强悍的TNT、GrForce图形芯片推翻统治业界的3dfx"Voodoo"王朝以来,NVIDIA在图形芯片技术、架构设计理念上就一直走在业界最前沿。虽然相对于竞争对手,NVIDIA的产品可能报价更贵,但却始终是更主流玩家的首选。

NVIDIA开普勒显卡
NVIDIA在图形芯片技术、架构设计理念上一直走在业界最前沿

  除了在在2003年的GeForce FX时代,NVIDIA因为GPU设计理念过于“前卫”而被ATI反超以来,随后的GeForce 6、7、8三代产品都以“激进”的大幅度性能提升策略,令业界意外频频。进入2006年,随着ATI被AMD收购,A卡产品策略打起了“太极拳”,不再与NVIDIA硬碰硬,但灵活的“小芯片”策略、加以一度的制程优势、CPU平台带动,却对NVIDIA的市场份额构成了严重威胁,加上NVIDIA的“穿越性”的“通用运算”理想由于巨头盯防而在高性能运算领域开拓缓慢,形成了N卡、A卡至今的“相持”局面。

NVIDIA开普勒显卡
“开普勒”这个名字第一次在公开场合露面

  在2010年的NVIDIA GTC大会上,“开普勒”这个名字第一次在公开场合露面,定位是继GeForce GTX400、GTX500“费米”架构之后的全新一代GPU芯片。从上面的图上我们可以看出,“开普勒”显卡的每瓦特计算性能在“费米”的两倍以上,因此即使最终的“开普勒”功耗低于GTX580,但运算性能大幅超越GTX580应该问题不大。

NVIDIA开普勒显卡
考虑到NVIDIA的行事风格,“开普勒”极有可能将带来翻盘之战

  然后我们从竞争对手方面看,AMD新一代“南方群岛”架构旗舰显卡HD7970已经在2012年1月9日正式发售,平均性能领先GTX580约30%,在对手性能已经完全透明化的情况下,“开普勒”比对手晚发布了近三个月,考虑到NVIDIA的行事风格,加上这种“黄雀在后”的优势,都正是大家期望“开普勒”能够带来翻盘之战、对“开普勒”狂热的原因所在。>>

2“开普勒”的硬件规格如何回顶部

“开普勒”的硬件规格如何?

  这个问题现在其实已经没有多少悬念了,因为近来从国内外各种渠道透露出来的信息,都在相互佐证着同一种说法,而且从下面这张我们最新拿到的规格表来看,“开普勒”的命名、详细硬件规格已经一览无遗了,从这之中我们可以得到非常多的“靠谱”信息。

NVIDIA开普勒显卡
GTX680硬件规格

28纳米工艺,催生GPU进入“GHz”时代:

  首先,“开普勒”架构首款旗舰芯片“GK104”显卡的正式名称将是GeForce GTX680。GK104芯片采用台积电28纳米制程生产,但晶体管蚀刻工艺与第一款试水28纳米的AMD“Tahiti”芯片又有所不同,“Tahiti”芯片去年就已经开始量产,当时台积电手下能够满足AMD需求的只有28nm HKMG HPL方案,这也是一种高K金属栅极技术,在提升运行频率与防漏电低功耗之间能够获得较好的均衡,芯片良品率也比较高。

28纳米
台积电28纳米硅晶圆

  而比“Tahiti”晚了三个月的GK104芯片,使用的很可能是后来才成熟的28nm HKMG HP高性能工艺,这种工艺能够达成更高的核心运行频率,因此“开普勒”架构旗舰显卡GTX680的发布时的核心频率就已经在1058MHz了,创下了A/N公版显卡频率之最。日后简化版轻装上阵的中低端“开普勒”芯片(GK107?),将肯定能够爆出更夸张的运行频率。

GK104显卡
“开普勒”谍照(上图):NVIDIA GK104与AMD Tahiti芯片对比

256bit显存,改进的显存控制器:

  早在上周,业界就得到了一致消息:GTX680显卡将会采用256bit显存控制器,这比GTX580“缩水”不少。在对手的这代HD7970都已经升级到384bit显存位宽的情况下,NVIDIA却降至256bit显存位宽,这能否满足“开普勒”的性能需求?

GK104
“开普勒”只有8颗显存芯片,的确是256bit显存位宽

  在前几代产品中,显存控制器一直是A卡的优势,N卡显存频率最高也只达到了4100MHz。但GTX680的等效显存频率达到了创纪录的6008MHz,超过了HD7970 5500MHz的水准,NVIDIA终于在显存频率方面爆发了。GTX680显卡标配2GB显存,比GTX580 1.5GB的容量有了提升,虽不及HD7970的3GB来的“海量”,但估计二者不会因为显存容量造成性能差距,而且2GB显存,对付未来两三年的游戏也都仍然是绰绰有余了。

显卡
“开普勒”在显存频率上爆发了

  高频率的确可以弥补较低的显存位宽的缺陷,但NVIDIA自减显存位宽的做法,仍然让业界至今无法理解,难道传言中由于对手性能不给力、GTX670Ti临阵被刷成了GTX680的消息属实?这不禁又让人浮想联翩,看来有待于“开普勒”发布后NVIDIA给出解释了。

3三倍的处理器,但放弃分频设计?回顶部

1536个流处理器,三倍于GTX580:

  根据业界泄露出来的消息,GK104芯片集成了32亿个晶体管,核心面积估算大约320平方毫米,低于Tahiti 43亿晶体管、365平方毫米的规格。但两款显卡的核心架构并不一致,而且涉及到流处理器工序、架构运算效率,显卡的实际性能远远不能简单凭晶体管数量下结论。GK104芯片内建了1536个流处理器,数量是GTX580的整整三倍,如此激进,令人始料未及,但却很像NVIDIA一贯的行事风格。

NVIDIA开普勒显卡
GK104芯片内建1536个CUDA流处理器

  GK104芯片内建的1536个CUDA流处理器,被分配成16组SM阵列,每组SM包含96个流处理器,接下来的GTX660、GTX650、GTX620...流处理器数量都有可能会比上代产品至少翻一倍。在核心规模上,GK104比GF110的确复杂很多,但借助28纳米工艺,GK104芯片核心面积大约只有320平方毫米,远远小于GF110 520平方毫米的规模,也小于对手“Tahiti”的365平方毫米。

GTX400
GF110芯片内建512个CUDA流处理器

  GK104芯片的晶体管数量是32亿个,比GF110芯片30亿个的规模高不了多少,这就又产生了一个很的疑问:三倍的流处理器“建筑”规模,却只多用了7%的晶体管“砖头”,NVIDIA是如何做到的?看来“开普勒”的确大幅度更改了“费米”的架构组合,这也正是接下来我们推测“开普勒”放弃了Shader分频设计的一大依据。

放弃Shader分频设计,TDP功耗降至195W:

  而从GTX680显卡195W的TDP功耗看来,GK104芯片在效率优化上,要比GTX580进步巨大,28纳米工艺在提升芯片运行频率、缩小核心面积、增加流处理器数量方面的神奇魅力由此可见一斑。加上GK104晶体管数量不多,由此催生了业界的另一个猜想:“开普勒”很有可能放弃了Shader着色器分频设计。从2007年的GeForce 8系列显卡开始,NVIDIA GPU芯片的Shader着色器运行频率就一直数倍于核心频率,“费米”架构采用的就是双倍方案。更高的Shader频率,能够大幅提升芯片的运算性能,但却也但来了巨大的发热量。

NVIDIA开普勒显卡
早期泄露出来的GTX680显卡设计图:堆叠式双6pin外接供电接口

  Shader分频设计是一把双刃剑,而“开普勒”可能无需分频设计,已经能够凭借1536个流处理器获得性能优势,而且能够保持195W的TDP功耗,这在近几代旗舰卡中是一项了不起的成就,发烧显卡有望从此不再“发烧”。

NVIDIA开普勒显卡
泄露出来的GTX680显卡5相核心供电电路,规格/用料都不再“发烧”

  GTX680显卡的1536个流处理器、195W TDP功耗当前都基本可以确定,但放弃Shader分频设计却还只是一个猜想,毕竟性能的诱惑,让NVIDIA不大可能向功耗妥协。何况AMD HD7970显卡TDP功耗仍然有280W,“开普勒”的发挥空间还比较足。因此,“开普勒”是否继续采用Shader分频设计,尚有待于大家进一步验证。>>

4“开普勒”与DX11.1/PCI-E 3.0回顶部

将支持DX11.1标准:

  DirectX(简写DX)11.1支持与PCI-E 3.0接口。DirectX API是微软发布的游戏接口,可以看作是一个游戏渲染技术/建模技术的汇集,微软借助DirectX API规范,控制着PC游戏/显卡硬件行业,每代DX版本的更新,都会引起显卡行业的更新换代、巨头角力、甚至惊涛骇浪。当前,Windows XP平台上一般运行的是DX9.0c,而Windows 7平台上则运行的是DX11,预计2012年底Windows 8正式版发布后,将会为玩家普及DX11.1标准。

显卡
DX可以看作是一个渲染技术/建模技术的汇集

  DX可以看作是一个渲染技术/建模技术的汇集,新版本的DX可以支持游戏实现更多、更新的特效,而且可以提升显卡执行某些特效时的运算效率,因此,对DX版本的支持,不仅代表着游戏画质的层次,更代表着显卡硬件的层代。当前,业界游戏大作已经基本普及DX11,NVIDIA GTX500、AMD HD6000系列显卡也都已经是第二代DX11显卡了。

显卡
DX11曲面细分技术实际游戏画面(Crysis 2)

  DX11.1最大的改进就是将3D立体显示技术正式写入了D3D API,让开发者可以通过D3D渲染实现3D显示,而不再像之前一样需要绕过D3D API而使用四倍缓冲器或驱动/中间件来实现的。在DX11.1中,3D立体显示技术将成为成为一种通用标准,游戏开发也将更加简单。但PC 3D显示技术当前远未步入普及阶段,毕竟这还需要克服显示器、3D眼镜等一大堆难题。

3D眼镜
电脑3D显示技术要想普及,还需要克服显示器、3D眼镜等一大堆难题

  DX11.1还支持TIR目标独立光栅化技术,优化了GPU 双精度浮点运算效率,增强了图形与视频之间的操作灵活性,但这都只是一些小修小补的版本修订,基本无关游戏性能痛痒,但也正因为如此,为新一代显卡带来DX11.1支持也应该不存在什么难度。HD7970已经为DX11.1作好了准备,“开普勒”倘若在这方面被人抓到了把柄,估计就会重演DX10.1时代被对手针对的囧况。

AMD Radeon HD7970显卡
AMD HD7970:支持DX11.1规范、PCI-E 3.0接口

  因此,在DX版本支持问题上,显卡厂商都大意不得。虽然没有明确消息,但“开普勒”支持DX11.1肯定不会有意外。而且NVIDIA本身就是电脑3D显示技术的先行者,在过去的三年时间内已经推出了两代3D眼镜产品,DX11.1将3D游戏开发接口标准化,更是正中NVIDIA下怀。

采用原生PCI-E3.0接口设计:

  PCI-E 3.0标准主要是将信号传输率提高到8GT/s,两倍于PCI-E 2.0,同时伴随有一系列的信号稳定性优化。由于PCI-E 2.0接口带宽都还远未成为显卡的性能瓶颈,因此当前PCI-E 3.0接口最大的意义正在于稳定性提升,对于追求极速的PCI-E固态硬盘来说可能更有用武之地。

华硕 P9X79 Deluxe
当前只有X79主板平台可以支持PCI-E 3.0

  当前只有Intel X79主板平台可以支持PCI-E 3.0,X79主板需要搭配“天价”SNB-E处理器使用,而且当前PCI-E 2.0接口的数据带宽都还远未成为显卡的性能瓶颈,在PCI-E 3.0接口下,当前顶级显卡的实测性能也仅有极其微弱幅度的增长,因此,PCI-E 3.0接口其实也是噱头大于实际。

显卡
2004年NVIDIA需要借助桥接芯片才能支持PCI-E接口

  PCI-E 3.0规范早在2010年就已经完成,因此NVIDIA为新显卡加入PCI-E 3.0支持也并非难事。PCI-E 3.0接口日后必将成为新一代主板、显卡的宣传噱头。回想早在2004年,NVIDIA由于需要借助桥接芯片才能支持PCI-E接口,而被ATI的原生PCI-E方案嘲笑“有路何必搭桥”,相信“开普勒”不会在这方面再犯错。>>

5NVIDIA正式转战“小芯片”策略回顶部

NVIDIA正式转战“小芯片”策略:

  从195W TDP功耗、32亿晶体管、320平方毫米核心面积等规格来看,GK104对NVIDIA将会是一次巨大的战略转变:N卡将从此启动“小芯片”策略,仿效AMD收购ATI之后的做法。GK104核心面积与2007年发布的G92差不多,比起GF110 520平方毫米的庞大规模,小了不是一点半点。

 

NVIDIA开普勒显卡
G92与GK104芯片对比

  要理解什么是“小核心”策略,就要先回到2006年AMD收购ATI之后。当时,A卡为了应对在性能大战中长期的劣势局面,而首先“发明”了“小芯片”策略,将HD3000系列显卡从定位中端的HD3850/HD3870开始研发,力争在中端主力市场上取得性能优势,而后再利用小芯片“单卡双芯”方案来争夺高端市场。这种“田忌赛马”的策略,让HD3850/HD3870获得了很大的成功,而后A卡的“小芯片”策略在后续产品上一再上演,让背着巨型架构规模、研发困难、高成本、高发热量的N卡旗舰GTX280、GTX480、GTX580日益“电老虎”化,形势逐渐被动。

显卡
GTX580显卡的GF110是一颗“滚烫”的大核心

  GK104效仿竞争对手的“小芯片策略”,对NVIDIA来说将是一次巨大的转折,是N卡脱离被动局面、走上高能效之路的“一盘很大的棋”。从“开普勒”195W TDP功耗、320平方毫米核心面积、1GHz以上核心频率等方面的规格来看,NVIDIA这一招“小芯片”策略打的还是挺漂亮,日后的GK110、双芯GK104等显卡,都将是“开普勒”攻占巅峰性能的衍生。

显卡
AMD HD7970显卡的“Tahiti”GPU核心

GTX680与HD7970到底谁更强?

  在明确了GTX680的硬件规格之后,接下来由一个敏感问题也终于要正面应对了:GTX680与HD7970性能到底谁更强?从我们前面解释过的NVIDIA行事风格、“开普勒”后发优势来看,GTX680对决HD7970应该会有性能优势,近来业界的很多信息也在相互佐证这一情况,但具体的测试成绩,肯定要到GTX680正式发布后才能披露。

kepler
之前曝光的疑似开普勒测试成绩

  自2004年GeForce 6系列显卡发布以来,除了2010年的第一代“费米”架构旗舰GTX480由于设计理念过于倾向高性能运算而导致游戏性能输掉以外,在顶级显卡的性能竞争中,NVIDIA一直都占据优势,上一代的GTX580更是领先HD6790达20%以上。前面我们说过,NVIDIA GTX680核心频率已经超过了1GHz、创下了业界新高,这应该也是“开普勒”故意为之,目的当然只有一个:比对手更快。

NVIDIA;Kepler;开普勒;显卡
NVIDIA新一代“开普勒”显卡已经非常接近了

  玩家期望NVIDIA能够带来惊喜,那什么才算惊喜呢?笔者个人认为最完美的结果就是更高的性能、更低的功耗。GTX680显卡TDP功耗已经大幅度低于HD7970,而据披露游戏性能则会平均领先HD7970约10%,这个性能幅度,1058MHz的高频率应该贡献了不少成分,A卡也大可提升默认频率来应对,毕竟“Tahiti”的超频性能在业界也是有目共睹的。

NVIDIA开普勒显卡
当前对“开普勒”来说,最关键的仍然是性能表现

  因此在性能表现上,高频率的GTX 680打败默认频率的HD7970其实意义不大。GTX680的真实性能、超频性能当前还无法完全证实,但对于晚上市了快三个月的GTX680来说,性能表现绝对是最为关键的成败元素,NVIDIA自然不愿输,玩家也不希望败兴而归。考虑到“开普勒”已经非常接近了,因此接下来我们也不爆再多的料了,就让我们一起来静待“开普勒”首发评测吧。[返回显卡频道首页]

打开太平洋知科技,阅读体验更佳
前往太平洋知科技APP查看原文,阅读体验更佳
继续评论
前往APP
制作海报

网友评论

写评论
APP内评论,得金币,兑好礼

相关推荐