千万玩家心悬一线:“开普勒”显卡大揭秘

阿乐 2012-03-14 16:16:52

显卡应用

1从NVIDIA的做事风格说起回顶部

期待奇迹，期待开普勒：

　　这几天，关注显卡的玩家内心肯定都会有一种难以抑制的躁动，行业里面透露出来的各种信息，都在强烈的暗示着NVIDIA的下一代28纳米“开普勒”显卡终于要到来了。“开普勒”的硬件规格，当前“先知”们已经基本达成了一致的观点，但“开普勒”的真实性能却依然有点“虚无缥缈”，在无休止的猜测、“烟幕弹”背后，透露出来的玩家心态其实出奇的一致：期待NVIDIA迟到了三个月的“开普勒”能够创造一个横空出世的“奇迹”，为行业注入久违的激情与活力，为巅峰图形性能带来一场精彩的“翻盘”之战。

“开普勒”能否创造奇迹？

　　在平淡的生活中，大家都期望出现创造奇迹的英雄，对于计算机图形技术行业、全球亿万玩家而言，“开普勒”就正是这个被赋予众望的角色。时至今日，“开普勒”距降临地球已经无限接近了（具体发布日期已经是一个众所周知的秘密），为了满足广大玩家的好奇心、提前迎接“开普勒”，我们今天就将这款业界透露出的各种信息进行了一次汇总，并根据我们的经验进行一番鉴别，体前来一场“开普勒”大爆料，大家一起来权且看看。

“开普勒”即将降临地球

从NVIDIA的做事风格说起：

　　判断“开普勒”的性能实力，可以先从NVIDIA的做事风格说起。与Intel、AMD这种成熟的IT巨头不同，NVIDIA还是一家个人风格非常明显的公司，更类似于乔布斯时代的苹果公司。NVIDIA的创始人兼“主教”黄仁勋，给人的感觉是有强烈的挑战性和开拓性，既讲究实力，更远比竞争对手擅长于利用公关、媒体。这种做事风格，让活跃在“Wintel”两巨头间的NVIDIA总能有征服业界的实力产品、有需要对手们时刻紧盯提防的“绩优”概念、有创造性的发展开拓方向，而且总能为行业带来惊喜和意外，让业界每次都主动对NVIDIA充满期待。

NVIDIA的“主教”黄仁勋

　　计算机图形芯片（GPU）是NVIDIA的起家行业，早在十多年前，NVIDIA凭借强悍的TNT、GrForce图形芯片推翻统治业界的3dfx"Voodoo"王朝以来，NVIDIA在图形芯片技术、架构设计理念上就一直走在业界最前沿。虽然相对于竞争对手，NVIDIA的产品可能报价更贵，但却始终是更主流玩家的首选。

NVIDIA在图形芯片技术、架构设计理念上一直走在业界最前沿

　　除了在在2003年的GeForce FX时代，NVIDIA因为GPU设计理念过于“前卫”而被ATI反超以来，随后的GeForce 6、7、8三代产品都以“激进”的大幅度性能提升策略，令业界意外频频。进入2006年，随着ATI被AMD收购，A卡产品策略打起了“太极拳”，不再与NVIDIA硬碰硬，但灵活的“小芯片”策略、加以一度的制程优势、CPU平台带动，却对NVIDIA的市场份额构成了严重威胁，加上NVIDIA的“穿越性”的“通用运算”理想由于巨头盯防而在高性能运算领域开拓缓慢，形成了N卡、A卡至今的“相持”局面。

“开普勒”这个名字第一次在公开场合露面

　　在2010年的NVIDIA GTC大会上，“开普勒”这个名字第一次在公开场合露面，定位是继GeForce GTX400、GTX500“费米”架构之后的全新一代GPU芯片。从上面的图上我们可以看出，“开普勒”显卡的每瓦特计算性能在“费米”的两倍以上，因此即使最终的“开普勒”功耗低于GTX580，但运算性能大幅超越GTX580应该问题不大。

考虑到NVIDIA的行事风格，“开普勒”极有可能将带来翻盘之战

　　然后我们从竞争对手方面看，AMD新一代“南方群岛”架构旗舰显卡HD7970已经在2012年1月9日正式发售，平均性能领先GTX580约30%，在对手性能已经完全透明化的情况下，“开普勒”比对手晚发布了近三个月，考虑到NVIDIA的行事风格，加上这种“黄雀在后”的优势，都正是大家期望“开普勒”能够带来翻盘之战、对“开普勒”狂热的原因所在。>>

2“开普勒”的硬件规格如何回顶部

“开普勒”的硬件规格如何？

　　这个问题现在其实已经没有多少悬念了，因为近来从国内外各种渠道透露出来的信息，都在相互佐证着同一种说法，而且从下面这张我们最新拿到的规格表来看，“开普勒”的命名、详细硬件规格已经一览无遗了，从这之中我们可以得到非常多的“靠谱”信息。

GTX680硬件规格

28纳米工艺，催生GPU进入“GHz”时代：

　　首先，“开普勒”架构首款旗舰芯片“GK104”显卡的正式名称将是GeForce GTX680。GK104芯片采用台积电28纳米制程生产，但晶体管蚀刻工艺与第一款试水28纳米的AMD“Tahiti”芯片又有所不同，“Tahiti”芯片去年就已经开始量产，当时台积电手下能够满足AMD需求的只有28nm HKMG HPL方案，这也是一种高K金属栅极技术，在提升运行频率与防漏电低功耗之间能够获得较好的均衡，芯片良品率也比较高。

台积电28纳米硅晶圆

　　而比“Tahiti”晚了三个月的GK104芯片，使用的很可能是后来才成熟的28nm HKMG HP高性能工艺，这种工艺能够达成更高的核心运行频率，因此“开普勒”架构旗舰显卡GTX680的发布时的核心频率就已经在1058MHz了，创下了A/N公版显卡频率之最。日后简化版轻装上阵的中低端“开普勒”芯片（GK107？），将肯定能够爆出更夸张的运行频率。

“开普勒”谍照（上图）：NVIDIA GK104与AMD Tahiti芯片对比

256bit显存，改进的显存控制器：

　　早在上周，业界就得到了一致消息：GTX680显卡将会采用256bit显存控制器，这比GTX580“缩水”不少。在对手的这代HD7970都已经升级到384bit显存位宽的情况下，NVIDIA却降至256bit显存位宽，这能否满足“开普勒”的性能需求？

“开普勒”只有8颗显存芯片，的确是256bit显存位宽

　　在前几代产品中，显存控制器一直是A卡的优势，N卡显存频率最高也只达到了4100MHz。但GTX680的等效显存频率达到了创纪录的6008MHz，超过了HD7970 5500MHz的水准，NVIDIA终于在显存频率方面爆发了。GTX680显卡标配2GB显存，比GTX580 1.5GB的容量有了提升，虽不及HD7970的3GB来的“海量”，但估计二者不会因为显存容量造成性能差距，而且2GB显存，对付未来两三年的游戏也都仍然是绰绰有余了。

“开普勒”在显存频率上爆发了

　　高频率的确可以弥补较低的显存位宽的缺陷，但NVIDIA自减显存位宽的做法，仍然让业界至今无法理解，难道传言中由于对手性能不给力、GTX670Ti临阵被刷成了GTX680的消息属实？这不禁又让人浮想联翩，看来有待于“开普勒”发布后NVIDIA给出解释了。

3三倍的处理器，但放弃分频设计？回顶部

1536个流处理器，三倍于GTX580：

　　根据业界泄露出来的消息，GK104芯片集成了32亿个晶体管，核心面积估算大约320平方毫米，低于Tahiti 43亿晶体管、365平方毫米的规格。但两款显卡的核心架构并不一致，而且涉及到流处理器工序、架构运算效率，显卡的实际性能远远不能简单凭晶体管数量下结论。GK104芯片内建了1536个流处理器，数量是GTX580的整整三倍，如此激进，令人始料未及，但却很像NVIDIA一贯的行事风格。

GK104芯片内建1536个CUDA流处理器

　　GK104芯片内建的1536个CUDA流处理器，被分配成16组SM阵列，每组SM包含96个流处理器，接下来的GTX660、GTX650、GTX620...流处理器数量都有可能会比上代产品至少翻一倍。在核心规模上，GK104比GF110的确复杂很多，但借助28纳米工艺，GK104芯片核心面积大约只有320平方毫米，远远小于GF110 520平方毫米的规模，也小于对手“Tahiti”的365平方毫米。

GF110芯片内建512个CUDA流处理器

　　GK104芯片的晶体管数量是32亿个，比GF110芯片30亿个的规模高不了多少，这就又产生了一个很的疑问：三倍的流处理器“建筑”规模，却只多用了7%的晶体管“砖头”，NVIDIA是如何做到的？看来“开普勒”的确大幅度更改了“费米”的架构组合，这也正是接下来我们推测“开普勒”放弃了Shader分频设计的一大依据。

放弃Shader分频设计，TDP功耗降至195W：

　　而从GTX680显卡195W的TDP功耗看来，GK104芯片在效率优化上，要比GTX580进步巨大，28纳米工艺在提升芯片运行频率、缩小核心面积、增加流处理器数量方面的神奇魅力由此可见一斑。加上GK104晶体管数量不多，由此催生了业界的另一个猜想：“开普勒”很有可能放弃了Shader着色器分频设计。从2007年的GeForce 8系列显卡开始，NVIDIA GPU芯片的Shader着色器运行频率就一直数倍于核心频率，“费米”架构采用的就是双倍方案。更高的Shader频率，能够大幅提升芯片的运算性能，但却也但来了巨大的发热量。

早期泄露出来的GTX680显卡设计图：堆叠式双6pin外接供电接口

　　Shader分频设计是一把双刃剑，而“开普勒”可能无需分频设计，已经能够凭借1536个流处理器获得性能优势，而且能够保持195W的TDP功耗，这在近几代旗舰卡中是一项了不起的成就，发烧显卡有望从此不再“发烧”。

泄露出来的GTX680显卡5相核心供电电路，规格/用料都不再“发烧”

　　GTX680显卡的1536个流处理器、195W TDP功耗当前都基本可以确定，但放弃Shader分频设计却还只是一个猜想，毕竟性能的诱惑，让NVIDIA不大可能向功耗妥协。何况AMD HD7970显卡TDP功耗仍然有280W，“开普勒”的发挥空间还比较足。因此，“开普勒”是否继续采用Shader分频设计，尚有待于大家进一步验证。>>

4“开普勒”与DX11.1/PCI-E 3.0回顶部

将支持DX11.1标准：

　　DirectX（简写DX）11.1支持与PCI-E 3.0接口。DirectX API是微软发布的游戏接口，可以看作是一个游戏渲染技术/建模技术的汇集，微软借助DirectX API规范，控制着PC游戏/显卡硬件行业，每代DX版本的更新，都会引起显卡行业的更新换代、巨头角力、甚至惊涛骇浪。当前，Windows XP平台上一般运行的是DX9.0c，而Windows 7平台上则运行的是DX11，预计2012年底Windows 8正式版发布后，将会为玩家普及DX11.1标准。

DX可以看作是一个渲染技术/建模技术的汇集

　　DX可以看作是一个渲染技术/建模技术的汇集，新版本的DX可以支持游戏实现更多、更新的特效，而且可以提升显卡执行某些特效时的运算效率，因此，对DX版本的支持，不仅代表着游戏画质的层次，更代表着显卡硬件的层代。当前，业界游戏大作已经基本普及DX11，NVIDIA GTX500、AMD HD6000系列显卡也都已经是第二代DX11显卡了。

DX11曲面细分技术实际游戏画面（Crysis 2）

　　DX11.1最大的改进就是将3D立体显示技术正式写入了D3D API，让开发者可以通过D3D渲染实现3D显示，而不再像之前一样需要绕过D3D API而使用四倍缓冲器或驱动/中间件来实现的。在DX11.1中，3D立体显示技术将成为成为一种通用标准，游戏开发也将更加简单。但PC 3D显示技术当前远未步入普及阶段，毕竟这还需要克服显示器、3D眼镜等一大堆难题。

电脑3D显示技术要想普及，还需要克服显示器、3D眼镜等一大堆难题

　　DX11.1还支持TIR目标独立光栅化技术，优化了GPU 双精度浮点运算效率，增强了图形与视频之间的操作灵活性，但这都只是一些小修小补的版本修订，基本无关游戏性能痛痒，但也正因为如此，为新一代显卡带来DX11.1支持也应该不存在什么难度。HD7970已经为DX11.1作好了准备，“开普勒”倘若在这方面被人抓到了把柄，估计就会重演DX10.1时代被对手针对的囧况。

AMD HD7970：支持DX11.1规范、PCI-E 3.0接口

　　因此，在DX版本支持问题上，显卡厂商都大意不得。虽然没有明确消息，但“开普勒”支持DX11.1肯定不会有意外。而且NVIDIA本身就是电脑3D显示技术的先行者，在过去的三年时间内已经推出了两代3D眼镜产品，DX11.1将3D游戏开发接口标准化，更是正中NVIDIA下怀。

采用原生PCI-E3.0接口设计：

　　PCI-E 3.0标准主要是将信号传输率提高到8GT/s，两倍于PCI-E 2.0，同时伴随有一系列的信号稳定性优化。由于PCI-E 2.0接口带宽都还远未成为显卡的性能瓶颈，因此当前PCI-E 3.0接口最大的意义正在于稳定性提升，对于追求极速的PCI-E固态硬盘来说可能更有用武之地。

当前只有X79主板平台可以支持PCI-E 3.0

　　当前只有Intel X79主板平台可以支持PCI-E 3.0，X79主板需要搭配“天价”SNB-E处理器使用，而且当前PCI-E 2.0接口的数据带宽都还远未成为显卡的性能瓶颈，在PCI-E 3.0接口下，当前顶级显卡的实测性能也仅有极其微弱幅度的增长，因此，PCI-E 3.0接口其实也是噱头大于实际。

2004年NVIDIA需要借助桥接芯片才能支持PCI-E接口

　　PCI-E 3.0规范早在2010年就已经完成，因此NVIDIA为新显卡加入PCI-E 3.0支持也并非难事。PCI-E 3.0接口日后必将成为新一代主板、显卡的宣传噱头。回想早在2004年，NVIDIA由于需要借助桥接芯片才能支持PCI-E接口，而被ATI的原生PCI-E方案嘲笑“有路何必搭桥”，相信“开普勒”不会在这方面再犯错。>>

5NVIDIA正式转战“小芯片”策略回顶部

NVIDIA正式转战“小芯片”策略：

　　从195W TDP功耗、32亿晶体管、320平方毫米核心面积等规格来看，GK104对NVIDIA将会是一次巨大的战略转变：N卡将从此启动“小芯片”策略，仿效AMD收购ATI之后的做法。GK104核心面积与2007年发布的G92差不多，比起GF110 520平方毫米的庞大规模，小了不是一点半点。

G92与GK104芯片对比

　　要理解什么是“小核心”策略，就要先回到2006年AMD收购ATI之后。当时，A卡为了应对在性能大战中长期的劣势局面，而首先“发明”了“小芯片”策略，将HD3000系列显卡从定位中端的HD3850/HD3870开始研发，力争在中端主力市场上取得性能优势，而后再利用小芯片“单卡双芯”方案来争夺高端市场。这种“田忌赛马”的策略，让HD3850/HD3870获得了很大的成功，而后A卡的“小芯片”策略在后续产品上一再上演，让背着巨型架构规模、研发困难、高成本、高发热量的N卡旗舰GTX280、GTX480、GTX580日益“电老虎”化，形势逐渐被动。

GTX580显卡的GF110是一颗“滚烫”的大核心

　　GK104效仿竞争对手的“小芯片策略”，对NVIDIA来说将是一次巨大的转折，是N卡脱离被动局面、走上高能效之路的“一盘很大的棋”。从“开普勒”195W TDP功耗、320平方毫米核心面积、1GHz以上核心频率等方面的规格来看，NVIDIA这一招“小芯片”策略打的还是挺漂亮，日后的GK110、双芯GK104等显卡，都将是“开普勒”攻占巅峰性能的衍生。

AMD HD7970显卡的“Tahiti”GPU核心

GTX680与HD7970到底谁更强？

　　在明确了GTX680的硬件规格之后，接下来由一个敏感问题也终于要正面应对了：GTX680与HD7970性能到底谁更强？从我们前面解释过的NVIDIA行事风格、“开普勒”后发优势来看，GTX680对决HD7970应该会有性能优势，近来业界的很多信息也在相互佐证这一情况，但具体的测试成绩，肯定要到GTX680正式发布后才能披露。

之前曝光的疑似开普勒测试成绩

　　自2004年GeForce 6系列显卡发布以来，除了2010年的第一代“费米”架构旗舰GTX480由于设计理念过于倾向高性能运算而导致游戏性能输掉以外，在顶级显卡的性能竞争中，NVIDIA一直都占据优势，上一代的GTX580更是领先HD6790达20%以上。前面我们说过，NVIDIA GTX680核心频率已经超过了1GHz、创下了业界新高，这应该也是“开普勒”故意为之，目的当然只有一个：比对手更快。

NVIDIA新一代“开普勒”显卡已经非常接近了

　　玩家期望NVIDIA能够带来惊喜，那什么才算惊喜呢？笔者个人认为最完美的结果就是更高的性能、更低的功耗。GTX680显卡TDP功耗已经大幅度低于HD7970，而据披露游戏性能则会平均领先HD7970约10%，这个性能幅度，1058MHz的高频率应该贡献了不少成分，A卡也大可提升默认频率来应对，毕竟“Tahiti”的超频性能在业界也是有目共睹的。

当前对“开普勒”来说，最关键的仍然是性能表现

　　因此在性能表现上，高频率的GTX 680打败默认频率的HD7970其实意义不大。GTX680的真实性能、超频性能当前还无法完全证实，但对于晚上市了快三个月的GTX680来说，性能表现绝对是最为关键的成败元素，NVIDIA自然不愿输，玩家也不希望败兴而归。考虑到“开普勒”已经非常接近了，因此接下来我们也不爆再多的料了，就让我们一起来静待“开普勒”首发评测吧。[返回显卡频道首页]

制作海报

网友评论

写评论

APP内评论，得金币，兑好礼

千万玩家 心悬一线:“开普勒”显卡大揭秘

网友评论

相关推荐

千万玩家心悬一线:“开普勒”显卡大揭秘