细观近十年的显卡制造业,无论AMD还是NVIDIA对于GPU核心的研发都未有过曾片刻停歇,更加出色的架构配合更加先进的工艺,将产品性能不断推至新的高度。然而与此同时,GPU的搭档——显存的研发却似乎遇到了瓶颈,从DDR3过渡至DDR4乃至现今的DDR5,除了频率得到提升外,其他规格并没有太多改动。好在和显存相比,GPU核心的性能往往会决定显卡的整体表现,因此大家对于显存技术的停滞也并没有过于在意。
直至2013年底,索尼和微软先后发布了PS4、XBOX ONE游戏机,向世界宣告次世代的到来,PC游戏的画质也在同一时间点展开跃进,新引擎、新技术的登场让玩家们体会到次世代游戏的魅力,同时也意识到新一轮的显卡危机正在逼近。以《GTA5》为代表的次世代游戏开始对显存提出更高要求,显卡厂商因此被迫堆叠规格,8GB显存开始成为旗舰显卡的标配,4GB版本则成为各家AIB/AIC对中端显卡的宣传点。然而历史经验告诉我们,堆叠规格往往只能治标而不是治本,显存技术的发展需要一次突破,否则将无法跟上次世代游戏的脚步。
其实早在2013年,AMD便开始计划放弃老迈的DDR5,与海力士共同研发新的HBM显存技术,通过立体堆栈的方式获得更大的位宽,从而大幅度提升显存带宽。我们知道,显存的带宽 = 位宽 x 频率 / 8,举例来说R9 290X的显存位宽是512bit,等效频率是5GB/s,那么带宽就可以通过上述公式计算出是320GB/s,如果想进一步提升这个数值,要么提升位宽,要么提升频率。对于DDR5来讲,提升频率是件非常困难的事,而提升位宽则要增加更多的显存颗粒,对于空间有限的PCB面板来说也并不实际,因此放弃DDR5并投向HBM不失为明智之举。
HBM技术的意义在于让显存“站起来”,将平面扩展转为向上延伸,在占地面积相同的基础上实现数倍于传统显存的存储容量以及位宽。这项技术的研发难度虽然很大,但进展的却十分顺利,仅用了两年时间,首款采用HBM显存的显卡便已问世,它便是AMD的新一代旗舰产品Fury X。得益于先进的立体堆栈设计理念,Fury X的显存位宽达到了4096bit,远远超过DDR5的512bit,因此整体带宽也来到了512GB/s。与此同时,我们也看到了HBM所提供的另一项福利——更小的PCB。作为一款拥有4096个流处理器的庞大核心,Fury X的长度仅19.5厘米,而相同定位的GTX 980 Ti则长达28厘米,孰优孰劣一目了然。
事实上,HBM的潜力不止于此,在Fury X发布几个月后,体积更小的R9 Nano正式发布。这款显卡保留了Fury X几乎全部的规格,包括4096个流处理器、64个ROPS、4096bit/4GB显存,而长度则进一步压缩至15厘米。和Fury X的另一个不同之处在于,R9 Nano仅需要单8Pin + 普通风冷即可满足供电和散热方面的需求,TDP下潜至175W,这当中HBM技术功不可没。
低功耗、低发热量的秘密在于HBM采用的2.5D封装方式,显存颗粒与GPU核心通过Base Die(或称为中介层)来进行连接,相比于真正意义上的3D垂直封装,2.5D的形式的先期频率和带宽相对较低,但与之相对应的,HBM因此而获得了更低的工作电压,在能耗及发热表现更加出色,而且对于现阶段技术而言更容易实现,能够实现大批量生产。
从Fury X以及R9 Nano的表现来看,HBM显存技术无疑取得了成功,小身材、大能量成为了可能。而在明年,HBM二代规格将会问世,家族代号为“北极群岛”的新一代显卡将具备16GB的HBM2显存,总带宽将达到1TB/s。如此庞大的容量对于玩游戏来说已经绰绰有余,届时我们不妨憧憬一下,当显存带宽不再成为瓶颈后,显卡是否会延伸出其他用途?体积能否更加小巧?笔记本的图形性能能否大跨度前进?相信不用多长时间,AMD就会告知我们答案。
