NVIDIA联手ARM有望将高性能计算带入下一纪元

企业站 张垞 2019-11-21 07:40

  日前,在美国举行的2019超级计算大会(SC19)上,NVIDIA携手ARM极其生态伙伴共同发布了由GPU加速的ARM服务器参考设计。

  NVIDIA创始人兼CEO黄仁勋对此表示:高性能计算正在崛起。机器学习和AI领域的突破正在重新定义科学研究方法,并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算,NVIDIA GPU与ARM的组合让创新者们能够为不断增加的新应用创建系统。

  在挑战更高性能的道路上,NVIDIA携手ARM生态的这次发布显然有利于合作伙伴及用户探索一条不同于传统x86异构计算的全新道路。

  NVIDIA与英特尔的对抗全面升级?

  在SC19大会期间,Intel首次对外宣布了使用7nm技术的Xe系列GPU产品,该产品按照晶体管规模和功耗分为LP、HP和HPC三大系列,分别面向入门级独显、AI推理应用,主流及发烧及独显市场和AI训练及数据中心应用,以及高性能计算应用。

  显然,对于由大量爆发的由AI驱动的异构计算市场而言,Intel的产品是具备相当吸引力的。这一方面源自于对单一厂商(NVIDIA)控制大部分市场的担忧,另一方面用户也有望通过Intel的One API战略及OpenVINO工具集来获得横跨CPU与GPU的统一、高效变成体验。

  而这对于目前在AI应用方面具备统治力的NVIDIA来说无疑是一个巨大的威胁。Intel对消费及AI、HPC市场的全面入侵显然会对NVIDIA的市场根基造成巨大影响。

  笔者认为,携手ARM推出相关的服务器参考设计显然是NVIDIA回应Intel的第一步。

  NVIDIA与ARM的优势在哪?

  长期以来,ARM生态都渴望进入利润率更高的数据中心市场,从2011年左右开始便有不少企业前赴后继的推出数据中心相关产品。不过ARM生态的第一次尝试目前来看是失败的;Calxeda、SeaMicro等厂商不是烧光现金流倒闭就是被收购,就连财大气粗的高通也因为产品市场前景黯淡而潸然退场。

  不过包括ARM原厂在内的整个ARM生态并未放弃进入数据中心市场的愿景。随着Linux等操作系统开始在Kernel层面加入对ARM的原生支持,以及具备更多数据中心特性的ARM V8.1和V8.2架构的发布,ARM生态开始了对数据中心市场的第二轮远征。不仅华为、Marvell等厂商推出了自己面向数据中心市场的处理器产品,华为(TaiShan系列)、HPE(Apollo 6500系列)也推出了对应的服务器整机产品。

  另一方面,在要求更高的HPC领域,ARM凭借更灵活的授权策略也开始崭露头角。由于不少HPC需要应用在前沿科学及军事领域,不少国家都对HPC有着类似自主可控的需求,而ARM架构更灵活的架构及生产授权方式则可以满足国家对于这类HPC产品的需求。目前,包括中国、欧盟、日本等国家(区域)的E级超算都至少有一套是基于ARM架构设计的。领衔日本E级超算设计(Post-K系统以及A64FX处理器)和制造的富士通就在此次合作的名单之中。

  再者,由于需要在不同GPU之间进行频繁的数据交换及同步,因此大规模GPU加速集群在性能上对于网络效率相当敏感。通常,使用Mellanox的Infiniband能够实现60-70%的计算效率,而使用传统以太网则只达到40-50%。而如今,NVIDIA已经完成了对Mellanox的收购,这有利于二者在未来进行更好的协同,以达到更高的HPC互联效率。

  TOP500榜单中的变化

  在刚刚发布的11月TOP500榜单中,虽然TOP3相对于6月榜单没有任何变化,但我们也发现,榜单中ARM架构超算的数量却从半年前的1台增长为目前的3台。其中两台来自于HPE和Cray(HPE旗下的高性能计算企业),另外一台则来自于富士通。

  可以说在TOP500的战场上,ARM已经点燃了星星之火,未来是否能够燎原,值得期待。在这一过程中,NVIDIA强力产品的协助以及CUDA-X开发库的支持相当重要。

制作海报 分享到微信 分享到微博

网友评论

写评论

相关推荐