向“内存墙”重拳出击英特尔至强6为多场景应用再提速

轻聊 2024-12-09 11:09:33

企业站

英特尔在2024年9月发布了代号为Granite Rapids的新一代至强6性能核处理器。这款处理器可以支持超过128个性能核，专为AI、数据分析和科学计算等计算密集型任务设计。随着处理器计算能力的飞速发展，相对提升较慢的内存带宽已经成为了影响系统整体性能的短板，特别是在服务器领域尤为明显。

内存带宽迎来突破 MRDIMM正当其时

“内存墙”的存在时日已久，业界也一直在从多方面着手改善这一状况。从提高内存总线带宽，内存工作频率，内存传输倍率这三个要素上来提高内存带宽，并在内存等待时间及其屏蔽技术上做进一部优化。

“事实上，MRDIMM从原型设计到如今正式发布已经有很多年了，之所以在至强6这一代上提供MRDIMM的支持，首先是基于对性能和收益的平衡，并且和现有DDR5实现兼容。”英特尔技术专家在近日谈到英特尔至强6首次支持MRDIMM技术时如是说道。

在已经推出的第一代8800MT/S带宽的8800MT/S产品上，其相比使用DDR5 6400MT/S规格的内存产品提高了约38%。这种带宽的提升为诸如AI等内存带宽敏感型应用带来的提升非常可观：在英特尔的展示中，某些应用优化较好的场景下其实际性能提升达到了33%，已经非常接近于理论带宽的提升值。

在谈到构建MRDIMM这一创新产品的工作原理时，英特尔技术专家表示传统RDIMM内存大多都有性能和容量两个阵列，从而实现性能和容量的平衡。但在一个读写的周期，只有一个阵列是活跃的，另一个则处于闲置状态。为此，英特尔技术团队设想是否可以让两个阵列同时处于活跃状态？通过在内存模块上放置一个小型的多路复用器芯片，从而创建一个数据缓冲区实现了两个内存阵列的同步操作。

“原理看起来并不复杂，但是在工程实现阶段却有着许多问题需要解决。通过与RDIMM厂商的大量创新协作，最终实现了与传统RDIMM一致的RAS特性。”英特尔技术专家表示，目前MRDIMM已经纳入了JEDEC标准，按照当下路线图预计在未来可以在8800MT/S的基础上实现翻倍的带宽性能，从而更好的满足下一代处理器的性能需求。

更高的频率通常意味着更大的能耗以及发热量的提高，这是否意味着将改变现有的散热方式？“MRDIMM相较于普通RDIMM会有一定的功耗提升，MRDIMM使用风冷也是可行的。OEM系统厂商通常会对所有关键散热部件进行统一设计，因此主流的液冷服务器设计已经充分考虑了内存部分的散热需求。尤其是在单颗CPU功耗达到500W，GPU功耗普遍超过700W的今天，液冷已经成为数据中心领域解决散热问题的优选。”

多种内存优化方案充分释放计算性能

正如英特尔技术专家所言，MRDIMM旨在优化内存带宽敏感型应用，但其他场景应用可能有更适合的技术。因此，英特尔也在更多方面探索如何通过内存形式来优化计算效率。比如在英特尔至强CPU MAX系列上，为最大程度提高带宽，英特尔将HBM内存通过封装工艺将其与CPU进行集成，这种方式的成本较高，而类似的设计在英特尔Gaudi也有所采用。相比较该类方案，MRDIMM方案的容量更大，成本也更低，其面对的场景泛用性更广。

另外，在一些对于内存带宽与性能并无高要求的场景下，基于PCIe协议构建的CXL方案则是一种兼具灵活性与高性价比的解决方案。随着CXL生态的发展，这意味着用户可以用一些价格相对较低的设备来支撑其业务系统，如在远端部署CXL内存池，在近端可以用CXL内存扩展器(memory expander)。据悉，在实际客户测试中，某些经过优化的场景，CXL方案可以达到90%-95%的性能指标。在此前举办的OCP CHINA活动上，英特尔与阿里云就展示了CXL的应用案例，其核心目标是在满足性能SLA的基础上，提供更具性价比的解决方案。

生态伙伴协力加速产品技术场景落地

值得一提的是，MRDIMM的发展相当迅速，包括美光、海力士、三星等公司已经可以批量供应第一代DDR5 8800MT/S产品。此外，瑞萨已在近日宣布将在2025年第一季度投产第二代DDR5 12800MT/S MRDIMM芯片组。英特尔技术专家也在访谈中表示，MRDIMM有望在未来两-三年内迎来翻倍的内存带宽，且容量也会随着介质本身的演进而得到进一步提升。

英特尔至强6性能核处理器作为首款支持MRDIMM方案的产品，不仅可以为包括传统深度学习和推荐系统这类对内存带宽敏感型的AI工作负载加速；还可以为客户提供兼具灵活性与高性价比并满足SLA验证的内存解决方案。多种内存扩展方案也进一步促使英特尔至强6性能核处理器可以在更广泛的应用场景中提供前所未有的“至强”体验。

点击展开全文