英特尔在2024年9月发布了代号为Granite Rapids的新一代至强6性能核处理器。这款处理器可以支持超过128个性能核,专为AI、数据分析和科学计算等计算密集型任务设计。随着处理器计算能力的飞速发展,相对提升较慢的内存带宽已经成为了影响系统整体性能的短板,特别是在服务器领域尤为明显。
内存带宽迎来突破 MRDIMM正当其时
“内存墙”的存在时日已久,业界也一直在从多方面着手改善这一状况。从提高内存总线带宽,内存工作频率,内存传输倍率这三个要素上来提高内存带宽,并在内存等待时间及其屏蔽技术上做进一部优化。
“事实上,MRDIMM从原型设计到如今正式发布已经有很多年了,之所以在至强6这一代上提供MRDIMM的支持,首先是基于对性能和收益的平衡,并且和现有DDR5实现兼容。”英特尔技术专家在近日谈到英特尔至强6首次支持MRDIMM技术时如是说道。
在已经推出的第一代8800MT/S带宽的8800MT/S产品上,其相比使用DDR5 6400MT/S规格的内存产品提高了约38%。这种带宽的提升为诸如AI等内存带宽敏感型应用带来的提升非常可观:在英特尔的展示中,某些应用优化较好的场景下其实际性能提升达到了33%,已经非常接近于理论带宽的提升值。
在谈到构建MRDIMM这一创新产品的工作原理时,英特尔技术专家表示传统RDIMM内存大多都有性能和容量两个阵列,从而实现性能和容量的平衡。但在一个读写的周期,只有一个阵列是活跃的,另一个则处于闲置状态。为此,英特尔技术团队设想是否可以让两个阵列同时处于活跃状态?通过在内存模块上放置一个小型的多路复用器芯片,从而创建一个数据缓冲区实现了两个内存阵列的同步操作。
“原理看起来并不复杂,但是在工程实现阶段却有着许多问题需要解决。通过与RDIMM厂商的大量创新协作,最终实现了与传统RDIMM一致的RAS特性。”英特尔技术专家表示,目前MRDIMM已经纳入了JEDEC标准,按照当下路线图预计在未来可以在8800MT/S的基础上实现翻倍的带宽性能,从而更好的满足下一代处理器的性能需求。
更高的频率通常意味着更大的能耗以及发热量的提高,这是否意味着将改变现有的散热方式?“MRDIMM相较于普通RDIMM会有一定的功耗提升,MRDIMM使用风冷也是可行的。OEM系统厂商通常会对所有关键散热部件进行统一设计,因此主流的液冷服务器设计已经充分考虑了内存部分的散热需求。尤其是在单颗CPU功耗达到500W,GPU功耗普遍超过700W的今天,液冷已经成为数据中心领域解决散热问题的优选。”
多种内存优化方案 充分释放计算性能
正如英特尔技术专家所言,MRDIMM旨在优化内存带宽敏感型应用,但其他场景应用可能有更适合的技术。因此,英特尔也在更多方面探索如何通过内存形式来优化计算效率。比如在英特尔至强CPU MAX系列上,为最大程度提高带宽,英特尔将HBM内存通过封装工艺将其与CPU进行集成,这种方式的成本较高,而类似的设计在英特尔Gaudi也有所采用。相比较该类方案,MRDIMM方案的容量更大,成本也更低,其面对的场景泛用性更广。
另外,在一些对于内存带宽与性能并无高要求的场景下,基于PCIe协议构建的CXL方案则是一种兼具灵活性与高性价比的解决方案。随着CXL生态的发展,这意味着用户可以用一些价格相对较低的设备来支撑其业务系统,如在远端部署CXL内存池,在近端可以用CXL内存扩展器(memory expander)。据悉,在实际客户测试中,某些经过优化的场景,CXL方案可以达到90%-95%的性能指标。在此前举办的OCP CHINA活动上,英特尔与阿里云就展示了CXL的应用案例,其核心目标是在满足性能SLA的基础上,提供更具性价比的解决方案。
生态伙伴协力 加速产品技术场景落地
值得一提的是,MRDIMM的发展相当迅速,包括美光、海力士、三星等公司已经可以批量供应第一代DDR5 8800MT/S产品。此外,瑞萨已在近日宣布将在2025年第一季度投产第二代DDR5 12800MT/S MRDIMM芯片组。英特尔技术专家也在访谈中表示,MRDIMM有望在未来两-三年内迎来翻倍的内存带宽,且容量也会随着介质本身的演进而得到进一步提升。
英特尔至强6性能核处理器作为首款支持MRDIMM方案的产品,不仅可以为包括传统深度学习和推荐系统这类对内存带宽敏感型的AI工作负载加速;还可以为客户提供兼具灵活性与高性价比并满足SLA验证的内存解决方案。多种内存扩展方案也进一步促使英特尔至强6性能核处理器可以在更广泛的应用场景中提供前所未有的“至强”体验。
网友评论