2024年6月6日,英特尔发布了全新的至强6700E系列处理器。相对于上一代的“第五代至强可扩展处理器”,不仅命名方式迎来了改变,其内部架构思路也产生了重大变化。把这么多“6”集于一身,至强6到底6不6呢?
更多核心、更高能效!E核终于进入数据中心
英特尔6月6日发布的至强6700E系列处理器主打能效、性能和核心密度,之所以能够在3个维度做到兼顾平衡,主要源自英特尔首次引入数据中心市场的E核设计。
E核中的E代表Efficiency,即能效。相对于尚未发布的6900P系列所采用的P核(Performance Core),E核在L2缓存、L3缓存、数据缓存、解码器宽度、乱序执行能力、浮点运算能力和AVX指令集等方面进行了相应的优化,并且取消了对超线程的支持;而换来的则是核心面积和能耗的大幅缩减。由此,英特尔便能在单颗处理器中集成更多核心。
目前,英特尔至强6700E系列处理器包含7个型号,物理核心数量最高可达144个;在核心密度上已经超过了竞争对手的128核产品。换而言之,全新的英特尔至强6处理器能够为数据中心用户提供前所未有的机架密度。
对此,英特尔数据中心与人工智能事业部副总裁兼至强能效核产品线总经理Ryan Tabrah也在发布现场表示:相较于已经处于生命周期末段的第二代至强可扩展处理器而言,新的至强6700E系列处理器仅用66个机柜就能提供过去200个机柜的内核数量。不仅节省采购、运维和机房空间所对应的成本,更能在4年的标准硬件使用周期里,带来8万兆瓦(8千万度)电力的节省,相当于减少3.4万吨二氧化碳排放。
并且,作为真正为能效场景而优化的内核,至强6700E系列也能以更低的功耗来实现相同的业务负载。在与搭载双路第五代至强可扩展处理器8592+(64核,128线程,TDP 350W)的服务器对比中,双路至强6780E平台(144核,144线程,TDP 330W)在40-60%负载时,功耗总体比8592平台低280W,并且能够获得18%性能提升。
更多的核心、更低的运行功耗,如此规模的运营成本降低对于广大云服务提供商而言无疑有着巨大的吸引力。对此,金山云高级副总裁刘涛表示:相对有现有服务器产品,英特尔至强6能够带来300%的综合性能提升和60%的性价比提升。并且纯粹由物理核心构成的计算资源池也更有利于云服务提供商进行性能预测和管理,避免用户遇到物理核心满载所导致的宕机与崩溃情况,提升最终的应用体验。
不只是核心多!至强6性能提升超预期
虽然E核是通过底层半导体结构的优化来实现更多核心数量、更高能效,但相对于前代产品,使用纯E核来构建的至强6700E系列处理器仍旧有着巨大的性能优势。
深色为绝对性能对比,浅色为每瓦特性能对比
在与上代产品的对比中,新的至强6系列处理器能够在通用计算、数据库、媒体和网络等应用中获得显著的性能提升,即便在面向网页的服务器端JAVA性能方面,至强6的整体性能也有前代的94-95%;而在至强6更有优势的媒体转码应用中,性能提升则能达到26-42%。
而在数据库应用中,至强6700E系列处理器则能在专为大规模并行处理优化的南大通用Gbase 8a MPP数据库中,实现182%的性能提升和135%的能效提升。
换言之,至强6700E系列所使用的E核虽然经过了优化,但整体性能提升依旧亮眼,足以担当大任。并且在核心数量大幅增加且每瓦特能效更高的情况下,用户收益也将整体登上一个新台阶。
CXL 2.0带来三种内存模式,速度与容量不再难选
近几年,行业对CXL(Compute Express Link)技术的关注度非常高。凭借纳秒级的延迟,CXL有实力为服务器提供内存容量扩展的全新路径。而在新的至强6中,英特尔则提供了对CXL 2.0技术的支持。虽然CXL 2.0与此前的1.x版本一样,带宽同为32GT/s,但CXL 2.0却新增了一系列面向安全、合规、高可靠方面的特性,使之更适合应用在当代数据中心环境中。当然,CXL技术也可用于安装智能网卡(Type 1设备)和GPU等协处理器(Type 2设备)。
至强6700E系列处理器支持两种CXL内存模式,即CXL Numa Node模式和Flat Memory模式。CXL Numa Node模式允许将CXL内存设置为独立的NUMA节点,继而提升多路服务器系统的远端内存访问性能;而Flat Memory模式则允许操作系统和应用程序直接访问一个容量为传统内存+CXL内存总和的内存池(传统内存与CXL内存的容量比为1:1),从而降低大内存系统的整体成本。很显然,Flat Memory模式也是英特尔主推的CXL内存应用模式。
在MongoDB测试中,500万条数据和1300万条数据的两组数据库吞吐量测试,Flat Memory模式的系统性能分别为传统内存系统性能的99%和98%,缓存Miss率均趋近于零。即便是4800万条数据的超大规模MongoDB数据库,256GB传统内存+256G CXL内存组合的性能也能达到512GB纯DRAM系统的90%,缓存Miss率约为8%。
换言之,在绝大多数场景下,至强6的CXL 2.0技术都能在保持性能几乎不变的情况下带来内存成本的大幅降低。
而今年第三季度推出的性能核至强6处理器还将新增一种Hetero Interleaved模式。该模式允许操作系统和应用向传统内存和CXL内存中交错写入数据,如此系统便可充分利用内存总线和CXL总线的带宽,以实现更高的性能和吞吐。英特尔表示,Hetero Interleaved模式将使系统内存带宽提升40%左右,助力科学计算、仿真等一系列内存带宽敏感型应用获得更好的性能。
对此,南大通用赵伟也表示:对于数据库应用而言,新一代至强6平台对大内存的支持是对用户的重大利好。传统数据库的最大瓶颈在于I/O和物理内存的不匹配,而大内存可以极大地缓解这一问题。以往,数据库通常只保留三个月以内的热数据,而将更旧的数据转移至离线存储。但现在,随着数据价值的日益凸显,用户希望服务器能够拥有尽可能多的内存,以便存储更多的数据,继而更好地挖掘数据资产的价值。而更大内存的服务器系统将很好地支持用户实现这一目标。
至强6,封装技术更6
除了配备能效核的至强6700E系列处理器,英特尔还将在今年第三季度发布配备性能核的至强6900P系列处理器,并在明年第一季度继续扩充6700和6900的产品序列。而从英特尔给出的处理器核心示意图中我们也不难发现,无论6700还是6900系列,其架构都是由1-3个计算tile+2个IO tile组成。
其中,计算tile可根据E核或P核、核心数量的多寡分为数个种类;而IO tile也可根据其包含的DSA(Data Streaming Accelerator,数据流加速器,用于大规模的内存数据迁移、复制、校验、去重等场景)、IAA(In-Memory Analytics Acceleator,内存分析加速器,用于内存数据搬运、内存数据压缩和解压缩场景)、QAT(QuickAssist Technology,用于数据加密和压缩、解压缩场景)等结构的数量不同分为多个种类。
显然,通过不同种类的计算tile和IO tile组合,英特尔便能快速产出新的处理器型号,灵活满足市场需求变化。
相对于第五代至强可扩展处理器两个相同Tile互联的架构设计,英特尔在至强6中的tile功能划分无疑更加合理。而这也意味着英特尔先进封装技术在成本、可靠性和灵活性等方面已经更上一层楼,能够应对更复杂的处理器package设计。换而言之,未来的英特尔处理器产品也将变得更丰富、更细分,而英特尔的前进步伐也将变得更轻盈、更灵活。
作为至强6系列的开胃菜,6700E系列处理器的确让市场和用户看到了变化;更强的性能、更多的核心、更好的能效……这些都是当下数据中心用户所关心的重点。而更重要的是,先进封装技术的进一步落地应用也给了市场足够丰富的想象空间,让我们可以期待一个更迅捷的英特尔。
产品6,技术6,未来更6;英特尔的这波操作着实配得上一句“老铁666” :)
网友评论