一个机柜"60000"核至强 6+重构 Agentic AI 智算中心

九月原创 2026-06-08 12:01:52

企业站

由华为云驱动

2026年6月8日，英特尔在新品发布会上推出至强6+（Clearwater Forest）处理器，采用Intel 18A工艺，最高288核心，支持4智能体/核，提升AI智能体部署能力。GPU CPU配比从1:8升至1:2，反映AI计算负载结构变化。

AI计算的硬件配比正在调整，根据第三方机构数据显示，数据中心里CPU与GPU的配比从2024年的1:8，到2025年的1:4，再到当前的1:2。一年半时间之内，CPU在AI基础设施中的权重提升数倍。重要的驱动因素是AI工作负载本身的变化——训练阶段GPU承担主要计算，而智能体AI（Agentic AI）的兴起改变了计算负载的分布。

传统推理是单轮交互的方式，采用接收指令、生成答案、结束流程的方式。智能体AI的运行逻辑有所不同，包括感知环境、规划步骤、调用工具、执行代码、验证结果等步骤，同时维护长周期的上下文记忆。拆解一个复杂任务涉及数十个工具的串联调用、多个子智能体的并行协调。任务编排、工具执行、上下文处理、跨域调度等，都需要用到CPU密集型负载的能力。

英特尔市场营销集团副总裁郭威在至强6+新品发布会上引用了这些数据：2025年全球Token调用总量21100万亿，2026年第一季度算力需求同比增加417%。到2031年，活跃智能体数量预计达到3.5亿个。Token消耗的指数级增长带动CPU需求线性拉升——每个智能体实例的运行都消耗CPU周期做编排和调度，部署的智能体数量与CPU需求正相关。

全球服务器CPU市场当前规模约500亿美元，郭威给出的预测是未来4到5年翻两番达到2000亿美元，中国市场占其中四分之一到三分之一。英特尔公司全球副总裁Brett Hannath也说到：到2030年，全球新部署的服务器中每10台有8台采用x86架构。CPU市场的增长由智能体AI渗透率驱动，属于结构性扩张。

Brett Hannath也介绍了智能体AI对计算架构的改变，训练阶段GPU承担主要计算负载；进入推理和智能体阶段，任务编排和系统协同的计算量超过模型推理本身。CPU承担的编排、调度、协调工作比重持续上升。配比从1:8到1:2的变化，反映了工作负载结构从训练为主转向推理和智能体为主。

英特尔18A发力：12计算模块3D堆叠，288核、576MB缓存

至强6+（Clearwater Forest）核心参数包括采用最高288个能效核，支持8,000MT/s DDR5内存，576MB末级缓存。缓存容量比上一代提升超过5倍。智能体场景中上下文切换和工具调用的频率高，更大的缓存直接提升数据命中率。

制程方面，Clearwater Forest基于Intel 18A工艺，引入两项模块。PowerVia背面供电将供电路径从芯片正面移到背面，缩短电力传输距离，降低功耗波动，提升性能一致性。RibbonFET全环绕栅极晶体管针对待机功耗做优化。发布会上同步推出的应用能源遥测技术（AET）是硬件级能力，支持工作负载粒度的实时CPU能耗监控，面向数据中心运营商的成本分摊和节能调度。

封装层面，Clearwater Forest由12个计算模块构成，通过Foveros Direct 3D封装技术堆叠在3个有源基底模块上。2个基于Intel 7制程的I/O模块通过EMIB技术互联。12个计算模块与3个基底模块之间的数据带宽由EMIB桥接承担。核心数量翻倍时I/O通道同步扩容，计算密度与I/O带宽保持线性扩展。

性能数据方面，与上一代至强相比，至强6+性能密度提升2.5倍；与竞品同级产品相比，每线程每瓦性能高出45%。在服务器整合场景中，与第二代至强可实现9:1的整合率——9台旧服务器的工作负载合并到1台新服务器上。整合率对应数据中心的空间占用、电力消耗和散热需求，9:1意味着机架数量、配电容量和制冷系统的同比例缩减。

智能体部署能力是Clearwater Forest的关键指标，至强6+每核心可运行4个智能体，单颗处理器支持超过1,000个智能体的稳定部署。英特尔在现场Demo区展示了高密度智能体集群的创建、运行和监控流程。技术基础来自三层：沙箱快速启动与稳定运行、智能体执行链路与外部工具调用的运行时延监控、系统级运维参数的全覆盖。

金山云计算研发负责人杨峰在发布会上从云服务商视角做了补充，金山云的AI Agent平台基于Serverless架构运行Agent引擎运行时，每个Agent执行的任务包括任务编排、知识库检索、记忆库管理、工具调用和自定义任务执行。杨峰指出，Agent运行时的任务负责驱动GPU请求的处理流程，CPU承担任务决策和调度功能，在AI任务场景中CPU权重明显提升。

腾讯云百万核、金山云500万QPS

实际应用案例已经非常成熟，已经覆盖云基础设施、AI Agent平台、存储系统和整机系统集成等多个维度。

腾讯云星星海实验室基于至强能效核构建的自研云服务器，已支撑腾讯多个核心业务的规模化运行。网络层面，200G直通网络配合自研智能网卡，实现3,370万PPS收发包能力和1,200万高并发连接数。虚拟化层面，热迁移技术将构建脏页速度提升20倍，异步传输virtio设备状态压缩了80%的热迁移停机时间。扩容能力方面，腾讯会议曾8天扩容100万核，QQ红包在春节期间承受3倍瞬时流量冲击。腾讯云星星海产品架构师黎洁在发布会上表示这些实例已支撑腾讯核心业务的规模化运行。

金山云SE10实例基于至强6+推出，L3缓存提升近4.9倍，作用于缓存利用率和业务响应时延。在AI Agent场景中，每颗vCPU与物理线程1:1强绑定，降低资源共享开销，能效提升10%，单核性能提升10%。核心数增加支持百级Agent实例批量托管，AI应用部署密度提高80%以上。传统Web服务场景中，HTTPS吞吐提升最高33%，支撑近500万QPS级别流量。广告推荐和热点浏览场景中，P99时延降低28%。数据库场景中，MySQL CPU性能提升52%，Redis时延降低约20%。这组数据覆盖AI Agent、Web服务和数据库三类差异化工作负载，说明至强6+的性能提升来自架构层面的整体改进。

云尖信息展示了系统集成层面的产品化能力。基于至强6 CPU开发了AP和SP两大平台，覆盖1U到10U全系列20多款服务器。AI集群侧，单机支持16到32卡GPU，覆盖6U/8U/10U形态，提供风冷和液冷方案。CPU集群柜采用整柜全液冷盲插设计，单柜20万瓦，最高支持6万个智能体的调度运行。

新华三X20000存储从存力维度切入，X20000是面向智算场景的高性能融合存储，基于至强6处理器，单节点实现200GB/s带宽和300万IOPS。在AI推理场景中，自研X Cache推理加速软件通过多级缓存池、GDS直通、零拷贝技术，将KV Cache数据的TTFT性能、TPOT性能和Token生产效率最高提升10倍以上。新华三存储产品线首席产品经理王其勇引用了两组数据：以DeepSeek V4模型100万Token上下文为例，单个用户的KV Cache压缩后需要9.6GB；全球AI推理用闪存到2031年预计达1,251亿TB。新华三下一步规划的KV专用存储，目标是单节点320GB/s带宽和微秒级时延。

阿里云实测：QAT压缩带宽提升400%，CPU核数减少75%

至强6+内置的专用加速引擎在实际业务中对TCO的影响，阿里云提供了一个量化案例。

阿里云块存储研发总监谷跃胜分享了阿里云使用至强平台QAT（QuickAssist Technology）引擎替换原有软件加CPU压缩方案的实测结果：压缩带宽提升400%，通用CPU核数减少75%。DSA定制算力在数据密集场景中，单核与多核带宽提升15%到25%。

谷跃胜同时描述了智能体应用对存储架构的影响。智能体内应用的任务被分解成多个Agent，每个Agent运行时间缩短到毫秒级，负载呈现无规律毫秒级特征。多个Agent之间需要建立协作关系，产生海量独立存储空间需求。Agent的启动时间精确到毫秒级，当算力需要综合调度时，Agent需深度休眠——在应用内存与持久化内存之间快速切换，实现百毫秒级的休眠唤醒。谷跃胜表示智能体应用还将有10倍增速，带动存储规模增长。

英特尔同步展示了IAA（内存分析加速器）在智能体沙箱场景的测试数据。集成IAA技术后，安全沙箱冷启动时间提升30%。IAA通过硬件实现的Deflate算法加速内存压缩分层，释放CPU算力，Sandbox快照延迟降低最高60%。

可以看到CPU内置的专用硬件处理压缩、加密、数据搬运等高频操作的效率，比通用CPU核心执行相同任务高出一个量级。智能体AI场景中压缩和加密操作频繁出现——KV Cache压缩、沙箱快照、数据传输加密——加速引擎的实际收益被放大。

Crescent Island：8卡跑1.6T模型

英特尔面向推理场景最新发布的GPU Crescent Island与至强6+一同亮相，对应“CPU+GPU协同”的产品组合策略。

Crescent Island基于Xe3P架构，使用LPDDR5x内存，最高配置480GB容量。8张卡在FP8精度下可运行1.6T参数的DeepSeek-V4模型。大容量内存支持在单系统内承载多个模型并快速切换，适配智能体工作流中多模型调用的需求。整卡功耗控制在350W TDP，支持现有风冷数据中心和标准PCIe部署。架构上移除了图形和3D模块，芯片资源全部配置给计算。

Crescent Island基于统一的Xe软件栈，实现对PyTorch、vLLM、SGLang等主流框架的Day 0支持。基于同源架构的Arc Pro B60/B70平台已完成规模化部署，开发者的现有工作可迁移至Crescent Island。

小结：智能体AI对计算架构的重塑，正在把CPU从通用计算底座重新推回基础设施的核心位置。CPU:GPU配比从1:8到1:2的变化，是工作负载从训练为主转向推理和智能体为主的结构性结果。根据IDC的预测，到2030年x86仍占新部署服务器的80%，CPU市场规模预期将达到2000亿美元，CPU在基础设施中的权重还会继续增加。

点击展开全文