AI

智谱联合清华等提出ZCube组网架构:大模型推理吞吐提升15%,网络成本削减三分之一

PConline 2026-05-21 10:58:00
7X24小时AI快讯
由华为云驱动

2025年9月,智谱、驭驯网络与清华大学在网络领域顶级会议ACM SIGCOMM2025上发表了关于ZCube网络架构的研究成果。2026年5月21日,智谱宣布该架构已在GLM-5.1coding生产环境中成功落地。基准测试表明,在GPU、软件栈及应用保持不变的前提下,ZCube架构使交换机与光模块...

2025年9月,智谱、驭驯网络与清华大学在网络领域顶级会议ACM SIGCOMM2025上发表了关于ZCube网络架构的研究成果。2026年5月21日,智谱宣布该架构已在GLM-5.1coding生产环境中成功落地。基准测试表明,在GPU、软件栈及应用保持不变的前提下,ZCube架构使交换机与光模块的资本支出减少33%,GPU平均推理吞吐提升15%,首Token时延(TTFT P99)降低40.6%。ZCube架构取消了Spine层交换机,采用完全扁平化的两组交换机进行二部图互联,并结合双端口网卡的单/多轨混合接入机制。配合特有的路由策略,ZCube能确保任意GPU对之间拥有独享的最优路径,可支持数万张乃至数十万张GPU的超大规模扩展。在生产环境改造中,驭驯网络团队利用自动化控制与校验工具,成功克服了布线和路由策略重构的挑战,保障了集群的快速平稳升级。目前该千卡集群已稳定运行两周以上。
点击展开全文
打开APP,阅读体验更佳

网友评论

太评甄选

更多优惠

相关推荐

相关产品
取消