数据处理单元(DPU)是可编程网络适配器的高级形式,它充当数据中心中服务器和网络其余部分之间的接口,以帮助提高服务器利用率和功耗。
超大规模云提供商多年来一直在使用它们来卸载网络安全(防火墙和加密)、网络流量管理和控制、负载平衡和NVMe等功能。
但是这些好处并不局限于超大规模——DPU也可以用于较小的数据中心和服务器群。当涉及到托管和处理与生成式人工智能(AI)和机器学习(ML)相关的大模型时,这一点尤其重要,这些应用程序对系统CPU和GPU造成了相当大的压力,并且将其他功能卸载到DPU可以帮助提高性能。
DPU可以处理存储和网络等控制平面功能,使更多的服务器容量可用于处理AI/ML工作负载。它们还可以帮助实现多租户使用,或多个用户共享大型人工智能培训系统的能力,以改善资源管理,并帮助用户之间更安全地共享数据。
通过将高性能FPGA集成到DPU中,这些优势可以被放大。FPGA提供并行处理能力,以帮助实时AI/ML处理,增强计算能力,优化能耗并减少延迟。这可以使AI/ML技术的部署更具可持续性和效率。此外,FPGA的硬件可重构性允许快速适应新的或不断发展的人工智能算法,帮助数据中心以最小的运营成本保持领先地位,并且可以在更长的时间内使用现有的硬件。
网友评论