当前位置:首页 > 报告详情

网络驱动大规模 AI 训练 - 阿里云可预期网络 HPN 7.0 架构-席永青.pdf

上传人: 张** 编号:164043 2024-05-31 27页 5.76MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了阿里云资深网络架构师席永青主导设计的阿里云高性能数据中心网络系统——HPN 7.0架构。该架构是针对GPU集群的高性能网络系统,标志着网络性能进入可预期时代。GPU集群对网络的关键要求包括高性能网络系统进入可预期时代,GPU centric的高性能网络系统未来展望,以及从CPU centric到GPU centric的网络性能变革。HPN 7.0架构具有超高的网络带宽,能够满足AI大模型训练对网络的高性能需求,实现了端到端的高效数据传输。此外,HPN 7.0架构还具有全局协同/拓扑感知和自研的HCCC流控技术,能够提供极致的性能和稳定性。最后,HPN 7.0架构被SIGCOMM24收录为AI网络集群架构领域的首篇顶会论文,其架构设计细节将会在论文中详述。
"AI训练如何借助阿里云HPN7.0提升性能?" "从CPU到GPU,数据中心网络如何演变?" "阿里云HPN7.0如何引领高性能网络系统新时代?"
客服
商务合作
小程序
服务号
折叠