当前位置:首页 > 报告详情

NVSwitch HotChips 2022 r5.pdf

上传人: 2*** 编号:136913 2023-08-03 23页 4.12MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了NVLink4代交换机芯片和基于该芯片的NVLink网络技术。NVLink4代交换机具备64个NVLink4端口,提供3.2TB/s的全双工带宽,支持NVLink SHARP加速器,用于优化AI训练中的通信密集型操作,如AllReduce。此外,该交换机还支持跨服务器NVLink网络,以及新的管理和安全特性。NVLink网络技术已应用于DGX H100服务器,该服务器配备8个H100 GPU,能够通过18个NVLink交换机实现高达1 ExaFLOP的AI性能。DGX H100超级单元可扩展至包含256个H100 GPU,通过NVLink网络实现高效的AI和HPC计算。与基于InfiniBand的传统集群相比,NVLink网络能够显著提升通信性能,为大规模GPU计算提供坚实的基础。
"NVLink4如何提升AI训练性能?" "NVLink网络如何在超级计算中发挥作用?" "DGX H100服务器如何通过NVLink网络实现高性能计算?"
客服
商务合作
小程序
服务号
折叠