当前位置:首页 > 报告详情

网络计算技术加速 GPU 应用.pdf

上传人: li 编号:29476 2021-02-07 68页 2.75MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了GTC CHINA 2020中关于网络计算编程的几个关键技术: 1. 远程直接内存访问(RDMA)技术,通过硬件直接访问内存,减少了CPU的参与,提高了数据传输效率。 2. GPU直接RDMA(GDR)技术,允许GPU直接从IB网络读写数据,进一步减少了CPU的参与,提高了GPU应用的性能。 3. GPU直接存储(GDS)技术,通过GPU直接访问存储设备,减少了数据在CPU和GPU之间的复制,提高了存储性能。 4. 可扩展的分层聚合与减少协议(SHARP),通过在网络交换机中进行数据聚合,减少了数据在节点间的传输量,降低了通信延迟。 5. NCCL SHARP,通过在网络交换机中进行数据聚合,支持NCCL的聚合操作,提高了多GPU计算的性能。 6. 实验数据显示,使用GPU Direct RDMA技术,可以获得10倍的性能提升;使用SHARP技术,可以获得2.5倍的性能提升。
什么是GPUDirect RDMA? GPUDirect Storage如何优化GPU存储性能? SHARP如何提高AI应用的性能?
客服
商务合作
小程序
服务号
折叠