当前位置:首页 > 报告详情

从系统层面提升 GPU 利用率.pdf

上传人: li 编号:29577 2021-02-07 62页 2.91MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了几种提高GPU利用率的方法,包括多进程服务(MPS)、多实例GPU(MIG)、Triton和vGPU。 1. 多进程服务(MPS)通过允许不同进程在同一GPU上同时执行,提高GPU利用率。测试结果显示,在MPS开启的情况下,多进程的运行时间与单进程相当,提高了GPU的利用率。 2. 多实例GPU(MIG)通过将GPU分割成多个实例,为每个实例提供独立的SM、内存、L2缓存和带宽,实现GPU资源的隔离和QoS保证。测试结果显示,在MIG开启的情况下,可以显著提高GPU的利用率。 3. Triton是一个面向NVIDIA GPU的推理服务器,通过HTTP或gRPC端点提供推理服务,可以快速部署和管理多个模型。 4. vGPU通过将GPU虚拟化为多个虚拟GPU,实现GPU资源的隔离和共享。 综上所述,这些方法都可以提高GPU的利用率,满足不同场景下的需求。
如何提高GPU利用率? 多进程服务MPS如何工作? 多实例GPU MIG有哪些优势?
客服
商务合作
小程序
服务号
折叠