当前位置:首页 > 报告详情

2020年终大会-机器学习平台:13-5.pdf

上传人: li 编号:29908 2020-12-01 41页 2.09MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了58同城AI Lab在深度学习平台模型推理性能优化和GPU使用率提升方面的实践经验。关键点包括:1)58深度学习平台介绍,包括资源管理、任务调度等;2)模型推理加速,如TF-TRT、TensorRT、MKL、OpenVINO等技术的应用;3)提升平台GPU使用率,通过多模型混合部署和GPU虚拟化技术实现;4)总结及计划,包括模型推理资源全方位监控、离在线任务GPU资源混部、离线训练任务动态资源调度等。其中,TF-TRT优化效果显著,如Resnet50-v1模型在P40卡上性能提升1.8倍,图像OCR模型耗时降低45%,QPS提升60%。GPU虚拟化技术如Nvidia vGPU、OrionX、GPU Sharing和GPU Manager等也被探讨。
"58深度学习平台如何提升GPU使用率?" "TF-TRT和TensorRT在模型推理中的作用是什么?" "GPU虚拟化技术在深度学习平台中的应用有哪些优势和挑战?"
客服
商务合作
小程序
服务号
折叠