当前位置:首页 > 报告详情

如何快速搭建全 GPU 加速的 AI 应用.pdf

上传人: li 编号:29530 2021-02-07 19页 1.20MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了在GPU上快速搭建全GPU加速的AI应用的最佳实践。文章指出,当前AI应用服务面临硬件利用效率低、实时性难以保证、预处理成为性能瓶颈、Host <-> Device 传输速度低、多模型并行推理性能低等问题。针对这些问题,文章提出了一系列解决方案,包括使用GPU进行全部预处理、使用NVDEC模块进行硬件解码、避免在Host和Device之间的Copy、使用低精度量化、多Batch推理、模型合并等。同时,文章还介绍了Hummingbird框架,该框架旨在支持达摩院内部复杂的多模态AI应用和服务在GPU、CPU以及其他硬件上的快速开发和高效运行,具有易用、易集成、易定制等特点。
如何实现全GPU加速的AI应用? 如何解决多模型并行推理的性能问题? 如何优化AI应用中的视频解码和预处理速度?
客服
商务合作
小程序
服务号
折叠