当前位置:首页 > 报告详情

李健-京东广告训练推理场景GPU优化实践.pdf

上传人: 张** 编号:168964 2024-07-06 19页 1.92MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了2024年京东广告场景下的大模型训练与推理的GPU优化实践。文章指出,随着广告业务的发展,模型参数规模不断扩大,算力需求指数型增长,面临模型稀疏性高、IO瓶颈、显存有限等挑战。针对这些挑战,文章提出了一系列优化措施: 1. 存储优化:采用CPU稀疏参数服务器+多机多卡训练范式,实现参数的存储与同步,提高GPU显存利用率。 2. 计算优化:采用CPU&GPU异构分布式流水线并行训练架构,实现模型分图计算,最大化模型结构与硬件资源匹配,并优化资源分配。 3. IO优化:基于GPU-HBM和CPU-DRAM的二级参数服务器,优化显存访问次数,实现特征计算&模型训练异构分布式部署,分摊IO,提高训练效率。 4. 推理场景优化:针对推荐场复杂性、低延时高并发推理场景、模型建模复杂等问题,采用TensorBatch、多流计算和深度学习编译器等技术,实现推理场景的GPU优化。 综上所述,京东广告场景下的GPU优化实践取得了显著成效,提高了模型训练与推理的效率,为广告业务提供了有力支持。
"京东广告如何应对大规模稀疏模型训练与推理挑战?" "GPU优化实践如何提升京东广告业务的低延时响应和高可用率?" "如何通过深度学习编译器与异步编译技术优化广告推荐场景?"
客服
商务合作
小程序
服务号
折叠