当前位置:首页 > 报告详情

性能提升 7 倍 + 的高性能 GPU 广告推荐加速系统的落地实现.pdf

上传人: li 编号:29561 2021-02-07 32页 1.75MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯广告推荐系统技术专家孔祥挺提出的广告推荐训练系统的落地实践。该系统基于深度学习DNN模型结构,采用数据并行的分布式训练方式,实现了召回模型、粗排模型和精排模型的加速。通过引入HugeCTR框架,优化了模型训练的性能,实现了单机性能提升14倍,多机8节点性能提升18倍。同时,该系统还兼容现网广告推荐系统和在线服务系统,支持数据shuffle功能,并进行了权重更新方式的改造。线上灰度效果表明,平台收入实验组比对照组增加了1.5054%,效果持续优化中。后续计划包括业务落地推进、模型结构多样化支持、单机多卡分布式方案落地等。
"广告推荐系统如何实现性能提升7倍+" "深度学习在广告排序中的应用与挑战" "腾讯如何通过HugeCTR打造广告推荐加速系统"
客服
商务合作
小程序
服务号
折叠