《2020年终大会-推荐算法:3-5.pdf》由会员分享,可在线阅读,更多相关《2020年终大会-推荐算法:3-5.pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、名快手多目标排序在快手短视频推荐中的实践郑东快手社区科学部年终大会2020DATAFUNTALK#page#分享大纲快手短视频推荐场景介绍多目标精排:从手工融合到LearnToRank复杂多目标:EnsembleSort和在线自动调参重排序:Listwise、强化学习和端上重排序总结和展望年终大会名快手|2020DATAFUNTALK#page#快手短视频推荐场景介绍年终大会名快手|2020DATAFUNTALK#page#关于快手P4)中国领先的短视频和直播社区,日活3亿+价值观:真实、多元、美好、有用发现页:看见更大的世界有品双列:选择权单列:沉浸式关注页:半熟人半陌生人社区,私域流量同城
2、页:身边触手可及的生活8O口首页推荐算法在快手的流量分发和同城页用户体验中起核心主导作用双列发现页单列精选页关注页年终大会2020名快手DATAFUNTALK#page#提升使用时长/正向反馈,减少负向RankStrategy排序目标反馈,最终提高用户留存留存的累积效应实验组DAU涨幅时间RankModel显式正反馈隐式负反馈收藏+短播放下载Rankin终止Session进入个人页关注显式负反馈点赞不感兴趣正向评论负向评论观看评论举报原声点击MMoE标签点击O分享年终大会名快手|2020DATAFUNTALK#page#多目标精排从手工融合到LearnToRank年终大会名快手|2020DAT
3、AFUNTALK#page#手工融合和简单模型融合pevtr0.3多任务学习获得的个性化预估值多目标排序快手推荐追求时长、点赞、关注、分享等多种目标通过合适的排序目标和机制设计,获得多目标的协同提升pltr0.2Stage1:手动公式融合VV5Wa*pEvtr+b*pLtr+.+g*f(pWatchTime)缺点,过于依赖规则设计过于依赖人工调参,维护成本高rulek-1rulekrulelrule4,固定权重,缺少个性化、场景化rule2rule3TreeNTree1Stage2:树模型规则Ensemble融合等价于将叶子结点转换为打分规则,得到打分的Ensemble,也叫RuleFit使用
4、GBDT模型,引入pxtr、画像和统计类特征,拟合组合缺点:表达能力有限,无法onlinelearninglabel:w=a*effective_view+b*like+.+h*f(watch_time)采用加权LogLoss,L=wlog(p)+log(1-p:)上线效果:同城页短视频时长提升4.5%上下滑无负样本,通过拷贝正样本实现对目标无偏估计年终大会名快手|2020DATAFUNTALK#page#超参LearnToRankItr_benefit:A*effectiveView+B*like +.+H*f(watch_time)DNN学习打分函数:使用A*pEvtr+B*pltr+.来
5、拟合组合收益label:w=a*effectiveView+b*like+.photo_top(dim=24)user_top(dim=24)为可解释性,采用内积形式,用户侧特征学习超参user layer 2w.conca采用加权LogLoss,L=wlog(p:)+log(1-pi)user layer 1轻量级用户特征表征:64bit表示用户对item的pEvtr:有效播放率embdding_layerpLtr:点赞率action, isEffectiveView /isLike/isFollow/pWtr:关注率praasndevice_idstatus_iminstatus_2hpl
6、ayTimeFromNow / videoDuration /pFtr:分享率videoPlayingTimePlayTimeWatchTimeDurationCWatchTimePlayTimePlayTimeWatchTimeDurationWatchTime,分别对1min/5min/./2h范围内的action聚合为PlayTimeDuration动态行为状态变化对pXtr偏好的影响status_list年终大会2020名快手上线效果:App时长提升0.29DATAFUNTALK#page#端到端LearnToRank=a*effectiveView+b*like+.+h*f(watc