《腾讯新闻信息流推荐技术实战-李帅.pdf》由会员分享,可在线阅读,更多相关《腾讯新闻信息流推荐技术实战-李帅.pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、推荐系统与成长性 -腾讯新闻信息流实践腾讯专家研究员 李帅信息流产品概述推荐系统技术成长性的问题推荐系统的成长性具体算法Case信息流产品概述产品的类别产品的成长产品的类别发力全域信息流产品发力全域信息流产品专业领域产品专业性强小众,商业价值受限被全域产品渗透全域产品Time-killer技术加持下强者恒强技术上更具备挑战产品的成长理想情况扎实内容基本盘选择普适性强的类目,作为基本盘建设好内容、cp与分发系统不断内容的扩圈带来不断的用户增长结合意向人群洞察,扩展品类吸引意向人群持续迭代产品的成长推荐侧精准推荐护城河类目的个性化分发内容扩圈推荐在bias干扰下的新扩展品类的推荐推荐系统技术召回粗
2、排精排重排召回对比学习图学习Cluster u2u对比学习Droppout构造虚拟item/user embedding数据增强embedding作为正样本batch内其他数据增强embedding作为负样本user towerwith dropoutItem featuresuser featuresitem towerwith dropoutuser emb 1user emb 2item emb 1item emb 2meanmeanInner lossCL lossCL loss图学习Inside-out的消息聚合框架基于pagerank得分的带权负采样显示学习item-item,us
3、er-item的联系实时cluster u2u选取种子用户使用生产深度模型,有效的输出用户实时兴趣表征使用用户过去行为聚类使用用户现在行为投票生成推荐结果粗排Teacher studentltrTeacher StudentUser featuresTeacher netItem featurescross featuresUser vectorconcatUser netBias towerUser towerItem towerY_tY_sSoft labelLabelYYLabelStudent学习Teacher的Soft LabelTeacher net比ranking简单,侧重引入交
4、叉特征信号Soft Label会提供一个区分粒度更细的label分布Ltr样本增强,引入unpv样本学习精排多目标的融合结果上下游一致的效果gainPairwise vs pointwiseRank netPre-rank netscore高低选为好样本选为坏样本精排多目标模型瘦身PLE针对MTL难以合作训练的目标有效点击&完成度渐进分离式的路由设计模型瘦身采用后训练量化方式只量化Embedding参数采用Row-Wise方式采取对称线性量化RerankListwise重排N2KK2KN2k计算效率限制下,引入context特征,找到K个整体收益最大视频1-M个位置实时预估N2k logits
5、M-K个位置离线预估N2k logitsK2K利用Transformer建模序列score输入N2K的结果序列输出组合的预估分数成长性的问题内容的扩圈带来用户的增长 推荐系统bias的制约推荐bias的制约影响系统的内容扩圈扩圈品类分发效率低探索收敛缓慢,流量代价大推荐系统的成长性主从推荐系统统一模型主从推荐链路主推荐链路巩固现有优势侧重优势品类的精准分发unbias推荐链路公平的内容推荐不被强bias影响统一模型Ranking featureEmbedding LayerPLEMLPMulti-TargetPLEMLPMulti-Targetcondition扩展品类分支主模型Meta-Le
6、arning分支扩展品类预估准确率提升1倍扩展品类auc+3%扩展品类ctr+30%具体算法caseListwise迭代时长优化的多目标及融合Listwise迭代难点1如何从C(N,K)种潜在序列中找到整体收益最大的序列?解法框架用较简单模型找到K个整体收益最大的内容复杂的序列建模结构提高模型精度,找到最优重排列Listwise迭代难点2N2K模型如何高效inference(约60010次model infer)解法 离线枚举所有context特征组合,预估得到对应N2K l