《2020年终大会-推荐算法:3-7.pdf》由会员分享,可在线阅读,更多相关《2020年终大会-推荐算法:3-7.pdf(26页珍藏版)》请在三个皮匠报告上搜索。
1、让生活简单美好多业务融合推荐场景下的深度学习实践58同城高级算法架构师,罗景#page#好场景介绍:多业务融合推荐北京家减80元推荐部落视频热议家乡面下你的自拍照,寻找你的有缘人学院路六道口富润家园东王庄林业大学附近静淑苑一居58APP首页猜你喜欢1室1厅-60-静淇商小区新上精修配齐全5500元大规模场景:UV千万量级;帖子候选集亿级别;模(月付)清华同方基金委(清华型训练样本10亿级别;科技园)圣八号(中公教-林大家属区多业务融合:覆盖租房,招聘,二手房,二手车,本地生活,新房,新车等5500元多目标优化:涉及连接效率/商业收入用户体验10万买辆三手别克是位子行为?打开后备箱朋友份/用户留
2、存/运营活动等多目标平衡住:你小子赚大了月下车京南荣盛新盘低首付低月供通透二居外地可买可贷京维0#page#让生活简单美好面临挑战:多业务融合召回策略:各个召回通道的业务适配重排策略:多业务之间的流量均衡分配展示样式:不同业务展示元素与样式的适配排序模型:特征对齐与特征工程复杂业务差异带来的特征对齐困难帖子属性信息差异用户兴趣业务差异样本中帖子特征与用户兴趣特征维度上无法对齐反馈特征也由于业务差异,实际效果并不理想多业务特征工程流程/逻辑复杂部分特征需要针对不同业务维护特有的数据流程(e.g.用户兴趣构建)维护代价大存在业务特定的特征工程逻辑(e.g.匹配交叉特征)复杂度高#page#让生活简
3、单美好双通道:行为序列兴趣模型验证动机:以用户行为序列作为模型的核心输入=优秀兴趣建模能力,解决特征对齐困难,降低特征工程代价序列模型选型用户行为序列构建DIN:注意力兴趣序列构成:用户点击/转化行为序列表征:帖子ID,类目,地域等DIEN:序列性,兴趣抽取与演化,动关键属性态兴趣Transformer:自注意力&多头,位置Embedding序列长度:基于业务周期结论:纯序列兴趣模型的效果并不能超越已有特征工程做得比较完善的XGB模型#page#让生活简单美好双通道:定制化通道引入常通过特征工程模块构建特征,然后将这部分特征作常规做法怎么把XGB模型中基于业务场景理解的高级特为数据合并入样本,
4、进行模型训练征(e.g.匹配交叉特征)与最佳实践引入进来工程流程与逻辑仍比较复杂模型中引入特征交叉定制化结构把特征工程逻辑,引入到模型中来,通过对模型结构的定制来替代特定的特征工程逻辑,拼接Concat Layer层Customized Cross Layer交叉定制化通道CMutiplyLcosneCDNN层向量化层Embedding Layer(One-Hot/ Mult-Hot/ Pre-train)用户用户最用户最站子用户特征帖子站子贴子用户最近近点击近转化关键兴趣8S首图18S标题搜索帖子关层帖子关标签标签词键标签键标签#page#让生活简单美好双通道:模型架构MLP定制化通道:序列
5、化通道:基于各特征维利用序列化度的向量化表建模组件,示,允许根据基于用户行业务特点进行为序列自动定制化特征交叉层定制化交叉,抽取用户兴提供了业务与趣,提供了场景的可定制深度模型对化适配能力,用户兴趣的支持融入工程抽象表征与师们对业务场交又能力ContextUser景的理解与思Embdding考,进一步强化模型工程,向量化构建/预训练Infoid/Cateid/Loca弱化特征工程推荐快选用户行为序列上下文候选帖子用户行为序列#page#让生活简单美好双通道:回顾效果实现对基线最优模型的稳定超越:点击率提升了3%,曝光转化率提升5%显著降低特征工程复杂度:通过在定制化通道引入特征交叉能力,以及基
6、于用户行为序列的建模方式,使得特征工程流程数大幅减少,复杂度也明显降低建立了序列化兴趣模型线上线下的工程架构基础:解决离线在线性能问题,成为主流排序模型进一步优化的基础:后续的多通道模型升级以及多场景适配探索都是以双通道模型为基础#page#让生活简单美好多通道:探索方向深度:结合业务特点,在单行为序列上的深度优化DSIN(深度会话兴趣模型):基于行为序列的会话切分对用户兴趣进行结构化建模MIMN(长序列用户行为模型):以NTM(神经图灵机)为基础进行长用户行为序列建模SIM(基于搜索的终身行为序列建模):采用两阶段方式,先选取相关行为,在精细化建模怎么更精准的刻画用户兴趣基于用户行为低频/需