《陈昊-次时代推荐系统.pdf》由会员分享,可在线阅读,更多相关《陈昊-次时代推荐系统.pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、MacGNN:次时代宏观图推荐系统https:/arxiv.org/abs/2401.14939汇报人:陈昊 香港理工大学目 录德才兼备 知行合一本世代推荐系统次世代推荐系统MacGNN 效果123推荐系统场景的演变:从单一到丰富德才兼备 知行合一上世代推荐系统(广告推荐)本世代推荐系统(沉浸式推荐)推荐系统规模的演变:从罕见到普及德才兼备 知行合一用户数量直线增长(数百万-数十亿)商品数量指数增长(数千-上亿)最初广告推荐池:当前商品及短视频池:2000上亿推荐系统算法的演变:从简单到复杂德才兼备 知行合一单一协同过滤模型(只考虑用户爱好)级联推荐模型(分层漏斗推荐)推荐系统算法的演变:从简
2、单到复杂德才兼备 知行合一单一协同过滤模型(只考虑用户爱好)级联推荐模型(分层漏斗推荐)全部环节需要在200ms内完成精排环节需要在100ms内完成用户对响应速度不敏感(网页加载都需要1-10秒)本世代精排模型:针对用户兴趣进行建模德才兼备 知行合一用户表示本世代精排模型:针对用户兴趣进行建模德才兼备 知行合一用户行为本世代精排模型:针对用户兴趣进行建模德才兼备 知行合一商品特征本世代精排模型:缺乏用户/商品深度建模德才兼备 知行合一存在缺陷存在缺陷只能对具体用户具体用户和商品建模和商品建模缺少对点击过商品的用户的建模需要对用户行为进行过滤和截断过滤和截断本世代图模型:能够建构用户与商品的图模
3、型德才兼备 知行合一图模型通过对用户与商品的邻居,进行多次传播来构建用户和商品的图信息本世代模型的局限:无法应对热点商品/直播/短视频本世代模型无法处理千万级甚至亿级的热点商品/直播/短视频读取一个热点商品对应的一千万用户嵌入向量的大小为2.56 GB本世代推荐模型只能丢弃商品的所有用户记录,只建模商品本身估算需要的向量存储1000,0000 X 64 X 4B=2.56 GB以1GB/s速度读取需要2.56s本世代图模型的局限:计算复杂度呈指数级提升目标用户用户交互过的物品千万交互用户相似用户用户图目标商品点击过该商品的用户相似商品商品图千万交互用户千万用户点击过的所有商品本世代图模型面临更
4、加严重的计算复杂问题本世代图模型只能从千万级邻居中,选取其中100个来表示用户(少于万分之一)本世代推荐模型的局限:复杂度与准确率的平衡本世代精排模型(用户兴趣建模,CTR模型)本世代图模型(图推荐模型,GNN模型)次世代图模型(用户商品图全量高效建模)用户建模能力商品建模能力算法运算效率中等中等中等较高较高精排场景能力评估较低极强极强极高本世代推荐模型的局限:复杂度与准确率的平衡本世代精排模型(用户兴趣建模,CTR模型)本世代图模型(图推荐模型,GNN模型)次世代图模型(用户商品图全量高效建模)用户建模能力商品建模能力算法运算效率中等中等中等较高较高精排场景能力评估较低极强极强极高目 录德才
5、兼备 知行合一本世代推荐系统次世代推荐系统MacGNN 效果123次世代图模型的新理念:对图结构进行宏观化微观边宏观边微观节点宏观节点用户微观图用户宏观图微观图宏观化计算用户商品宏分类:聚类行为相似的商品和用户微观用户微观商品用户宏观分类商品宏观分类聚类算法可选聚类算法:K-Means,密度聚类,层次聚类,图聚类等。注:建议选择适合于场景的聚类方法注:建议选择适合于场景的聚类方法宏观图是如何得到的:基于宏观节点生成宏观图微观边宏观边微观节点宏观节点3415451次世代宏观图的优势:用户/商品图邻居数量显著减少用户宏观图 商品宏观图微观图统计数据宏观图统计数据完整次世代宏观图模型宏观&微观向量嵌
6、入层近期微观行为用户宏观图聚合商品宏观图聚合精排预测层宏观权重建模宏观层读出用户宏观图商品宏观图目 录德才兼备 知行合一本世代推荐系统次世代推荐系统MacGNN 效果123实验结果:公开数据集https:/ 速度上接近上世代精排模型性能上超过上世代和本世代精排与图推荐模型工业数据集测试结果速度对比测试上线结果:阿里淘宝首页上线效果商品点击率 PCTR+3.13%+2.35%用户点击率 UCTR+1.32%+1.09%商品交易总额 GMV+5.13%+3.53%用户停留时长 StayTime+1.01%+0.69%v.s.SIMv.s.GMTv.s.SIMv.s.GMTv.s.SIMv.s.GMTv.s.SIMv.s.GMT汇报人陈昊北航博士,香港理工博后,微信视频号创始团队成员,SIGIR2023 最佳论文提名博后研究员博后研究员https:/