《2019年推荐系统在剑网3推栏项目中的落地.pdf》由会员分享,可在线阅读,更多相关《2019年推荐系统在剑网3推栏项目中的落地.pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、推荐系统在剑网3推栏项目中的落地推荐系统中的What、Why、Where剑网3推栏推荐系统架构推荐系统中常见的各种坑010203推荐系统中的What、Why、WhereWhatWhyWhereWhat历史行为社交关系个人兴趣个人信息WhyNetflix:67%被观看的电影来自推荐Google新闻:38%的点击量来自推荐Amazon:35%的销量来自推荐Where剑网3推栏推荐系统架构推荐系统流程 策略一:每2个小时的数据更新 策略二:Online Service的内容排序 策略三:多模型联合的分数归一化多模型联合的分数归一化协同过滤(CF)矩阵分解(MF)因子分解(FM)Embedding每种
2、模型得到的分数区间不同数据归一化推荐效果53%11%15%4%22%0%10%20%30%40%50%60%点击率阅读数点赞数评论数收藏数推荐增长效果推荐系统中常见的各种坑推荐系统中常见的各种坑 数据、模型和UI 推荐系统中的EE(Exploitation&Exploration)问题 召回结果不均衡 NearLine的正确选择 NearLine的正确选择 延时和复杂度之间的权衡 精度和用户体验之间的权衡 数据的量级数据、模型和UI数据模型UI哪个最重要?推荐系统中的EE(Exploration and Exploitation)问题 Exploitation:基于已知最好策略,开发利用已知具有较高回报的item(贪婪、短期回报)Exploration:不考虑曾经的经验,勘探潜在可能高回报的item(非贪婪、长期回报)推荐系统中的EE(Exploration and Exploitation)问题推荐系统中的EE(Exploration and Exploitation)问题 如何使自己获利更多 有策略的去尝试Bandit算法训练数据维度与预测数据不同逻辑回归LR训练数据:600000条训练类别:30个Model预测数据(召回结果):60条类别分布:20个训练与预测数据维度不同?召回结果不均衡 召回数量过多 召回数量过少Thank you!