《2019年推荐系统在房产领域中的策略优化.pdf》由会员分享,可在线阅读,更多相关《2019年推荐系统在房产领域中的策略优化.pdf(37页珍藏版)》请在三个皮匠报告上搜索。
1、推荐系统在房产领域的策略优化2019-11-02目录 推荐策略优化-目标1 推荐策略优化-算法2 推荐效果优化-方向3目录推荐策略优化推荐策略优化-目标目标1 推荐策略优化-算法2 推荐效果优化-方向3推荐策略优化价值推荐策略优化-场景分端APPPCM站小程序业务二手房新房租赁物料房源小区楼盘户型AI导购文章大首页大首页详情页详情页少无结果少无结果推荐策略优化-目标成交成交GMV带看带看委托委托商机量商机量点击量点击量曝光量曝光量点击率点击率CTR=点击量点击量/曝光量曝光量转化率转化率CVR=商机量商机量/点击量点击量转化漏斗转化漏斗目录 推荐策略优化-目标1推荐策略优化推荐策略优化-算法算
2、法2 推荐效果优化-方向3推荐策略优化算法基于内容 用户画像 搜索行为 其他产品基于模型 ItemCF、FM Embedding基于业务 热门、新上、收藏、高CTR召回召回机器学习 线性模型LR、FM 树模型 GBDT 集成模型 GBDT+LR深度学习 Wide&Deep DeepFM多目标任务 ESMM排序排序推荐召回策略基于内容存储属性:区域、价格、面积等标签信息tags存储房源id和属性、标签信息索引根据房源属性,得到房源id根据房源id,得到房源信息应用大首页用户画像(长中短实时)搜索、帮我找房少无结果用户搜索词检索信息详情页上下文房源信息ES检索系统加权ES召回策略用户画像推荐召回策
3、略协同过滤对比对比UserCFItemCF计算性能用户少物品少实时性弱强场景时效性强热门程度固定兴趣长尾物品解释性弱强领域新闻、博客、社交电商、电影、图书基于用户基于用户UserCF基于物品基于物品ItemCF房产领域房产领域 选选UserCF还是还是ItemCF?房产领域:房产领域:ItemCF推荐召回策略协同过滤住宅别墅商用归一化K值参数swing热门房源活跃用户时间因素Jaccard 相似度余弦相似度皮尔森相似度相似度方法打压热度业务算法 越大,覆盖率就越高打压热门item打压活跃用户Log平滑处理Swing算法推荐召回策略协同过滤结果:房源id1-房源id2,房源id3,房源id4,房
4、源详情页 上下文房源itemCF召回策略大首页 用户点击房源:实时itemCF召回策略 用户关注房源:关注itemCF召回策略 用户搜索房源:搜索itemCF召回策略少无结果 用户搜索结果房源itemCF推荐召回策略Embedding房源 Embedding问题客观描述房源相似度 维度 权重挖掘房源深度特征 基础特征 排序模型房源描述 房源转化embedding向量 Word2vec 转化为 House2vec向量运算 两个房源相似度 两个向量的相似度推荐召回策略EmbeddingV1方案H1磒磒H3Word2vecH0H1H2H3H5关注IM/400浏览浏览浏览正样本(H1,H0)(H1,H
5、2)(H3,H2)(H3,H5)负样本(H1,H9)(H3,H8)其中H9,H8为出现频率较高的房源推荐召回策略Embedding序列构建学习IM/400序列、关注序列过采样H0H1H2H3H5关注IM/400浏览浏览浏览浏览序列H7H1H5关注序列H5H9IM/400序列推荐召回策略EmbeddingV1评估定性-数据可视化分析定量-转化为召回和排序策略进行线上AB实验推荐召回策略EmbeddingV1评估定性-数据可视化分析定量-转化为召回和排序策略进行线上AB实验小区距离卧室数高低推荐召回策略EmbeddingV1评估定性-数据可视化分析定量-转化为召回和排序策略进行线上AB实验对照组实
6、验组基于上下文召回-相对提升21.9%详情页详情页大首页推荐召回策略EmbeddingV1评估定性-数据可视化分析定量-转化为召回和排序策略进行线上AB实验大首页详情页对照组实验组基于实时行为召回-相对提升3.58%推荐召回策略EmbeddingV1问题北京沈阳卧室数高低小区距离样本量少的城市表现不好推荐召回策略EmbeddingV2改进V1V2全局上下文H0H1H2H3H5H1磒关注IM/400浏览浏览浏览扩充正样本正样本(H1,H0)(H1,H2)(H1,H5)IM/400房源推荐召回策略EmbeddingV2改进V1V2同城负采样负样本(H1,H9