《2019年房源质量打分中深度学习应用及算法优化.pdf》由会员分享,可在线阅读,更多相关《2019年房源质量打分中深度学习应用及算法优化.pdf(45页珍藏版)》请在三个皮匠报告上搜索。
1、2019 KE.COM ALL COPYRIGHTS RESERVED1AI选房中深度学习的实践及优化2019 KE.COM ALL COPYRIGHTS RESERVED4目录 为什么要做AI选房 如何做AI选房 模型演变历程 实践应用 总结&思考2019 KE.COM ALL COPYRIGHTS RESERVED5为什么做AI选房?2019 KE.COM ALL COPYRIGHTS RESERVED6贝壳找房发展&挑战20万经纪人98门店平均房源2.1万门店10-25经纪人熟悉房源70%跨店成交占比1.87亿房屋3000万月活跃用户需要强大的房源质量盘点工具找到好房难度大,成本高挑战2
2、00万贝壳全部房源2019 KE.COM ALL COPYRIGHTS RESERVED7目标&价值平台 提升去化率经纪人 提升效率和业绩客户 降低看房成本业主 缩减销售时长 市场需求恒定,优先成交好房核心思想 选出好房核心问题 提升带看效率 加速成交核心价值2019 KE.COM ALL COPYRIGHTS RESERVED8人工选房方法人工选房标准每周举行周例会讨论并投票选出好房选房成本高选房带有主观性无法盘点所有房源质量存在问题人工选房流程2019 KE.COM ALL COPYRIGHTS RESERVED9AI选房本质上是TopN排序问题2019 KE.COM ALL COPYRI
3、GHTS RESERVED10AI选房-房源质量打分好房定义AI选房建模Y=f(X)Y:未来?天能否成交 X:最近?天房源产生的所有行为 样本:挂牌满?天的房源2019 KE.COM ALL COPYRIGHTS RESERVED11AI选房建模 成交/带看具有周期性 周期性单位:周2019年3月每天的成交量和带看量作业周期性分析时间选择:周的倍数2019 KE.COM ALL COPYRIGHTS RESERVED12AI选房建模 Y:未来?天能否成交 X:最近?天房源产生的所有行为 样本:挂牌满?天的房源 时间太短:信息传递不充分 时间太长:-中间出现其他原因导致成交-无法及时反馈效果 综
4、合考虑,并对比测试:选择2周Y=f(X)时间太短:行为信息不足 时间太长:浪费机器资源 对比测试:选择2周 Y:未来?天能否成交 X:最近?天房源产生的所有行为 样本:挂牌满?天的房源2019 KE.COM ALL COPYRIGHTS RESERVED13AI选房建模 Y:未来?天能否成交 X:最近?天房源产生的所有行为 样本:挂牌满?天的房源Y=f(X)行为特征选择14天进行聚合 挂牌不足14天房源,行为特征信息不足 结论:选择挂牌满14天的房源2019 KE.COM ALL COPYRIGHTS RESERVED14模型演变历程2019 KE.COM ALL COPYRIGHTS RES
5、ERVED15模型演变历程v1.0初版模型系统v2.0深度学习模型v2.0+效果持续优化XGBoostDNN+RNN特征建设v1.0初版模型系统2019 KE.COM ALL COPYRIGHTS RESERVED16v1.0-初版模型系统概览房源特征静态特征时序特征特征处理特征提取特征组合离散化模型预测XGBoost分数映射房源质量分数M2019 KE.COM ALL COPYRIGHTS RESERVED17房源特征 6大方向设计了90维特征 静态特征:69维 时序特征:21维 一套房源能否成交同很多因素相关客源17维性价比9维业主14维市场12维经纪人9维基本属性29维成交2019 KE
6、.COM ALL COPYRIGHTS RESERVED18时序特征提取0510152025302018100120181002201810032018100420181005201810062018100720181008201810092018101020181011201810122018101320181014 均值 方差 极值 浏览 关注 IM聊天 电话 带看 跟进 最近14天浏览量均值 最近7天浏览量均值时序特征21维提取函数8个提取特征168维2019 KE.COM ALL COPYRIGHTS RESERVED19v1.0-小结存在的问题新上房源与库存房源在行为特征上差异巨大引