1、DataFunCon#2024基于Uplift Model电商平台优惠券分发优化吴维维eBay中国分析中(跨境电商部)/蔚来汽/字节跳动数据分析经理Contents目录背景方法论模型评估总结01 背景介绍传统的优惠券发放策略$0 Insertion Fee&Final Value Fee75%Final Value Fee$1Final Value Fee$0 Insertion FeeFree listingFVF discountFVF CapZero insertion feeTest GroupControl GroupIncrementalTestControlCampaign me
2、asure:AB Testing Campaign Offer核心业务痛点:找到活动敏感型用户以提高营销效率60MIncremental GMV#100Seller campaigns-200KIncremental REVSeller Campaign Performance但是业务痛点是部分Test Group户,即使没有Campaign也会List,这样Campaign对这部分户是低效率的。所以,我们核想找到的标户是:仅在Campaign下,才会List的户(Persuadable User)。即寻找Campaign(运营措施)和户List(标为)之间的因果关系。02 方法论概述业务场景
3、模型化算法实现寻找活动敏感型用户Customer ACustomer BCustomer CCustomer DPersuadableSure thingsLost CausesDo Not Disturbs100-1List with Campaign?1List without Campaign?2Probability difference21Persuadable Likelihood ScoreHighLow因果性模型 vs 相关性模型模型预测的因变量预测的本质Response Model在Campaign下List的概率(List with Campaign)Correlation
4、Correlation法区分敏感群和然转化群Uplift Model因为CampaignList的概率,Persuadable Likelihood Score(List with Campaign-List without Campaign)CausationCausation可以精准定位敏感群业务痛点对因果效应的度量转化为:使用 Uplift Model 预测用户的 Campaign 敏感度得分,其和传统的Response Model 的差异Uplift Model 算法框架GoalChallengeSolutionUplift Model(增量模型)是预测某种预对个体为的因果效应(Ind
5、ividual Treatment Effect,ITE)数据缺失,法得知个户在两个平时空的表现(T=1 and T=0)AB Testing数据,为Uplift Model提供偏样本 样本X与T相互独,满条件独假设(Conditional Independence Assumption,CIA)条件平均因果效应(CATE)CATE代替ITEUplift模型输:户维度 XUplift模型输出:户敏感度得分(CATE/Persuadable Likelihood Score)Uplift Model 算法实现S-learner,T-learner,X-learnerRandom Forest&X
6、gboostUplift Model:Machine Learning algorithm XMeta Leaner 21模块S LearnerT LearnerX Learner优点训练样本的共享,使模型学习的更加充分可持multiple treatment建模落地成本是较低训练样本的共享,使模型学习的更加充分对间接Uplift建模缺点对response建模uplift两个模型在打分上的误差容易产累积效应对response建模uplift逻辑较为复杂,消耗资源03 模型评估模型度量模型实践*Demo数据,重点关注曲线趋势收集用户数据搭建模型CampaignDemographic Traffi