《邓金秋-基于因果大模型的库存清理创新实践.pdf》由会员分享,可在线阅读,更多相关《邓金秋-基于因果大模型的库存清理创新实践.pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit邓邓金金秋秋 京京东东算算法法总总监监演演讲讲主主题题:基基于于因因果果大大模模型型的的库库存存清清理理创创新新实实践践拥有硅谷和华尔街多年工作经验,曾任Uber和Bloomberg算法专家,专注于供应链管理、价格策略优化、动态定价、因果推断、大语言模型的研究与应用。现任京东零售算法总监,负责供应链管理策略优化、定价算法优化、价格策略制定、及价
2、格生态治理等。所在团队曾荣获运筹与管理科学学会奖(2024 INFORMS Prize),成为该奖项设立34年以来第一个获奖的亚洲团队。ML-SummitML-Summit2025 全球机器学习技术大会基于因果大模型的库存清理创新实践邓金秋ML-SummitML-Summit目录CONTENTS因果推断概述因果推断与大模型融合的方法库存清理场景中的实践行业前景与技术发展方向ML-SummitML-Summit因果推断概述01ML-SummitML-Summit我们普遍认为学习时间越长,学习成绩越好。但数据上的表现确与这个认知相反,这是由于学科难度不同造成的。辛普森悖论在研究延长学习时间是否能提
3、升成绩的问题时,我们收集了部分学生各科的学习时长和考试分数。总体数据显示,学习时间较长的学生成绩反而较差,但这是由于课程难度的混淆效应。较难的课程往往需要投入更多时间学习,同时考试成绩也较低。然而,当将数据按课程分开分析时,我们会发现,在同一课程中,学习时间越长的学生成绩往往更好。这种现象称为辛普森悖论,是因果推断中一个经典的问题。总体数据分课程数据考试分数考试分数学习时长学习时长ML-SummitML-Summit用有向图表示各变量之间的因果关系,图中的节点代表变量,有向边则表示一个变量对另一个变量的直接因果影响。因果建模方法 结构化因果模型学科难导致分数低学科难导致学习时间长学科难度分数学
4、习时长使用结构化因果模型来解释为什么需要分学科来看学习时长和分数的关系总体数据分课程数据考试分数考试分数学习时长学习时长ML-SummitML-Summit直接使用机器学习模型预测学习成绩虽可行,但其结果难以解释和说明效果。因果推断与直接通过机器学习模型预测的区别直接利用历史数据训练一个机器学习模型,通过输入学习时长和学科来预测成绩,也可以判断对于相同学科,学习时长对成绩的影响。历史数据机器学习模型模型训练学科学习时长分数预估模型预测直接依赖模型预测结果来决策往往缺乏说服力,主要有以下问题:缺乏因果解释:机器学习模型只能捕捉统计关联,无法证明变量间的因果关系。黑盒特性:模型内部机制不透明,使决
5、策者难以理解预测原理。对比依据不足:仅凭预测难以确定成绩提升是否真因延长学习时长,而非其他因素。ML-SummitML-Summit在无法进行大规模AB实验的情况下,通过历史数据分析,获得既具说服力又易解释的结果,为未来决策提供依据。因果推断的重要应用点在缺乏大规模随机对照试验的情况下,通过构建因果图控制患者基线差异和混杂因素,判断药物疗效。医学领域利用因果推断方法,通过历史数据剔除地区、家庭背景等混杂因素,评估小班教学、在线教育或课外辅导对学业成绩的作用。教育领域通过构建因果图利用历史数据分析最低生活保障政策对居民生活质量或就业状况的影响,为决策提供数据支持。公共政策领域ML-SummitM
6、L-Summit因果推断模型常被比喻为“因果阶梯”,其中包含三个关键层次(rungs),分别代表不同深度的因果推理能力。因果推断所解决的问题:观察、干预与反事实分析反事实推断定义:在不采取动作时,仿真“如果采取了不同措施”时可能发生的结果。案例:仿真不同的动作对降雨带来的影响。干预定义:直接采取措施改变现状,进而影响结果。案例:人工降雨。通过在空中喷洒化学药剂来诱导降雨,直接作用于大气系统。观察定义:通过数据相关性进行推断,不直接干预或改变结果。案例:天气预报。利用蜻蜓低飞等自然现象作为指标,预测未来可能出现的降雨。注释:因果关系本身是人主观定义的,相当于一个公理,不存在明确的对错之分。ML-