《7-3 图机器学习与风控的 2.0 时代.pdf》由会员分享,可在线阅读,更多相关《7-3 图机器学习与风控的 2.0 时代.pdf(38页珍藏版)》请在三个皮匠报告上搜索。
1、图机器学习与风控的2.0时代敖 翔中科院计算所副研究员2022-06-25|01图机器学习图机器学习与风控的与风控的1.0时代时代02尚未充分考虑的尚未充分考虑的一些挑战一些挑战03图机器学习图机器学习与风控的与风控的2.0时代时代04GNN与与风控的风控的2.0+?目录目录CONTENT|风险控制的重要性|直接风险次生风险间接风险风险控制互联网场景的风控|老问题新服务网络黑产数字金融核心问题:通过对用户资料、行为数据的挖掘分析,进行用户画像,评估风险行为发生概率风控任务在数据层面的特点|类别不平衡概念漂移数据不可信数据层面的特点Trustworthy?风控任务在数据层面的特点|用户特征建模难
2、类别不平衡概念漂移数据不可信数据层面的特点图机器学习:一种流行的解决方案|User Profile:结构化、静态、数据缺失、噪声高User Behavior:时序、动态、高频User Relation:非欧氏数据异质图表征udvbca图神经网络方法发现高风险用户或行为图机器学习与风控1.0时代:将多源和异构数据转换为图表示,设计基于 GNN 的方法评估风险特征学习能力、半监督学习多源异构数据的整合01图机器学习图机器学习与风控的与风控的1.0时代时代02尚未充分考虑的尚未充分考虑的一些挑战一些挑战03图机器学习图机器学习与风控的与风控的2.0时代时代04GNN与与风控的风控的2.0+?目录目录
3、CONTENT|数据角度:对抗手段造成数据的噪声和扰动扰动错误分类注入异常边|“我”在明“敌”在暗,“坏人”通过扰动图结构(伪装)造成风控模型错误分类尚未充分考虑的一些挑战|数据不可信扰动错误分类注入异常边模型角度:数据扰动在攻击GNN的同质偏好假设|异质偏好连边:不同类别节点(欺诈用户与正常用户)之间的关系同质偏好连边:同类别节点(正常用户与正常用户、异常用户与异常用户)之间的关系蓄意增加异质偏好连边,攻击GNN的同质偏好假设,最终导致错误分类异常用户尚未充分考虑的一些挑战|数据不可信:原始输入存在噪声模型不可靠:同异质节点性能有偏差扰动错误分类注入异常边01图机器学习图机器学习与风控的与风
4、控的1.0时代时代02尚未充分考虑的尚未充分考虑的一些挑战一些挑战03图机器学习图机器学习与风控的与风控的2.0时代时代04GNN与与风控的风控的2.0+?目录目录CONTENT|数据如何变“可信”:结构学习扰动逃过监管注入异常边图结构学习净化|Kuan Li,Yang Liu,Xiang Ao*,Jianfeng Chi,Jinghua Feng,Hao Yang and Qing He.Reliable Representations Make A Stronger Defender:Unsupervised Structure Refinement for Robust GNN.To a
5、ppear in KDD2022.(CCF A)1.基于节点特征的方法缺乏对图拓扑结构的建模2.基于监督信号的节点表征与下游任务性能相关,噪声比例增加性能衰减快关键:用什么来优化结构?|Kuan Li,Yang Liu,Xiang Ao*,Jianfeng Chi,Jinghua Feng,Hao Yang and Qing He.Reliable Representations Make A Stronger Defender:Unsupervised Structure Refinement for Robust GNN.To appear in KDD2022.(CCF A)在Cora数
6、据集上,使用MetaAttack添加不同比例的噪声连边,不同模型的预测表现?利用对比学习增强图神经网络鲁棒性动机:基于特征和基于监督信号的图结构学习都存在缺陷贡献:设计面向鲁棒性的对比学习图结构学习框架,下游任务无关,结构扰动不敏感效果:提升在结构扰动下GNN的性能,具有高鲁棒性无监督结构学习流程:1.粗粒度图预处理:去除易检测的干扰边2.面向鲁棒性的数据增强:降低对结构扰动的敏感性3.基于多视图的对比学习:获得高质量表征4.基于相似度的图结构优化:得到用于下游任务结构|Kuan Li,Yang Liu,Xiang Ao*,Jianfeng Chi,Jinghua Feng,Hao Yang