1、携程基于大数据分析的实时风控体系介绍携程基于大数据分析的实时风控体系介绍 ontents 1 2 3 4 我们的挑战 Aegis系统架构 核心模块介绍 风控模型和策略 携程文化:让旅游变得更幸福风险管理是一种文化风险管理是一种文化0 Part 风险管理文化:“Make the Travel More Freelyand Securely”业务类型和数据量增长 我们的挑战我们的挑战 1 Part 需要更加自动化和智能化 用好设备和行为数据 跨海外网络的数据延迟 Aegis2 Part 版本演进历史 2015年 Java版上线 实时流量服务上线 吞吐量增加10 x 效率提升10 x 全业务切入 2
2、011年 自建风控系统.Net+SqlServer 2016年 Aegis系统上线 分布式并行计算 实时处理用户行为数据交易关联排查 2017年 设备指纹 同步执行复杂模型 新的规则引擎 新的变量引擎 XMAN 老系统 3.0 3.1 3.5 Aegis 2 Part 运行框架 Aegis 2 Part 系统架构图 业务数据仓库 风控引擎 审核中心 案件中心 外部客户数据 合作伙伴数据 社交数据 外部账户数据 数据贴源层 数据贴源层 实时数据流 ETL 基础数据采集 外部数据采集 数据采集层 数据采集层 实时数据计算平台 离线数据集市 元数据中心 数据健康度管理 数据计算层 数据计算层 数据使
3、用层 数据使用层 规则引擎 决策模型 变量工场 运营平台 数据产品 数据质量/数据监控/数据建模/数据优化/数据调度 服务能力 服务能力 千台集群 P级存储 上万变量 99.9%稳定性 Aegis 2 Part 数据采集框架 Aegis 一笔支付请求的背后 黑白名单 数据预处理/变量衍生 1000-2000个 执行规则 400条+执行模型 5-10个 结果计算及后处理 实时 异步 Aegis性能和稳定性日亿级交易处理能力支付风控平均处理时长小于150ms,99.9%线600ms支持DR灾备,数据分级存储,724H监控&预警通用性强:支持支付风控、业务风控、外部合作伙伴风控支持Aegis核心服务
4、和核心服务和模块模块 3 Part 规则引擎 模型执行器 变量服务 设备指纹 实时流量 用户画像 行为分析$Aegis规则引擎规则分布式并行执行 支持按业务分组 支持动态调整分组和扩容 基于Java,高吞吐量、低延迟 使用gRPC互联 Rule Engine Aegis 模型执行引擎 特性:使用Java完全自主实现的dot模型执行器,执行耗时只有Python版本的10%拥有完善的模型运行监控和熔断机制 Python JPMML 自主研发自主研发 特点特点 标准、开源,兼容性好 标准、开源,兼容性好。使用Java解析并执行.dot模型文件,支持随即森林和逻辑回归算法,算法可扩展 性能性能 10-
5、100ms,因需要独立部署,有网络开销 性能和Python执行.dot接近,只是可以嵌入式运行,所以稳定性比Python高 0-10ms,嵌入式执行,性能高,稳定性高 Aegis 审核自动提示 Aegis实时流量服务日查询量超100亿次 支持分钟、小时、日、月等多级精度,支持动态配置 支持3个月以上的超大时间窗口 流量数据实时推送,1秒级延迟 适用于限额限次、Velocity变量和Ratio变量的实时计算 Counter Aegis 设备指纹 Aegis 实时用户行为分析Aegis 交易关联排查 订单/交易 账号 设备 卡 人 基于交易、人、设备、卡、账号等多个维度的大数据关联分析,确定关联交
6、易。数据用于规则、模型、和人工案件排查 基于HBase自主实现的Graph存储,50亿+交易数据,1秒级返回关联结果 Graph Aegis 交易关联排查模型 规则 风控模型和策略4 Part OR 模型规则化 规则模型化Big Data 姓名 国籍 酒店 机票 设备 指纹 邮箱 异常 批量 注册 设备 指纹 声纹识别 Machine Learning Deep Learning 风控模型和策略 4 Part Xman 账户 位置 设备指纹 电话 电子邮箱 IP 支付账户 卡信息 衍生方法 刻画pattern 基础衍生 高金额、快速起飞/入住等 冲突变量 信息不一致,例如发卡国和Ip国 Rec