1、DataFunSummit#2023斗鱼直播实时风控引擎快速对抗探索实践演讲人-李瑞-斗鱼直播-风控负责人01直播行业的黑产问题02全栈式风控引擎的建设03文本识别对抗实践04思考与展望目录CONTENTDataFunSummit#202301直播行业的黑产问题直播行业常见的黑灰产问题渠道作弊活动欺诈广告引流低俗辱骂欺诈充值电信诈骗主播刷榜虚假开播业务安全的痛点木桶效应如果不掌握所有的用户行为入口和数据,总会出现防范的短板,无法识别出黑产账号,也无法有效支撑业务安全。业务对接成本高不同类型的业务需要独立的风控名单/接口服务,相应的风控策略也不同,每个业务的策略服务如果单独开发效率低,并且配置凌
2、乱难以管理。性能要求高 对接业务众多,吞吐量巨大,RT不能影响业务 实时计算时效性要求高用户体验差 用户被风控后缺少反馈途径的引导。投诉反馈排查效率低、耗费风控人员精力防御时效性差 风险感知能力不全面,风控迭代慢 实时性策略较少,依赖离线挖掘周期长。DataFunSummit#202302全栈式风控引擎的建设全栈式风控引擎架构单流计算Storm/Flink自研规则引擎ARES营销活动账号安全直播弹幕行为特征实时计算渠道激活充值打赏主播榜单业务接入多流计算Flink动态编译策略编排异常报警Kafka业务注册特征装载自定义函数风险权重配套工具业务健康罗盘规则灰度测试可视化规则管理基础数据预处理风险
3、特征库惩罚中心规则生命周期用户自助反馈通用策略窗口频率黑白名单IP设备聚集行为交叉一致归属地异常实时调用广告点击风控网关RPC/HTTP熔断兜底数据预装载上报RedisCluster模型画像文本匹配设备农场评分卡策略用户画像手机画像IP画像文本模型风险评分团伙发现行为序列设备异常风控引擎RPC全栈式风控引擎降低对接成本业务收拢强运营强宣发,推动业务对接,解决木桶效应。低成本一站式接入业务注册调用后,就可以获得全面的风险管控、监控告警、反馈排查等配套服务支持。业务方注册监控、调优全栈式风控引擎降低对接成本可视化引擎可视化编辑决策流定制类策略通用型策略规则编译动态加载规则文件管理器元信息JavaF
4、ileObject源码编译器字节码JavaFileObjectClass对象注入rpc服务执行计划编排RuleRule1Rule2RuleN返回开始微服务装载惩罚中心风险标签用户信息/地址解析三方服务团伙属性风险评分超时兜底流量控制风险权重对外话术日志收集勾选编辑上手门槛低常用策略模型高度复用策略发布流程规范支持高度定制类规则高可用高性能实时订阅智能风控:风控引擎与机器学习平台打通算法层风险评分GBDT+LRDeepFM团伙发现图算法自研无监督垃圾文本TextCNNWide&Deep风险设备IForest自研指纹行为序列Transformer自研团伙序列策略融合风险评分融合评分团伙评分单场景评
5、分白评分团伙发现可解释性团伙标签垃圾文本变体内容行为属性风险设备设备标签唯一性检测机器学习平台算法框架TensorflowPytorchSparkML任务调度公有云打通Docker特征工程特征构造特征计算版本管理升级回退在线预测模型部署准召率评估一键上线风控引擎与算法平台打通实时引擎调用模型微服务实时团伙服务实时评分服务设备异常服务文本实时预测行为序列标签模型解释话术自动分析异常根因分析自动规则生成配套工具后台团伙管理设备查询评分管理行为序列查询智能风控增强欺诈识别能力提升风险感知能力策略评估更准确提升对抗效率智能风控:提升对抗效率监控到波动用户信息特征行为特征风控画像特征注册地、用户等级、手
6、机归属地、区号、手机参数行为IP/设备、行为类型个数(行为路径)、沉默天数、最近登陆地uid/ip/设备风控记录、团伙分数、用户评分提取特征规则提取效果校验挖掘算法决策树(GBDT)、KS、方差分析、分位数提取策略是什么:哪个IP、哪个手机区号粒度:地点:国/省/市,时间:月/日/时阈值:连续:=,离散:in=策略:注册月份=202212&沉默天数110&沉默天数120&今日行为类型数=3评估指标高质量白名单误杀占比(准确率)识别量(召回率)提升效率:减少了 监控排查策略上线 人力与时间 减少监控噪音,提升监控准确性高吞吐设计-行为指标实时计算诈骗:user.level=1000 group