1、DataFunSummitDataFunSummit#20232023环路检测在风控领域的应用实践环路检测在风控领域的应用实践韩纪飞-Fabarta-高级技术专家背景与挑战算法优化应用案例总结与展望目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#202320230101背景与背景与挑战挑战环路检测含义与应用 环路检测算法是一种用于识别和防止欺诈行为的强大工具。它通过分析交易和资金流动的网络,检测潜在的环路结构,以识别异常模式和潜在的欺诈行为。挑战有限硬件资源下的算法调整数以亿计点边的大型图网络下算法效率的挑战多重图的支持与优化010203DataFu
2、nSummitDataFunSummit#202320230202算法算法优化优化大型图网络下算法效率优化 分布式图计算 利用分布式计算框架libgrape-lite,将大规模图数据切割为子图,并通过并行计算和消息传递方式实现高效的环路检测。除环路检测外,ArcNeural多模态智能引擎基于该框架已支持50+算法,覆盖路径分析、中心性分析、社区发现、关联性分析、子图挖掘等场景。测试项测试项ArcNeuralArcNeural多模态智能引擎多模态智能引擎PlatoPlato资源使用情况资源使用情况BFS1.16s10.37s压力持续时间:8hCPU使用率:=75%内存使用率:impact-tab
3、le 数据量:10w个 table,1w个 impact边DataFunSummitDataFunSummit#202320230303应用应用案例案例应用案例 环路场景 交易闭环:指定一批起点,沿着环路方向,交易时间(边属性)递增。50w点,2000w边上发现30w+交易环路涉及6000左右点。转账回路:不指定起点,给定时间区间,环路上起始边转账时间满足区间。20w点,400w边上发现3跳以上环路10w+涉及5000点。发现潜在风险主体后,结合环路交易次数、交易金额、环路长度等输出风险评分,为审核人员和机器模型提供重要特征参考。DataFunSummitDataFunSummit#20232
4、0230404总结与总结与展望展望总结与展望 总结 介绍了环路检测算法在风控场景的探索,提供了算法效率优化、硬件资源限制下的算法探索,为环路检测算法在风控场景的落地提供了工程化方案。展望 环路虽然简单直观,但离最终的业务指标尚有距离,环路检测与上下游链路的融合仍需努力。分布式算法开发较为复杂,优化开发链路,新型AI工具的使用等。图切分策略的优化升级。公司介绍Fabarta 是一家 AI 基础设施公司,基于自研的多模态智能引擎,提供结构化数据和非结构化数据的融合存储(记忆)和分析(推理)能力,并通过低代码平台帮助企业将AI能力快速落地到业务场景中。ArcNeuralArcNeural 多模态智能
5、引擎多模态智能引擎 以 Data-Centric AI 为核心构建 AI 时代的数据基础设施产品,将传统的数据库“存储&计算”架构演进为“记忆&推理”架构,是 AGI 时代的核心基础设施。FabartaFabarta 企业智能分析平台企业智能分析平台 结合 ArcNeural 多模智能引擎的企业级智能平台,帮助开发者、咨询师以及应用开发人员更快速地将图引擎与大模型的融合能力应用于行业中,加速图智能在企业场景的落地。FabartaFabarta 多模态数据编织平台多模态数据编织平台 为企业打造基于数据编织技术的下一代数据价值生态的基础设施,利用智能的技术帮助企业盘点数据资产,构建数据资产地图,让企业充分发挥数据流动带来的价值。感谢观看感谢观看