《图数据库在金融风控系统中的实践-乔云从.pdf》由会员分享,可在线阅读,更多相关《图数据库在金融风控系统中的实践-乔云从.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、图数据库在金融风控中的应用-图模式、时序图与多模态的融合之路乔云从(Fabarta高级技术专家)演讲提纲背景介绍大数据时代图数据库的优势及重要性图数据库在大数据领域的现状风控系统中图数据库的功能及挑战图数据库在金融风控场景中的应用总结与展望背景介绍大数据的“4V”(VolumeVolume,VelocityVelocity,VarietyVariety,ValueValue)与关系型数据库相比,图数据库在分析深度的关联关系的场景中有明显的优势。随着大数据技术的广泛引用,图数据库的发展也迎来了井喷期。图是描述现实世界最优的模型。2013年开始至今,图数据库的流行趋势变化是所有垂直类数据库中最高的
2、,且看趋势至少未来3-5年也依然会保持最高。风控系统的特征风控系统的特征风控系统中图数据库的功能及挑战HTAP,支持实时图计算图数据存储及优化查询速度快分布式高可用方案时序图实时图查询和图计算(HTAP)多模态存储,空间放大查询性能数据规模大、数据耦合数据多样性,结构不规则数据增长快,要求实时性关联关系中隐含的价值大图数据库必备的功能图数据库必备的功能图数据库面临的挑战图数据库的巨大机遇云计算/云存储计算的快速发展,基础设施完善,使用图数据库变得更容易,成本也大大减少随着图数据的价值不断被认可,越来越多的应用场景选择用图模型来表达业务数据信创和国产替代的大势下,图数据库的研发也进入井喷期HTA
3、P部署上,部署上,All-in-oneAll-in-one单机分布式一体化,一个数据库多种运行模式,方便PoC、测试资源上,存算分离资源上,存算分离存储和计算分离,松耦合,可独立扩展使用上,使用上,Graph HTAPGraph HTAPAP和TP拥有独立计算资源,但共享一份数据,且走TP可直接调用AP算法,使用简单Graph HTAPStorage(图数据分布式存储)TP(图查询)AP(图计算)计算存储HTAP-具备基本TP能力常见的系统中,图数据库/图计算引擎侧重于OLAP,更偏向于线下、批处理、非实时模式的数据分析;而实时的业务系统通常会根据架构选择其他的数据库来实现。重要一个很重要的问
4、题就出现了:打通两个数据库之间的数据传输(CDC)及传输过程中的数据管理(安全性、正确性等)给图数据库增加OLTP的能力,实时地更新图数据,保持数据的一致性,并提供实时的图计算能力。图数据库实现OLTP的几个重要部分:ACID,MVCC,多模态,存算分离,分布式增加架构的灵活性和可扩展性即可以self-serviced,也可以跟其他数据库/计算引擎组合HTAP-图算法集成(1)大数据技术中的一些算法,在图中可以更好更快的支持,例如,中心性算法,社群检测算法,寻路算法等。在图数据库中支持图算法可以共享图数据库的图数据和索引,减少资源开销和数据传输成本统一的查询接口架构上TP引擎和AP引擎更紧密的
5、集成HTAP-图算法集成(2)一个类Cypher语句,完成子图查询和图算法调用(比如:对最近一个月的交易进行环路算法查找)TP主要应对1-3跳高并发可使用AP,加速多跳查询的性能AP实时从TP中读取最新数据,避免数据延迟技术:HTAP 统一执行计划TP&AP 共享存储TP&AP 独立扩展图数据存储及优化(1)数据的存储与图的查询紧密相关图的集中存储方式 KV,邻接表、邻接矩阵多模态 时序边、JSON、向量、文档等内存缓存图数据存储及优化(2)存储层图数据缓存KV邻接表边集合属性值索引属性缓存索引缓存逻辑索引CSR邻接表拓扑缓存图计算引擎图数据库前端存储页/存储块Python AppJava A
6、ppC+App可置换数据压缩缓存击穿、雪崩查询优化一般查询计划的优化:逻辑重写,逻辑重写,CBOCBO,HBOHBO物理优化(空间换时间):属性索引,属性索引,物理视图等物理视图等图特有的优化:矩阵、矩阵、hophop 索引等索引等其他:调整数据模型调整数据模型(图结构)(图结构)示例:扩层中属性索引的使用MATCH(m:Person)-pc:Invest-(c:Company)-cc:Control*1.3-(c2:Company)WHERE m.id in p300129,p300130,p300140m.id in p300129,p300130,p300140 AND pc.inves