《大规模语义知识管理实践.pdf》由会员分享,可在线阅读,更多相关《大规模语义知识管理实践.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、蚂蚁知识图谱平台-大规模大规模语义知识管理实践语义知识管理实践易鹏(蚂蚁集团)2023.3个人简介 11年:硕士毕业于西安交通大学 1118年:百度资深研发工程师,负责索引和用户行为数据架构规模化和实时化相关项目 1823年:蚂蚁集团高级技术专家,负责知识图谱构建引擎团队,从0到1建设蚂蚁万亿级金融知识图谱数据管理平台提纲 蚂蚁知识图谱平台介绍 语义知识表示模型 语义知识管理关键技术及应用 展望知识图谱的发展2021年,知识图谱核心市场规模预计达到107亿元,而到2026年,相应规模将超过296亿元,2021-2026年CAGR=22.5%。金融与公安两大行业的占比较高且增长速度较快。来源:艾
2、瑞咨询:2022年中国知识图谱行业研究报告.pdf2012年谷歌提出了知识图谱的概念并将其应用在了搜索引擎领域,随后10年,facebook、微软、亚马逊等等国际、国内科技企业争先布局2022.5,知识图谱领域中国共申请专利36572件1980至2020,KG相关文章在Google Scholar发布量学术&产业界趋势蚂蚁知识图谱平台目标平台挑战:大量复杂的跨业务域多元关系多个不同职能的用户群体分析/决策实时化要求专家规则的复杂性解决方案:建设面向金融领域的一站式知识研发及管理平台提供业务知识建模,知识构建,知识可视化分析,专家经验决策和图谱算法推理等全场景知识生命周期解决方案蚂蚁金融知识图谱
3、建设现状u2020年-安全风险图谱:风控域覆盖商户规模最大的千亿级动态知识图谱,入选蚂蚁技术大事记蚂蚁技术大事记u2021年-智能资金图谱:解决任意深度资金意图跟踪问题,广泛应用与反洗钱、贷后管控等场景,荣获资金事业部总裁特别奖资金事业部总裁特别奖u2021年-CESI测评认证:首批通过电子四院知识图谱构建与推理能力测评u先后三次和业务一起提名SupermaSuperma,并和大安全一起获得了2021 T T-starstar数据科学奖数据科学奖u获得了5个软件著作权,以及提保51个专利,图谱算法顶会论文10篇u2020-20201技术能力先后被被ForesterForester、IDCIDC
4、点赞点赞,IEEEIEEE 金融知识图谱国际标准(金融知识图谱国际标准(IEEEIEEE P2807.2P2807.2)主要发起和参与方业务和数据规模高速增长实体/概念/关系类型超5000知识规模超万亿,近一年增长160%知识应用调用量超400亿/天,近一年增长超6000%提纲 蚂蚁金融知识图谱平台介绍 语义知识表示模型 语义知识管理关键技术及应用 展望语义化的作用 源于Semantic Network,使用语义和语义关系表示知识的网络结构 数据表示标准化,可复用性 不同领域数据可交互,促进Data Fabric 实体:业务相关性比较强的客观实例,如用户、企业、商户等 概念:抽象表述一类实体集
5、合。有较强复用性,如人群标签等 事件:加入时间、空间等约束的实体类型,如通过NLP、CV等抽取出来的企业事件、诊疗事件等知识分类和定义语义知识表示-SemanticPG优势:LPG&RDF混合模型,更适合业务数据到知识标准化的演化过程 提供业务易理解的表达,更利于知识复用,可规模化落地SemanticPG语义约束范式:1、逻辑推演:symmetric(spouse),transitive(located_in)2、完整性约束:mutexOf 3、属性类型约束:int/string等基础类型,标准类型(概念挂载)4、实体衍生/链指:subClassOf,equivalent,fuse;sameA
6、s 提纲 蚂蚁金融知识图谱平台介绍 语义知识表示模型 语义知识管理关键技术及应用 展望语义知识管理核心能力!#$!#$%&(%&(!#$!#$)*+,-)*+,-./0,1./0,1T+1实体T+m T+sSPO+v关系属性(算子)CUDv1v2 v3v4 v5基于DFS的知识管理架构Data/Meta/Dictionary CacheSchemaManagerKG Builder/Query/Scanner API仓储SDKNamespaceManagerPGFilePGFileMetaFileMetaFileIndFileTransformVersionsMarkdelMetricsLPG