《梁磊-工业级知识语义框架SPG.pdf》由会员分享,可在线阅读,更多相关《梁磊-工业级知识语义框架SPG.pdf(41页珍藏版)》请在三个皮匠报告上搜索。
1、工业级知识语义框架及引擎架构梁磊蚂蚁集团演讲嘉宾梁磊蚂蚁集团技术总监/资深专家蚂蚁知识引擎负责人,个人主要技术方向为知识图谱、搜索推荐引擎及AI工程等,于2018年开始主导蚂蚁知识图谱的建设,基于蚂蚁多样性的金融业务场景构建了企业级知识图谱引擎架构,平台累计提报140+件专利,10余项软件著作权,主导支撑孵化的项目先后获得BU总裁特别奖、数据科学奖、优秀成果奖等,平台能力通过了CESI测评认证,目前也在主导IEEE 2807.2金融知识图谱标准化、SPG知识图谱语义标准化等工作。演讲嘉宾目 录CONTENTS1.什么是知识图谱2.图谱技术发展的机遇与挑战3.SPG(Semantic-enhan
2、ced Programmable Graph)4.蚂蚁知识图谱引擎1.什么是知识图谱PART 01知识图谱的主要形态 文档要素知识化材料来自公开资料通用知识图谱的构建方式,通过理解文档中的核心要素(NER 命名实体识别)、关系谓词抽取(SPO三元组)来构建要素之间语义关联知识图谱的主要形态 搜索引擎体验提效Person(x1)Person(x2)前妻(x1,x2)-前夫(x2,x1)Person(x1)Person(x2)女儿(x1,x2)性别(x2,Male)-爸爸(x2,x1)知识图谱在风控中的应用,构建以“人”为中心的上下文介质网络,辅助发现风险线索知识图谱的主要形态 应用于安全风险洞察
3、知识图谱的主要形态 应用于企业知识管理基于知识图谱实现知识管理,构建事件、实体、常识概念的分层知识图谱:语义、高阶、多元、链式知识化数据管理方案材料来自公开资料定义建模世界万物的关联关系终态人工智能的大脑文本:一维图谱:二维、多元.思考思考它是一种建模世界的方法实现数据的知识标准化、语义互连张译/演员狂飙/电视剧张颂文/演员出演主演主演知识图谱:语义、高阶、多元、链式知识化数据管理方案知识图谱:整体链路和构建方式New FactsNew RelationsNew AxiomsNew Rules属性补全关系预测错误检测知识问答搜索推荐研报新闻领域知识.知识抽取实体链指属性标化实体融合三元组构建
4、领域知识沉淀:基于图谱知识语义、图结构实现知识表示和互联,是实现领域知识积累的有效方法 知识标准化:利用知识图谱相关技术不断提升实体、概念、关系、事件等的标准化和归一化水平 知识融合&复用:构建领域知识图谱,通过融合、推理等服务多下游任务,为业务降本提效 知识推理发现:基于图谱推理洞察发现更多稀薄知识,服务风控、信贷、理赔、商家运营、营销推荐等场景实体、事件、概念、关系等知识图谱:整体链路和构建方式非结构化/半结构化数据核要素/概念关系抽取实体链指业务领域结构化知识库他域知识图谱实体归/实体链指业务数据ID对领域概念体系、专家规则关联1领域知识构建2专家规则沉淀3跨域融合&复4业务数据对、多模
5、态学习2.图谱技术发展的机遇与挑战PART 02知识图谱技术发展的机遇与挑战通用知识图谱通用知识图谱(2012)以google、百度为代表超越通用知识图谱超越通用知识图谱,推动知识驱动的企业数字化升级广全、静态常识、正确率容忍、头部覆盖深精、动态时空、可解释要求、薄客洞察领域知识图谱领域知识图谱(2018)融、公安等为主要拉动企业数字化升级艾瑞咨询2022中国知识图谱市场业报告,市场空间:2021年/107亿元,2026年/290亿元sameAsrelationBArelateTo,contains,.prj 1prj 2prj 3基于图谱的知识互联基于图谱的知识互联企业级知识图谱Data F
6、abricUnifying Large Language Models and Knowledge Graphs模型+知识图谱双驱动LLMs+KG以蚂蚁金融场景图谱应用为例 从静态常识到Deep Context语义关联的需求跃迁基础事实UserCompanyProductShop信息语义标化深度语义关联Deep Context交易客体融场景 异构动态关联 经营数据沉淀 复杂领域规则关关联联解解构构 险事件感知经营增财富问答认知圈人商家分层 险防控资金追踪欺诈/洗钱/产识别eKYB/eKYB/eKYCeKYC 智能化应知识管理模式从二元静态到时空多元的模式跃迁常识知识图谱仅使用概念层归纳,无法感