《陈佼-SPG语义增强知识图谱编程框架-V1123.pdf》由会员分享,可在线阅读,更多相关《陈佼-SPG语义增强知识图谱编程框架-V1123.pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、SPG语义增强知识图谱编程框架陈佼 恒生电子目 录CONTENTS1.知识图谱发展的机遇及挑战2.语义增强可编程框架SPG3.大模型时代下知识图谱应用的新范式知识图谱的机遇及挑战PART 01知识图谱发展的机遇与挑战19501977发展期20121955年,加菲尔德提出了将引文索引应用于检索文献的方法1965年,普耐斯等人提出引用网络来研究当代科学发展脉络的方法1968年,奎林提出语义网络的概念,是一种用图来表示知识的结构方法启蒙期成长期1977年,知识工程的概念在第五届人工智能大会上提出,以专家系统为代表的知识库系统被广发研究和应用1991,年,Niches提出知识本体的概念,把领域知识形式
2、化1998年,万维网之父再次提出语义网2002年,机构知识库的概念被提出,知识表示和知识组织开始深入研究2012年,Google提出知识图谱概念国外内各种百亿、千亿级图谱诞生Data FabricLLM+KG知识图谱发展的机遇与挑战Unifying Large Language Models and Knowledge Graphs:A RoadmapTop Strategic Technology Trends for 2022企业级知识图谱业务落地路线新闻/公告/研报/财报/网页等企业信息/行业信息/指标数据/标签等专家梳理半/非结构化数据结构化数据领域知识新关系推测业务规则验证新规则推测
3、专家建模知识生产知识构建知识融合知识评估知识计算图谱推理图谱应用自上而下专家驱动设计Schema图谱的持续迭代、数据优化、功能演进图谱的融合、复用、链接质量评估企业股东、实控人、疑似受益人、集团关系查询哪些公司属于高新企业新能源汽车产业链上有哪些企业企业A、B之间存在什么关系路径某事件发生后,对某公司及关系网络有何影响,该影响可能会带来何种后续影响专利方面,哪个公司与公司A最相似图谱的持续迭代、数据优化、功能演进图谱的融合、复用、链接质量评估从静态到多元动态:知识管理模式的跃迁企业对知识图谱智能化和精准化需要由单一检索推荐的C端应用向风控、向风险防控/经营管理的企业级B/C联动的领域应用可感知
4、上下文的信息和时空关联能力要求基准智能化应用要求知识管理具备较强的上下文感知能力,仅使用概念层归纳,无法感知个体差异多源异构的多模态数据复杂形态的管理由单纯的结构化半结构化知识数据向业务中常见的日志、事件数据转换;由事实知识向事件、事理的复杂因果形态转换;由单一的文本知识向包括文本、语音以及图片数据多模态知识管理的转换;知识图谱发展的机遇与挑战知识构建/获取成本高缺乏统一的知识建模方法缺乏统一规范的技术框架图谱从构建到应用具有较长的全生命周期,涉及到的技术栈范围广、工具多,技术、数据、场景迁移成本高RDF:高门槛、强语义,工业落地少LPG:低门槛,弱语义,工业应用广泛知识抽取缺少统一范式专家经
5、验复杂且缺乏复用语义增强可编程框架SPGPART 02语义增强可编程框架SPGWhy Choose SPGSPG增强知识定义领域内唯一领域类型约束知识间依赖SPG Reasoning谓词/逻辑体系定义知识之间依赖,包括属性、关系、类型等之间的逻辑依赖与传导。谓词体系定义基础的谓词原语,以支持知识的推理和推断。更好地处理知识之间的关联和依赖关系,并且支持对复杂的业务场景进行建模和分析。事物(Thing)都必须有一个明确的领域类型(Class)领域类型内在结构:属性、关系等,通过关系与其他事物发生关联。基于领域知识的由动态到静态、由特殊到一般、由实例到概念的原则,将领域类型分为事件(Event)、
6、实体(Entity)、概念(Concept)三类。方便业务高效的知识分类和复用,并且实现知识的动态到静态自动分层。每个领域类型下的实例(instance)必须是唯一的,以保证知识的准确性和一致性。通过SPG Evolving提供可编程链指/归一能力,可以使用内置或自己开发算法Operator实现链指、归一算子不断提升实例的唯一性。基于SPG的工业级知识图谱引擎SPG分层架构SPG-Schema主体分类模型扩展实体类型:业务相关性比较强的客观实例,通过实体Properties(属性、关系)刻画个体画像,如用户、企业、商户等。概念类型:实体从具体到一般的抽象,表述的是一组实体集合、一种分类体系。相