《专场5.3-基于图数据库的知识图谱一体化解决方案-李文杰.pdf》由会员分享,可在线阅读,更多相关《专场5.3-基于图数据库的知识图谱一体化解决方案-李文杰.pdf(103页珍藏版)》请在三个皮匠报告上搜索。
1、基于图数据库的知识图谱一体化解决方案李文杰北京大学重庆大数据研究院图数据库与知识图谱实验室目录01020304概述知识图谱构建知识图谱存储管理知识图谱应用什么是知识图谱?Part 1-12012年5月16日,Google发布“知识图谱”的新一代“智能”搜索功能。知识图谱(Knowledge Graph)本质上是基于图的语义网络,表示实体和实体之间的关系!知识图谱(Knowledge Graph)什么是知识图谱?知识图谱本质上是基于图的语义网络,表示实体和实体之间的关系!知识图谱(Knowledge Graph)Facebook Social Graph“My friends who live
2、in Canada”2013年1月16日 Facebook Graph Search 产品发布会-Mark Zuckerberg?Facebook Social Graph“Photos of my friends who live in Canada”Facebook Social Graph知识图谱是Web 和大数据时代的知识工程新的发展形态。知识工程的核心:知识库和推理引擎。领域本体的构建:面向特定领域的形式化地对于共享概念体系的明确而又详细的说明知识抽取:从海量的数据中通过信息抽取的方式获取知识知识融合:通过对多个相关知识图谱的对齐、关联和合并,使其称为一个有机的整体,以提供更全面知识
3、传统知识工程 Vs.以知识图谱为代表的新一代知识工程“Knowledge is the power in AI”-Edward Albert Feigenbaum知识图谱与知识工程知识图谱生命周期Part 1-2知识图谱生命周期本体设计Part 2-1Schema设计知识抽取知识融合知识加工知识存储知识图谱Schema设计是重中之重,贯穿整个知识图谱生命周期知识图谱构建基本流程Schema设计又可以称之为“本体设计”,用于设计知识图谱架构,如确定知识图谱中所有具有的实体类型、各类型所具有的属性以及实体与实体之间的关系等。Existing system:Protg Free,open-sourc
4、e,active Extensible,highly pluggable W3C standards compliant Various format supported本体设计Protg is an excellent tool,but:Difficult to use for Chinese;Too many click actions;Classes and properties are listed in a tree structure respectively,not easy to get the overall relationships.ProtggBuilder简介gBui
5、lder是北京大学王选计算机研究所数据管理实验室历经两年研发的知识图谱自动化构建平台。通过结合NLP技术、机器学习、人工智能、知识图谱、图数据库等众多技术,打造的一个针对结构化数据和非结构化数据的知识图谱自动化构建平台,实现数据向知识的转化。gBuilder的可视化schema设计gBuilder提供了可视化的、轻量级的知识图谱Schema设计功能,用户只需要简单的拖拽就可以完成知识图谱Schema设计,同时还支持Schema的导入和导出。Schema设计的几点心得 Schema设计是一个设计工作,没有绝对的正确与错误,但一般要考虑如下几个方面 Schema设计要以“需求为主,数据为辅”Sch
6、ema设计的关键是明确实体、属性和关系,尤其是哪些作为属性,哪些作为实体?Schema的关系的方向性关系不大,但一般遵循基本常识 Schema属性要注意数据类型、值域、定义域的设置知识抽取Part 2-2知识抽取知识抽取知识获取的目标是从海量的文本数据中通过信息抽取的方式获取知识,其方法根据所处理的数据源的不同而不同。分为:结构化数据 半结构化数据 非结构化文本数据文本信息抽取:从非结构化文本数据中进行知识抽取 实体识别 实体消歧 关系抽取 事件抽取知识抽取目标知识图谱将存储在关系型数据库等的结构化数据以及存储在文本文件中的非结构化数据抽取出来,形成以点和边为主的知识图谱数据,实现数据向知识的