1、GeoScene Knowledge Sever时空知识图谱产品与解决方案王志强知识图谱Knowledge Graph知识图谱是一种基于图的数据结构,由 节点 和 边 组成,每个节点表示一个“实体”,每条边为实体与实体之间的“关系”知识图谱本质上是一种大规模语义网络(Semantic Network),是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系通过将数据粒度从文件级别降至数据级别,聚合大量的知识,从而实现知识的快速响应和推理适用行业及更多应用场景探讨企业级知识图谱产品,基于图结构探索空间实体及实体间关系,提高决策制定速度。通过地图、链接图表、直方图和实体属性表等多种视角进行
2、可视化,挖掘隐藏知识。GeoScene Knowledge Server,助力打开认知大门3.1全新Knowledge Server知识图谱产品在知识图谱技术体系中的角色地理知识融合地理知识建模GIS+知识图谱业务应用属性抽取关系抽取实体抽取共指解析实体消歧知识融合实体构建关系构建既有知识多视图可视化查询检索智能问答理解、推理、决策知识库图分析与空间分析知识图谱构建知识图谱业务系统建设地理知识提取知识图谱产品带来的核心价值之一:图数据库的优势关系数据库处理密集join查询的性能会变差图只遍历满足查询条件的部分,非整图遍历性能图天生可扩展,可在已有结构上添加不同种类的新联系、新标签和新子图,不用
3、担心已有查询和应用程序的功能灵活性图数据库不需要模式图数据库开发方式符合当今敏捷开发需求敏捷性以客户为中心的、事务型应用程序存储顾客订单的关系模式某个顾客买了哪些商品有哪些顾客买了A商品有哪些买了A商品的顾客也买了B商品融合知识图谱的价值:图数据库具有天然优势查询效率 图数据库 VS 关系型数据库ArangoDB VS PostgreSQL 测试环境:-Azure VM(2 CPU+16GB RAM)测试数据集-PostgreSQL(ver 12.1):-表1(4万条记录)-表2(6.2万条记录)-表3(11.9万条记录)测试数据集-ArangoDB(ver 3.5.3):-实体类别1(4万个
4、,含子节点6.2万个)-实体类别2(11.9万个)查询结果:1000条记录 PostgreSQL 查询时长:481ms ArangoDB 查询时长:41ms参考文献:https:/ 图数据库 VS 非关系型数据库ArangoDB VS 主流 NoSQL 数据库 测试环境:-AWS i3.4xlarge(16核+122 GB RAM)测试数据库:-Neo4j 3.3.1 -MongoDB 3.6.1 -ArangoDB 3.3.3-PostgreSQL 10.1(表和json)-OrientDB 2.2.29 测试数据集:-斯坦福大学-SNAP Pokec 数据集(社交网络)-160万人(节点)
5、及他们之间的3060万条关系(边)测试项目:-读取单个文档、写入单个文档(常规及fsync)-聚合查询、二层扩线查询(返回ID和属性)-最短路径查询、内存使用量参考文献:https:/ 30317-2013 地理空间框架基本规定、GB/T 37118-2018 地理实体空间数据规范等多项国标的出台对地理实体的定义和生产规范做了进一步阐述。地理实体可分为地物实体和地理单元,地物实体通常包括水系、交通、建(构)筑物及场地设施、管线、地名地址、院落等。在本解决方案中,我们探索了使用GeoScene知识图谱产品对多种类型的地理实体如:行政区划、院落、建筑物、道路、水系、地铁线,地铁站进行建模。GeoS
6、cene知识图谱产品除了能够保存地理实体的属性及空间信息外,还可以清晰地通过图谱展示实体之间存在的关系。同时,产品还支持对地理实体进行属性和空间关系上的查询,针对知识图谱进行最短路径分析、中心性分析等操作。本解决方案验证和展示了GeoScene知识图谱产品在地理实体建模、入库、可视化和分析方面的能力.GeoScene知识图谱疫情分析知识图谱产品带来的核心价值之三:领域知识检索与智能问答知识图谱最直接的应用场景是构建知识库,步骤主要包括从海量信息中提取实体和关系,知识融合与建模,知识搜索以及智能问答。在本解决方案中,我们计划依据公司50服务器及公司网盘内的各项资料构建公司知识库,在构建知识库的过