《赵帅-Graph+LLM如何重塑传统BI的未来.pdf》由会员分享,可在线阅读,更多相关《赵帅-Graph+LLM如何重塑传统BI的未来.pdf(21页珍藏版)》请在三个皮匠报告上搜索。
1、 Altair Engineering Inc.Proprietary and Confidential.All rights reserved.Graph+LLM 如何重塑传统BI的未来 Altair Engineering Inc.Proprietary and Confidential.All rights reserved.12345目录2图数据而不是关系型数据关系型数据如何变成图数据LLM如何从图中查询数据ChatBI Demo演示 Altair Engineering Inc.Proprietary and Confidential.All rights reserved.灵活的数
2、据模型无需事先定义结构,根据业务需求灵活地扩展节点和边的属性擅长处理复杂的关系数据图数据库将数据看做一个由节点和边构成的图形结构,这使得查找和理解数据变得更加容易更高的查询效率使用图遍历算法来执行查询,可以快速找到节点之间的关系路径。擅长解决“长链”、复杂、深度查询等问题图数据 VS 关系型数据支持非结构化数据图数据库可以通过图模型来存储这些半结构化数据和非结构化数据 Altair Engineering Inc.Proprietary and Confidential.All rights reserved.RDF 图数据的基本表现形式4RDF的英语全称为Resource Descripti
3、on Framework,中文名称为资源描述框架。RDF是一种描述数据文件储存的数据模型,该数据模型通常描述由三个部分组成的事实,被称为三元组(triples)罗纳尔多的知识图谱三元组表示:prefix person:.prefix place:.prefix:.person:1:chineseName 罗纳尔多路易斯纳萨里奥德利马string.person:1:career 足球运动员string.person:1:fullName Ronaldo Lus Nazrio de Limastring.person:1:birthDate 1976-09-18date.person:1:heig
4、ht 180int.person:1:weight 98int.person:1:nationality 巴西string.person:1:hasBirthPlace place:10086.place:10086:address 里约热内卢string.place:10086:coordinate-22.908333,-43.196389string.RDF的表达能力有限,缺乏抽象能力,无法对同一个类别的事物进行定义和描述 Altair Engineering Inc.Proprietary and Confidential.All rights reserved.RDFS(RDF Sch
5、ema)RDFS为RDF提供了一种简单的模式语言,使得我们能够对实体类和属性类进行定义rdfs:class来定义实体类,如“图书”、“作者”等rdfs:property来定义属性rdfs:domain 表示该属性属于哪个类别rdfs:range 描述该属性的取值类型5 Altair Engineering Inc.Proprietary and Confidential.All rights reserved.OWLRDFS的扩展OWL(Web Ontology Language)基于RDF和RDFS,提供了能够更精确地描述知识结构和语义关系例如:属性的细化owl:DatatypeProper
6、ty定义了数据属性owl:ObjectProperty定义了对象属性关系型数据 VS 图数据表格Class列DatatypeProperty列所属表domain列的类型literal表JoinObjectProperty6 Altair Engineering Inc.Proprietary and Confidential.All rights reserved.关系型数据 转化为 图数据数据建模数据建模数据建模数据建模将关系型数据库中的表和关系映射为图数据库中的节点和边,也就是OWL本体需要定义类(Class)、属性(Property)1数据导出数据导出SQL、Spark SQL将关系型数