《杜振东-GraphRAG在企业知识服务中的应用落地.pdf》由会员分享,可在线阅读,更多相关《杜振东-GraphRAG在企业知识服务中的应用落地.pdf(14页珍藏版)》请在三个皮匠报告上搜索。
1、演讲人:杜振东 职位:NLP研究院负责人GraphRAG在企业知识服务中的应用落地当前场景痛点问题目前智能业务咨询场景是基于维护好的FAQ库进行向量检索匹配、答案召回,并且部分问答流程需要通过系统名称和功能模块做FAQ知识筛选再进行返回,同时向量检索的精准度仍然有待提高,检索结果之间存在较大的差异,整体向量检索阈值也偏高。知识体系缺失知识以FAQ及文档形式进行沉淀,但缺少分类清晰的、可视化的知识体系,难以实现快速知识定位。知识内容缺失因未形成知识体系,咨询的问题范畴局限于QA对,知识内容存在缺失,且需定期开展知识运营,维护FAQ库。问答准确率需提升当前用户问题咨询描述宽泛,语义理解无法精准定位
2、FAQ问题或相关文档,问答准确率需进一步提升。大模型幻觉问题大模型幻觉问题会导致回答内容与用户咨询内容不匹配,或生成无关内容,缺少输入限制对模型生成内容进行约束。知识图谱引入:什么是知识图谱?知识图谱是一种揭示实体之间关系的语义网络,描述真实世界中存在的各种对象及其关系,用节点表示对象,边则由属性或关系构成。知识图谱以本体为核心,以三元组模式为基础框架,全面体现实体、属性、关系等多颗粒度多层次的语义关系。统一的结构化的表现形式,机器可读,对人类友好。结构化结构化含有丰富的语义信息,方便定义概念、属性、实体之间关系。语义关系语义关系构建之后可以作为背景知识直接供下游应用使用。多方调用多方调用丰富
3、关联信息,天然具有图的各种特征,可以进行图的相关操作。图操作图操作知识图谱与传统知识库相比具有的三大特征可呈现为有向图结构化的形式图结构形式可将概念、实体及其关系结构化组织起来,具有高效检索能力高效的检索能力可从已有知识中挖掘和推理多维的隐含知识智能化推理能力对应解决问题通过图结构关系,构建可视化知识体系,呈现知识关联关系可视化知识体系根据知识图谱的结构化知识存储形式,可实现知识精准检索定位知识精准定位基于图谱结构进行知识补齐,实现相关知识智能关联推送知识智能关联知识图谱引入:知识图谱融合大模型的可行性利用知识图谱中的知识构建测试集,可对大模型的生成能力进行各方面的评估,降低事实性错 误的发生
4、概率。知识图谱能够为通用大模型的工业化应用提供行业领域的知识支撑,弥补通用大模型语料里专业领域知识的不足。大模型可以利用其语义理解和指令遵循等能力辅助知识图谱的半自动化构建设计、增加知识的全面性和覆盖度,协助更好的完成知识融合和更新大模型可以利用语义理解和生成等能力抽取知识,提高知识抽取的准确性和覆盖度,也可以抽取出隐含的、复杂的、多模态的知识,降低图谱构建成本。大模型可以辅助提升知识图谱的输出效果,生成更加合理、连贯、有创新性的内容,例如文 本、图像、音频等。利用知识图谱在大模型中引入指定约束,适度控制内容生成,提高大模型在行业应用场景中的适应能力。互补大模型知识图谱融合方向互补关系大模型擅
5、长处理自然语言和模糊知识,而知识图谱擅长表示结构化知识并进行推理。通过图谱结构化的特点规范输入数据,大模型的输出数据也更加准确。大模型可以用于非结构化文本的知识提取,提取图谱构建的要素。知识图谱可以为大模型提供结构化知识进行语义补充和生成引导。互动增强知识图谱和大模型融合可以相互增强各自的能力。知识图谱可以提高大模型的语义理解和准确性,而大模型可以为知识图谱提供更丰富的知识和生成能力。知识图谱智能问答技术路线数据处理多源 异构业务系统文本数据业务FAQ数据国客系统音频数据图谱构建schema设计本体设计关系定义语音转文本数据清洗属性定义实体定义知识抽取文档解析实体识别实体链接关系抽取知识融合向
6、量表征实体对齐冲突检测知识建模图谱查询语义分析意图理解链条推理答案召回智能问答问题解析图谱检索图谱推理答案关联生成知识图谱构建及智能问答大语言模型训练模型预训练模型微调优化大语言模型智能问答Prompt填充构建语义内容表征输出问题答案智能生成结构化知识图谱语料增强大模型输入大模型能力增强知识图谱构建大模型智能问答流程向量检索GraphRAG检索融合知识图谱增强链式关系链式推理知识关系图谱增强推理溯源线索追溯知识图谱推理验证智能问答应用图谱知识增强大模型答案生成用户问句答案输出大模型输出反馈知识图谱扩充数据改良抽取优化表征增强建模数据处理企业自有系统音频数据客服音频数据语音识别文字l 对录音对象