《张世鸣_GraphRAG在CVTE多业务场景下的探索与应用.pdf》由会员分享,可在线阅读,更多相关《张世鸣_GraphRAG在CVTE多业务场景下的探索与应用.pdf(25页珍藏版)》请在三个皮匠报告上搜索。
1、演讲人:张世鸣 视源股份(CVTE)中央研究院数据挖掘 研究员 Apache HugeGraph PMC MemberGraphRAG GraphRAG 在在 CVTE CVTE 多业务场景下多业务场景下的的探索与应用探索与应用GraphRAG 简介及框架GraphRAG and HugeGraph-AI01Education02智能教育场景Customer Service03智能客服场景Work Plan For Next Quarter04目 录CONTENTS未来工作GraphRAG 简介W o r k S u m m a r y A n d R e v i e wRAG-GraphRA
2、GRetrieval-Augmented Generation with Graphs(GraphRAG)https:/arxiv.org/pdf/2501.00309外部可靠知识库来增强上下文知识 图结构、多样化的基于图的算法和相关的技术GraphRAG Introduction Retrieval-Augmented Generation with Graphs(GraphRAG)https:/arxiv.org/pdf/2501.00309Query Processor:命名实体识别、关系提取;查询结构化 Text2GQL、复杂查询多步分解、查询扩展语义增强。Retriever:1)基于
3、启发式 2)基于学习 3)神经+符号Organizer:去除无关信息、优化信息结构,保证质量。Generator:LLM-basedApache HugeGraph 图智能生态框架Apache HugeGraph-AI知识抽取与融合社区发现与摘要图路径遍历图神经网络Text2GQLhttps:/ ConstructionExplicit Relation&Implicit RelationExplicit Relation Construction 题目涉及知识点题目涉及知识点解析解析已知函数 求其在区间 2,2 上的最大值和最小值。知识点摘要知识点摘要:二次函数的性质概念关键词概念关键词:最
4、大值、最小值 认知诊断:知识状态、知识点的掌握度知识追踪:分析行为记录、动态建模知识状态变化、预测未来表现错误也有增益、多次错掌握度下降、间隔长会导致遗忘Implicit Relation Construction 认知诊断&知识追踪学习模块:建模学习增益,学习单元,知识吸收遗忘模块:消除遗忘影响,更新学生完成第 t 次学习交互后的知识状态预测模块:预测题目准确率(q 知识点向量、e 习题向量)因果推理:识别变量间因果关系并量化其效应的分析方法(是否掌握知识点 A 对知识点 B 的影响效应)混淆变量识别:后门准则集合 Z 中没有 X 的后代节点。集合 Z 阻断了 X 与 Y 之间的每条含有指向
5、 X 的路径。因果效应估计:基于倾向得分:基于匹配、加权、分层,平衡处理组和对照组的特征分布,减少选择偏差,估计处理组和对照组之间的平均因果效应。基于双重机器学习:消除混淆变量 X 对结果变量和干预变量 的影响分别使用混淆变量 X 预测结果变量和干预变量,实际-预测得到残差(未被干扰的A和B)对残差进行线性回归,回归系数即为A 对 B 的因果效应估计量。Implicit Relation Construction 因果推断因果结构学情报告学生 A 对章节 B 涉及知识点的掌握情况信息过载:确定遍历的方向,有选择地探索1)实体&关系链接2)shortest path班级对章节 B 涉及知识点的整
6、体掌握情况(based on hugegraph-computer)1.找到章节 A 包含的所有知识点进行遍历,2.遍历这些知识点,找到班级中所有学生对这些知识点的掌握情况。3.按知识点分组,计算每个知识点的平均掌握分数。4.返回知识点名称和平均掌握分数。Graph Augmentation:历史学生报告子图补充上下文Retrieval Graph Traversal探索图的结构,寻找路径、检测循环、遍历图决策变量:约束:路径长度约束:(如每天学习5个知识点)。依赖约束:若影响效应大于域值(如0.6),则 必须在 之前。重复约束:同一知识点最多出现 N