1、私域知识问答链路的建设与优化演讲人:范志东 蚂蚁图计算开源负责人Graph+AI 时代Graph+AI 技术背景01GraphRAG 检索链路增强02大规模实时知识图谱构建03未来展望04目 录CONTENTSGraph+AI 技术背景Graph 的价值内涵关系本体论:“我连接故我在”Graph科学内涵:最复杂的数据结构客观内涵:万物互联的必然性哲学内涵:存在不是实体的集合,而是关系的场域优势关系的确定性图算法的可解释性图特征的稳定性从LLM到Agents提提示示工工程程(P PE E)、微微调调(F FT T)、检检索索增增强强生生成成(R RA A G G)函函数数调调用用(F Fu un
2、 nc ct ti io on n C Ca al ll li in ng g)记记忆忆(M M e em m o or ry y)推推理理(R Re ea as so on n)、规规划划(P Pl la an n)智智能能体体(A A g ge en nt t)Graph+AI:符号主义增强连接主义决策树强化学习KAGLLMA gents进化算法具身智能AG I?智能控制专家系统G raphRAG神经网络行行为为主主义义(感感知知思思维维)人工赋予智能自主学习智能反馈获得智能进化控制连连接接主主义义(具具象象思思维维)仿生学习符符号号主主义义(抽抽象象思思维维)数理逻辑适应性强可解释性差鲁
3、棒性不足可解释性强规模受限Scal i ng Law推理幻觉Graph+AI 白皮书数数据据算算法法应应用用图数据增强图数据构建图采样知识表示图神经网络图基础模型知识图谱Text2G Q L图系统优化G raphRAG智能体G G r ra ap ph h+A A I IKAGGraphRAG 检索链路增强广义的 RAG 链路L LL LM M用用户户检检索索器器任务描述查询样本提提示示词词工工程程知知识识库库预训练微调搜索相关文档提示词+提示词查询结果索引训训练练数数据据领领域域数数据据智智能能体体VectorRAGAgenticRAGGraphRAGMemoRAGTableRAGSelfR
4、AGHippoRAGDB-GPT GraphRAG 能力演进v0.5.6:通用RAG框架v0.6.0:社区摘要v0.6.1:社区摘要v0.6.3:性能优化GraphRAG 基础能力建设向量索引Text2GQL混合检索增强:文本、向量、关键词问问题题T Te ex xt tG G Q Q L L/C Cy yp ph he er rT Tu uG G r ra ap ph hV Ve ec ct to or rK Ke ey yw w o or rd ds sText2G Q LA gent向量索引(fai ss、vsag)关键词抽取(LLM)意图识别Available in DB-GPT v0
5、.7.0GraphRAG 链路的持续改进文档理解多模态知识抽取智能体化大规模实时知识图谱构建图数据库私域知识库的系统化性能需求知识图谱GraphRAG高质量大规模实时性高质量知识召回大规模知识存储实时性知识构建与查询GeaFlow:开源流图计算引擎SQL+ISO/GQLDSLParser/OptimizerSchema/TypeUDF/ConnectorAPIFrameworkSchedulerStream APIGroupCycleSchedulerState MachineFault TolerantRuntimeWorkerManagerTask RunnerWindowShuffleS
6、tateKV StateGraph StateIndexPush DownPersistencySchemaPipelineStatic Graph APIDynamic Graph APIRay/K8SMemory ManagerKey GroupState OperationGeaFlowGeaFlow在线图查询增量图计算实时图构建分布式图计算分布式图存储GeaFlow即将进入Apache孵化器GeaFlow流图计算能力与性能分布式实时图计算图表混合处理(SQL+GQL语言)统一流批图计算万亿级图原生存储交互式