1、知识工程引领AI智能体落地新范式许威|中兴通讯(兴云数科)许威中兴通讯 产品架构规划师/公司级教练中兴通讯股份有限公司产品架构规划师,公司高级AI教练,大型企业数字化转型实践咨询师。需求COP组长,部门能力提升负责人,公司二级讲师等。曾做过5年开发,4年项目经理,3年产品架构规划师等。目前主要负责公司AI产品规划,AI助力研发效能提升工作。目 录CONTENTSI.背景II.问题/痛点III.解决思路/整体方案IV.具体实现/技术实践V.总结与展望为什么要建设知识工程PART 01智能体的应用趋势:形成以AI为中心的增长飞轮人+AI作业经验知识AI+人作业经验知识人工智能(AI)已然成为驱动各
2、行业变革的核心动力。人机协作模式正从“人+AI”加速迈向“AI+人”,借助多个智能 Agent 协同作业,有力推动着研发范式的创新演进。对大模型来说,到底什么是最重要的知识工程建设面临挑战PART 02挑战一:海量异构企业存量知识清洗、修复知识关联缺失:不同知识之间的关联可能没有被很好地建立知识更新与维护:如何确保新的知识能够及时被纳入知识体系数据不完整:存在大量数据不完整数据不一致性:不同数据源之间可能存在数据不一致数据错误:包括数据录入错误、数据转换错误等结构差异:企业存量知识包含结构化(如数据库表)、半结构化(如XML文件)和非结构化(如文档、图像)数据.语义差异:不同部门或业务场景下可
3、能有不同的语义理解。缺乏通用工具:没有一种通用的工具能够适用于所有类型的企业存量知识清洗和修复自动化程度有限:实际应用中,仍然需要大量的人工干预数据异构性方面技术与工具方面数据质量方面知识管理方面挑战二:人的作业触点和知识工程流水线打通增量抽取知识文档结构维护困难知识结构维护管理难,后续加工与检索效率降低。自动化能力 多源批量采集框架,支持动态配置多个采集点人机协作流程反馈闭环机制,将人工修正结果反哺至流水线优化,提升自动化准确率AI能力未深度整合知识库内容碎片化,无法满足复杂场景的推理或推荐需求。识别已处理数据难度大,导致重复文档大量生成,降低知识库质量挑战三:从AI理解知识到自动化转换成语
4、料,RAG,知识树检索器的性能局限03生成器的质量问题04语义理解的局限性01知识表示与转换的准确性02多义性处理困难、语义隐含信息挖掘不足不同知识表示形式的转换、领域特定知识的转换检索准确性和检索效率回答的连贯性和合理性知识更新与同步挑战05知识树构建方面06知识更新滞后知识结构定义的主观性、知识树的完整性和平衡性、知识树的动态更新挑战四:精调语料、私域RAG、私域知识树的建设3知识结构规划知识节点的确定与填充知识树的应用与推广2私域知识获取与整合检索器的挑战生成器的局限性1语料质量语料的代表性和多样性语料与模型的适配性私域知识树建设方面精调语料方面私域RAG方面知识工程新范式PART 03
5、知识工程的顶层范式:作业即知识Agent输入给Agent收到Agent产出AI知识库知识工程流水线作业即知识Agent输出知识修改后通过通过Agent教练AI模型精调经验增强知识工程涉及3个循环:作业循环。多Agent协作完成作业,构成作业循环。在这个过程中会产生知识作业与知识循环。作业过程中,通过知识工程流水线,将知识沉淀到知识库中,增强Agent的能力作业与模型循环。作业过程中产生的知识,通过精调,增强模型的能力知识工程关键点:Agent能理解的知识知识产品Agent设计AgentAgent产生Agent消费AI理解的需求的关键点:完整、详细的细节描述,包括页面元素布局,交互,实体设计等。
6、知识工程:构建“作业-知识-经验”的闭环AI知识工程体系知识RAG语料知识树精加工精加工精加工Agent作业人作业产生的知识LLMAgent增强AI检索能力增强AI作业能力增强AI块召回与波及分析能力知识工程流水线精调 以“AI理解的知识”为核心,通过端到端贯通与精加工,不断提升Agent的能力Agent消费Agent产生企业存量知识知识的提炼过程知识识别与采集,包含内部知识和外部知识知识处理,包含噪声、去重、填充、补全等知识存储与应用,包含向量库存储、图谱图存储等向量库知识:以便于Agent语义检索为目标企业存量知识存储:空间存储:空间企业中转库RAG工具:知识工程流水线主要场景:将企业存量