1、DataFunSummitDataFunSummit#20242024知识图谱增强在知识图谱增强在360360文档知识文档知识问答及管理中的应用实践问答及管理中的应用实践刘焕勇 360人工智能研究院 资深算法专家360360文档云知识管理文档云知识管理/问答应用场景问答应用场景KGKG在文档在文档RAGRAG问答中的应用问答中的应用KGKG在文档标准化、层次化、结构化应用在文档标准化、层次化、结构化应用KGKG与与LLMLLM在文档场景下的挑战及展望在文档场景下的挑战及展望目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#202420240101360
2、360文档云知识管理文档云知识管理/问答应问答应用场景用场景非结构化内容管理难扩展非结构化内容管理难扩展企业非结构化数据管理的主要挑战是数据的储存、访问、控制、共享和协同,这些挑战需要高效的技术和策略来解决。非结构化数据利用率低非结构化数据利用率低非结构化数据格式复杂,如文本、图像,数据处理成本高,数据分析难度高,数据创新空间低。55%-80%55%-80%的组织业务数据处于沉睡状态,价值呆挖掘Source:Spiceworks2018202533ZB175ZB175ZBIDC 预测,到2025年全球数据量将增长至175 175 ZBZB80%-90%非结构化数据非结构化数据业务痛点业务痛点:
3、非非结构化数据快速增长,有效管理和价值挖掘面临结构化数据快速增长,有效管理和价值挖掘面临挑战挑战企业文档包含大量高质量私域语料数据Office文件、PDF等数据统一结构化处理能力只要持续产生新文档,就有新的数据生成有数据有数据存储和管理海量的存储和管理海量的高质量高质量企业数据企业数据资产资产懂安全懂安全基于组织和权限保护企业数据安全基于组织和权限保护企业数据安全文档云对文件的9级权限校验文档云全生命周期安全防护,覆盖云端扫描+本地态势感知及外发等360360文档文档云三大天然优势云三大天然优势大模型是万事通,对行业知识和专业知识做不到精通;大模型与组织内部的知识不互通、业务结合不紧密,不能满
4、足企业内部业务开展的要求;不懂企业不懂企业缺乏行业深度缺乏行业深度数据安全隐患数据安全隐患容易造成内部数据泄露容易造成内部数据泄露组织内部的Know How是核心竞争力,不适合训练到大模型中,容易造成内部数据泄露。大模型应用痛点大模型应用痛点赋能大模型赋能大模型个性化个性化用户行为记录形成结合上下文的关联用户行为记录形成结合上下文的关联用户最新的使用文档用户的收藏文档及常用标签记录用户的所有操作行为上下文关联上下文关联缺失用户业务行为数据缺失用户业务行为数据完全结合问题上下文的推理周期长及准确度不高上下文的长度受限对用户的业务行为数据不了解业务痛点业务痛点:大大模型落地应用老大难问题模型落地应
5、用老大难问题0202智能文档云智能文档云文档云融合GPT,实现文件助手和智能知识库打造文件助手,助力知识洞察/发现/创作场景,解锁企业内容价值满足企业和个人用户的生产力需求,实现云盘向企业/个人知识大脑全面升级,加速产业知识智能方案进化0101企业网盘企业网盘/文档云文档云从基础工具到数字资产管理平台的升级提供一站式文件全生命周期管理及知识协作服务,为企业打造文档云、知识库、大数据平台等解决方案构建企业非结构化数据中台,提升企业内外部协同效率360360智能文档云方案智能文档云方案:从企业网盘到智能文档云从企业网盘到智能文档云360360智能智能文档方案文档方案:读得读得懂、搜得到、答的准懂、
6、搜得到、答的准 读得懂:借助大模型的能力,对文档内容进行深度解读和读得懂:借助大模型的能力,对文档内容进行深度解读和总结总结 搜得到:借助大模型的能力,快速从海量知识文档中获取搜得到:借助大模型的能力,快速从海量知识文档中获取答案答案 答得准:借助大模型的能力,提供准确匹配的搜索答得准:借助大模型的能力,提供准确匹配的搜索结果结果智能应用推荐智能应用推荐AgentAgent平台提供平台提供默认助手应用默认助手应用知识问答知识问答360360智能文档应用智能文档应用:一站式一站式知识问答、知识问答、AIAI助手、智能推荐助手、智能推荐9 92 2、接入能力、接入能力知识问答(知识问答(embed