《知识图谱在结构化知识中台的实践应用.pdf》由会员分享,可在线阅读,更多相关《知识图谱在结构化知识中台的实践应用.pdf(43页珍藏版)》请在三个皮匠报告上搜索。
1、知识图谱在结构化知识平台的实践和展望余海洋阿巴巴达摩院算法专家 智能对话与服务技术团队1背景介绍知识图谱的构建与问答三元组抽取未来展望图谱构建法论与Schema构建知识问答KBQA2智能客服的演示3智能客服的发展趋势1.流程轮转慢2.固定,专专事1.动化接听和处理2.弹性化资源1.虚拟2.多模态交互4云智能客服已经服务的客户业/场景医疗医保卫保健慢病管理医药服务政务公社保公安户籍管理出境运营商话费查询流量查询充值缴费流量套餐交通速ETC港运输航空机场交通建投能源电燃务热事档案融银保险证券互联融电器汽餐饮家居 2015:内部运 2016:赋能态圈 2017:上云,对外向政务、企业和开发者开放 现
2、在:服务10万+付费企业5疫情防控机器截714,疫情防控机器上线56个城市,累计外呼1809w次,接通率85%+,对话完成率90%+?62021年,阿云智能客服更具显著优势图来源:IDC MarketScape:Worldwide General-Purpose Conversational AI Platforms 2021 Vendor Assessment国内唯!阿云智能客服选IDC MarketScape全球对话式AI平台商评估报告阿云中国对话式AI公有云服务2020年市场份额阿云公有云对话式AI产品已占据40%的市场份额,位居位数据来源:中国AI云服务市场2020年度研究报告 IDC
3、中国 2021年67达摩院机对话的整体框架本、档、对话志平台层预训练 对话问答模型知识平台对话流程引擎层机对话平台数据层知识图谱Table结构化档预训练 对话模型预训练 图谱问答模型(KGBert)预训练 表格问答模型(TableBert)Dialog Studio 多轮对话引擎KBQA 图谱问答引擎TableQA 表格问答引擎FAQ FAQ问答引擎MRC 机器阅读引擎8结构化知识平台:解决知识从哪来的问题数据知识智能数据的管理和操作从数据到知识从知识到智能1.数据量快速增加2.价值却没有被发掘1.QA知识:提供FAQ知识的问答能2.图谱知识:提供精细化知识问答能3.表格知识:提供NL2SQL
4、的查询能4.流程化知识:提供多轮对话/问答能5.档层级录:针对档的问答能6.隐式知识:模型&预训练1.理解户问题,精准问答2.能计算,会推理,提升户体验3.形成闭环,会学习,可进化9背景介绍知识图谱的构建与问答三元组抽取未来展望图谱构建法论与Schema构建知识问答KBQA10KB(知识图谱)是可视化的知识结构,主要包含实体-关系-实体或实体-属性-属性值,Schema是其中的实体类型、属性、关系的总称 KBQA是基于知识图谱实体-属性的问答引擎中年、肥胖者、期饮酒者压的多发群体有哪些?Sparql语句:SELECT?x WHERE 压:多发群体?x KBQA模型什么是知识图谱和知识图谱问答1
5、1图谱schema构建流程及难点12使底向上和上下相结合的法构建来构建Schema第步:利志和知识库提炼归纳版Schema第步:专家参照档,进补全与修正,并抽取三元组13第步:基于志与问句的半动schema构建14与现有的开放式信息抽取的差异15Query Based Semi Auto Schema Construction基于句的开放信息抽取 基于句簇的抽取降低噪声例簇内进constraint识别16背景介绍知识图谱的构建与问答三元组抽取未来展望图谱构建法论与Schema构建知识问答KBQA17Step1:档结构识别ABFCDEGHIJK属性(P)属性值(O)合同构成保寿险员团体有关的声明
6、、批注单及其他约定书构成。保险额本合同的暂时丧失能在本合同保险期间内不得变更。BCD EFGHIJKAStep2:粗粒度三元组抽取Step3:细粒度三元组抽取1.实体识别(S):保寿险员团体失能收损失保险 2.根据档结构,进标题+段落抽取1.抽取所有细粒度实体/属性值,成候选集合;2.S-P-O联合抽取,获得最终的SPO;属性(P)实体/属性值(O)投保年龄55周岁以下累积给付120合同成投保提出保险申请,本公司同意承保,本合同成。第步:三元组抽取流程18属性值抽取难点数据19保险责任合同构成是否给定不给定关系集合给定三元组抽取封闭信息抽取开放信息抽取OpenIE幽门是消化道最狭窄的部位(消化