《阿里智能助理在电商领域的架构构建与实践(36页).pdf》由会员分享,可在线阅读,更多相关《阿里智能助理在电商领域的架构构建与实践(36页).pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、-在电商领域的架构构建与实践-陈海青(海青)-阿里集团客户体验事业群-智能创新中心基于机器学习的阿里智能助理一、阿里小蜜平台介绍二、智能人机交互构建技术实践三、挑战与未来目 录content一、阿里小蜜平台介绍二、智能人机交互构建技术实践三、挑战与未来目 录content背景1从传统搜索到问答,带来拟人化体验的提升2带来行业模式的变化,应用领域成本的降低3人工智能的热点领域之一,未来的入口级领域,各大公司竞争激烈基于阿里海量消费数据,结合线上、线下的生活场景需求,以智能+人工的模式提供智能导购、服务、助理的业务体验电商领域的平台化开放商家开放-千牛平台企业开放-钉钉平台电商领域的私人助理实践-
2、阿里小蜜阿里小蜜图片大小统一店小蜜企业钉小蜜阿里小蜜及平台输出展示阿里小蜜整体结构体系路由规则意图识别客户模型图像识别语音识别文本模型多轮交互推荐预测多模交互多终端多场景客服领域客服领域客服规则导购领域导购人工导购规则助手领域助手人工助手规则阿里小蜜千牛店小蜜钉钉企业小蜜阿里云服务导购物流聊天其他智能路由图像识别多轮交互语音识别文本模型用户模型多模交互推荐预测知识图谱数据回流多维度数据分析数据挖掘/离线模型机器学习训练输出平台服务层技术层数据层阿里小蜜平台一、阿里小蜜平台介绍二、智能人机交互构建技术实践三、挑战与未来目 录content语音识别(ASR)自然语言理解(NLU)智能人机交互的基本
3、技术流程对话管理(DM)文本转语音(TTS)自然语言生成(NLG)语音输入文本语义表示语义表示文本语音输出上下文上下文智能人机交互分层策略语义意图面向目标非面向目标问答型任务型语聊型明确意图隐式意图语义意图识别:目标和非目标任务的细分意图的明确与推理匹配面向3类业务划分并建立技术体系:问答型:“密码忘记怎么办?”任务型:“我想订一张明天从北京到杭州的机票”语聊型:“我心情不好”语义意图结合传统机器学习算法以及深度学习算法的语义意图识别方法语义意图识别的基本技术流程Query+Context分词词性标注以及NER意图识别分类对话管理系统意图语义表示意图属性抽取上下文模型领域数据模型意图识别分类多
4、分类模型(有监督的分类算法,依据具体场景进行选型BayesKnn最大熵):适用于相对简单场景且分类数稳定领域二分类模型(按照意图领域做成多个二分类模型 SVM):适用于领域分类相对独立,并且经常需要新增修改的场景,能做到相互独立传统机器学习深度学习深度学习多分类模型(CNNDNNLSTM):适用于较大数据量积累场景结合用户行为特征的深度学习意图预测模型:由于文本缺失、不明确或者不完整的情况下,增加用户行为特征进行意图分类预测深度学习模型意图数据积累初步建模 保证相关性用户问句和知识点标题的相似度用户问句和历史问句的相似度保证相关性保证多样性预留位置展示 保证多样性随机展示(均匀采样)按历史的知
5、识点使用频次来推荐结合用户行为特征的深度学习意图预测模型用户点击数据用户行为序列用户相关特征Query+Context深度学习模型深度学习模型意图识别方案采用阿里云飞天一部大规模机器学习平台PAI进行模型训练和在线预测PAI-Machine Learning Platform四种主流的问答匹配技术基于模板式匹配(Rule-Based)基于检索的模型(Retrieval model)基于统计机器翻译模型(SMT)基于深度学习模型(Deep Learning)1234分策略模块技术选型根据不同分策略模块分别进行技术选型:问答型:基于知识图谱+传统检索模型的方式任务型:slots filling语聊
6、型:传统检索模型+Deep Learning方式问答型领域技术构建基于知识图谱+传统检索模型的方式语义挖掘语 义 挖 掘同义语义挖掘词和短语挖掘文本相似同义语义挖掘、相似词挖掘、构造模式(pattern)相似词挖掘主要是选取标签中的业务词作为种子,例如:通过Word2Vec扩展相近词汇,用于词语的归一化同义语义挖掘旨在挖掘同义问法Pattern构造潜在语义分析聚类种子词获取深度挖掘模式匹配知识图谱构建美妆时尚上下文语义算法组件在线语料百科数据社区问答淘宝问答开放数据客服聊天词条数据垂直网站商品标题问答结构化标题答案