当前位置:首页 > 报告详情

复杂声学环境下的语音交互:技术与实践-阿里云创新中心智能硬件专场(27页).pdf

上传人: 云闲 编号:87473 2021-01-01 27页 6.85MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了复杂声学环境下的语音交互技术及其实践。文章指出,语音交互是物联网时代的最基本特质,从前互联网、移动互联网到物联网,人机交互方式一直在颠覆。在复杂的声学环境中,前端处理技术至关重要,它能够提高目标语音的信噪比,增强声环境稳健性。文章介绍了三种技术路线:传统信号处理、信号处理与机器学习相结合、前后端联合优化。其中,深度学习框架下的前后端联合优化,以语音识别准确率为优化目标,识别误差从后端声学模型反向传播回前端,用于指导前端的优化。此外,文章还提到了一些落地案例,如智能硬件、智能电视、车载语音交互技术平台等。
复杂环境下语音交互如何实现? 语音交互技术路线有哪些创新? 语音交互在实际应用中如何落地?
客服
商务合作
小程序
服务号
折叠