当前位置:首页 > 报告详情

多说话人分离技术及应用进展-洪青阳.pdf

上传人: 张** 编号:161402 2024-05-05 21页 3.38MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了厦门大学智能语音实验室在多说话人分离技术及应用方面的研究进展。研究背景中提到,多说话人分离技术应用于会议纪要、转录、客服和录音质检等多个场景,涉及终端设备智能手机、个人电脑和录音笔等,支持厂商包括科大讯飞、华为和声云等。研究从简单场景到复杂场景,提到了多种架构和算法的发展历程,以及相关的竞赛和数据集。在工业版本中,采用模块化系统,包括音频分割、提取说话人表征、聚类等步骤。存在的问题包括语音重叠和说话人混叠,提出了分段判断和神经网络分割的解决办法。最后,介绍了落地应用,如声云语音转写,具有普通话、带角色分离、长时间离线音频任务处理等优点。
"多说话人分离技术如何实现实时应用?" "洪青阳合作者团队在语音识别领域有哪些创新?" "厦门大学智能语音实验室有哪些领先技术?"
客服
商务合作
小程序
服务号
折叠