当前位置:首页 > 报告详情

声音基础模型如何推动声音理解和生成-王育军.pdf

上传人: 张** 编号:164041 2024-05-31 28页 5.29MB

1、小米的声音世界-声音基础模型推动声音理解和生成小米技术委员会AI实验室/王育军摘要摘要小米为什么做AI声学语音AI声学语音的技术和应用声音基础模型赋能声学语音2023360小米为什么做人工智能小米为什么做人工智能(软件+硬件)AI人车家全生态汽车 手机 X AIoT智能手机销量全球智能手机销量全球Top3Top3AIoTAIoT把业务技术装在把业务技术装在AIAI的篮子里的篮子里声学语音算法体系声学语音算法体系小爱同学语音交互小爱同学语音交互1.36亿2亿6亿79品类5829款拾音降噪拾音降噪拾音降噪拾音降噪声音情境感知声音情境感知视觉抠音视觉抠音跨设备声纹跨设备声纹聆听聆听个性化语音识别技术

2、提升言个性化语音识别技术提升言语障碍用户体验语障碍用户体验20202020小米黑客马拉松冠军小米黑客马拉松冠军语音生成语音生成雷总语音祝福雷总语音祝福这一次,雷总喊出了18w+18w+米粉的名字声音基础模型声音基础模型CEDCEDXiaomi DashengDeep Audio Signal Holistic Embeddings1.2B27万小时Xiaomi DashengDeep Audio Signal Holistic Embeddings把把AIAI装到大模型的篮子里装到大模型的篮子里DashengDasheng的应用的应用 SCARSCARSound Component Analysis&Reconstruction相册声音橡皮擦原始视频提取人声提取环境音大模型语音合成大模型语音合成Unified ModelUnified Model

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
张5G
张**

该用户很懒,什么也没介绍

客服
商务合作
小程序
服务号
折叠