声音基础模型如何推动声音理解和生成-王育军.pdf-三个皮匠报告

1、小米的声音世界-声音基础模型推动声音理解和生成小米技术委员会AI实验室/王育军摘要摘要小米为什么做AI声学语音AI声学语音的技术和应用声音基础模型赋能声学语音2023360小米为什么做人工智能小米为什么做人工智能（软件+硬件）AI人车家全生态汽车手机 X AIoT智能手机销量全球智能手机销量全球Top3Top3AIoTAIoT把业务技术装在把业务技术装在AIAI的篮子里的篮子里声学语音算法体系声学语音算法体系小爱同学语音交互小爱同学语音交互1.36亿2亿6亿79品类5829款拾音降噪拾音降噪拾音降噪拾音降噪声音情境感知声音情境感知视觉抠音视觉抠音跨设备声纹跨设备声纹聆听聆听个性化语音识别技术

2、提升言个性化语音识别技术提升言语障碍用户体验语障碍用户体验20202020小米黑客马拉松冠军小米黑客马拉松冠军语音生成语音生成雷总语音祝福雷总语音祝福这一次，雷总喊出了18w+18w+米粉的名字声音基础模型声音基础模型CEDCEDXiaomi DashengDeep Audio Signal Holistic Embeddings1.2B27万小时Xiaomi DashengDeep Audio Signal Holistic Embeddings把把AIAI装到大模型的篮子里装到大模型的篮子里DashengDasheng的应用的应用 SCARSCARSound Component Analysis&Reconstruction相册声音橡皮擦原始视频提取人声提取环境音大模型语音合成大模型语音合成Unified ModelUnified Model

声音基础模型如何推动声音理解和生成-王育军.pdf

相关报告