当前位置:首页 > 报告详情

【2】Audio Content Generation Building digitalized human and humanized AI CUHK-SZ.pdf

上传人: 2*** 编号:129342 2023-05-01 29页 3.74MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了音频内容生成领域,特别是在构建数字化的虚拟人类和人性化的AI方面。文中提到,随着元宇宙和Web 3.0的建设,人类和AI的沟通、感知和交互方式正在被重新定义。作者的团队致力于研究虚拟歌手,他们拥有逼真的声音和情感表达,同时研究音乐创作的美学感受和AI与人类的协同创新。他们创造了一个AI合唱团,在无需大量标注数据的情况下,仅通过聆听未标记的录音,AI便能虚拟化出任何人的声音。此外,他们提出了一种名为CoMoSpeech的方法,通过一致性模型实现了一步语音和歌唱声音合成,提高了音频质量并加快了推理速度。关键数据包括:320个用于合唱的虚拟歌手、AI合唱团在“东方之珠”一曲中的表演,以及多个比较实验的结果,展示了他们方法在音频质量、推理速度等方面的优势。
如何实现音频内容的自动化生成? 人工智能如何助力音乐创作与演绎? 虚拟歌手与真实歌手的差距还有多远?
客服
商务合作
小程序
服务号
折叠