《清华大学:2024年声纹识别产业发展与创新白皮书(31页).pdf》由会员分享,可在线阅读,更多相关《清华大学:2024年声纹识别产业发展与创新白皮书(31页).pdf(31页珍藏版)》请在三个皮匠报告上搜索。
1、第 4 届声纹识别产业发展与创新研讨会2024/03/29介绍人:郑 方声纹识别产业发展与创新白皮书 让声纹更安全 编委会第 4 届声纹识别产业发展与创新研讨会 2024-03-29郑方清华大学人工智能研究院听觉智能研究中心主任、得意音通创始人刘永东中国语音产业联盟秘书长、国家工信安全中心人工智能所常务副所长洪青阳厦门大学教授、天聪声云创始人金琴中国人民大学教授艾斯卡尔 艾木都拉新疆大学教授、智能科学与技术学院(未来技术学院)副院长张超清华大学助理教授张楚IIFAA副理事长、一砂科技创始人李荪中国信通院云大所人工智能部高级主管卜辉语音之家创始人、希尔贝壳CEO李蓝天北京邮电大学副教授成舸得意音
2、通副总经理王钰得意音通市场总监目录第 4 届声纹识别产业发展与创新研讨会 2024-03-29声纹识别产业的政策环境变化01声纹识别的安全性提升020304应用场景的多样化扩展声纹识别产品的体验性提升05声纹产业化的进程加速06非完整信息的多特征深度融合第 4 届声纹识别产业发展与创新研讨会 2024-03-2901声纹识别产业的政策环境变化5声纹识别技术发展的政策导向第 4 届声纹识别产业发展与创新研讨会 2024-03-2901020304中国人民银行发布的个人金融信息保护技术规范中,将“动态声纹密码”列入较低隐私敏感度级别的C2级个人信息,要求声纹技术处理个人金融信息时必须遵守严格的数据
3、保护标准。2022年11月,国家网信办、工信部、公安部联合颁布的互联网信息服务深度合成管理规定中,要求对深度合成服务中涉及生物识别信息的编辑功能进行严格管理,包括声纹编辑功能。中华人民共和国无障碍环境建设法要求无障碍环境建设应考虑老年人与残障群体的特殊需求,包括提供声纹识别等无障碍信息服务。2021年国务院办公厅关于切实解决老年人运用智能技术困难的实施方案和2021年3月人民银行印发移动金融客户端应用软件无障碍服务建设方案要求提供适老化的生物识别服务,以解决老年人使用智能技术中的困难。政策对声纹识别技术应用的新要求第 4 届声纹识别产业发展与创新研讨会 2024-03-29隐私保护和数据安全生
4、物识别技术的可解释性与稳定性适老化改造的特殊要求无障碍环境建设的法律要求深度合成内容的监管第 4 届声纹识别产业发展与创新研讨会 2024-03-2902声纹识别的安全性提升安全性是声纹识别技术的核心优势个体独特性的行为特征声纹识别技术基于个体独特的频谱特征,如何确保只有声音匹配的人才能通过验证。难以模仿的声纹特性声纹识别技术如何通过活体检测等手段区分真实声音和模仿声音,提高安全性。非接触式验证的优势声纹识别作为一种非接触式身份验证方式,在公共卫生事件期间的重要性和安全性。声音信号的难以窃取性声音信号在传输过程中不易被窃取或拦截的特点,以及其在安全方面的优势。多模态认证的结合应用声纹识别如何与
5、其他生物识别技术结合使用,如指纹识别或面部识别,以形成多模态认证。隐私保护的重要性阐述声纹识别技术在保护个人隐私方面的优势,特别是与收集个人敏感信息相比的隐私保护能力。第 4 届声纹识别产业发展与创新研讨会 2024-03-29声纹识别技术安全性提升的挑战第 4 届声纹识别产业发展与创新研讨会 2024-03-29数据集建设、数据安全及隐私保护系统性能和稳定性及环境鲁棒性伪造语音、合成语音欺诈终端设备干扰及网络攻击声纹技术依赖于大量声音数据进行训练和识别。在数据采集和处理过程中,必须确保用户隐私得到保护,防止数据泄露或被滥用。在实际应用中为确保声纹技术的准确性,需要优化系统性能和提高稳定性,要
6、平衡在各种噪声环境和不同录音设备条件下保持高识别准确率,同时减少系统延迟和故障。声纹技术可能受到伪造语音和合成语音的攻击,这些攻击可以通过模仿或生成声音来欺骗识别系统。声纹系统会受到终端设备频率干扰和来自网络攻击,影响其正常运行和识别结果的准确性。研究型数据集建设进展与成效第 4 届声纹识别产业发展与创新研讨会 2024-03-2902德州仪器、麻省理工学院和斯坦福研究院合作建设的TIMIT数据集,是一个经典的英语语音数据库,用于语音识别和说话者识别的研究。04清华大学语音和语言技术中心发布的CN-Celeb数据集,是一个中国知名人物的声纹数据库,用于研究多说话人和多模态声纹模型技术。06北京