1、*研究报告(2020 年)120232023 年年 5 5 月月中国信息通信研究院安全研究所2023年12月联邦学习应用安全研究报告联邦学习应用安全研究报告(2022023 3 年年)版权声明版权声明本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,编者将追究其相关法律责任。本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,编者将追究其相关法律责任。中国信息通信研究院安全研究所2020 年 6 月
2、中国信息通信研究院安全研究所2020 年 6 月中国信息通信研究院安全研究所2020 年 6 月中国信息通信研究院安全研究所2020 年 6 月前言前言“数据孤岛”,是数据为“王”的时代的一个不可被忽视的现象,各组织机构的数据如同大洋上的岛屿,隔海相望、孤立无援。这种现象来源于组织机构对敏感数据域外共享的数据安全担忧,随着数据安全法律法规日趋严格,各组织机构难以承担数据泄露所带来的严重后果,使数据既出不去,也进不来。在追求数据要素高效高质流通的当下,“数据孤岛”现象无疑是数据要素市场化建设进程中的障碍,于是“原始数据不出域,数据可用不可见”的新范式被提出,联邦学习也作为能够实现该范式的代表技术
3、之一,得到了快速的发展。联邦学习技术可避免原始数据流出本地,转而通过“本地存储+分布式学习”的联合机器学习建模方式完成多方数据价值的释放,很好地解决了数据流通与数据安全之间的矛盾。联邦学习作为能够打破“数据孤岛”的有力技术工具,为实现保障数据安全流通的初衷,仍然需要确保其自身的各属性的安全可靠。本研究报告着眼于联邦学习技术产品、系统、平台等形式的应用的安全,介绍了联邦学习应用的安全现状,分析了联邦学习在应用中面临的安全问题,并针对以上痛点问题,提出了联邦学习应用的未来发展建议。本报告的编写得到了不少业界同仁的大力支持,希望本报告能为社会各界深入了解联邦学习应用安全的现状与发展提供有价值的参考。
4、目录目录版权声明.1一、联邦学习概述.1(一)背景.1(二)联邦学习技术体系.2二、联邦学习应用概况.4(一)跨机构应用是国内联邦学习应用的主要形态.4(二)中心化架构在联邦学习产品中占比最多.5(三)半诚实敌手环境是当下联邦学习主要的应用环境.7(四)密码技术是当下联邦学习产品的主要安全保护技术.9三、联邦学习应用安全现状与问题分析.11(一)数据泄露类风险是联邦学习产品最易出现的安全风险.11(二)联邦学习应用安全风险的隐蔽性高.14(三)协调方的存在为联邦学习应用带来了安全方面的不确定因素.15(四)联邦学习应用的安全保护强度与性能要求在一定程度上相互制约.16(五)联邦学习应用安全相关
5、标准尚未健全.18四、联邦学习应用安全学界研究现状.19(一)偏重于恶意安全环境下的安全研究.19(二)如何优化性能是热门研究方向.20五、联邦学习应用安全发展建议.21(一)加速联邦学习应用安全的标准化建设.21(二)加强联邦学习应用安全的研究.22(三)推动联邦学习应用安全的基础设施建设.23图 目 录图 目 录图 1联邦学习架构.4图 2联邦学习产品架构总体分布统计.6图 3不同场景中的联邦学习产品架构分布统计.7图 4联邦学习产品安全保护技术使用占比统计.10图 5联邦学产品安全风险占比统计(半诚实环境).11图 6联邦学习产品安全风险分布统计(半诚实环境).12表 目 录表 目 录表
6、 1联邦学习应用分类.3表 2联邦学习应用的安全假设.8联邦学习应用安全研究报告(2023 年)1一、联邦学习概述(一)背景(一)背景在数据价值被充分重视的大数据时代,数据流通成为了数据价值释放的重要步骤。2022 年 1 月 6 日国务院办公厅印发的要素市场化配置综合改革试点总体方案提出了要探索“原始数据不出域、数据可用不可见”的数据交易范式。联邦学习技术是实现该交易范式的典型代表技术之一,具有巨大的发展潜力。近年来,联邦学习的应用实践正在不断落地,其实用性已经得到了反复印证。联邦学习作为数据流通领域的重要技术应用,一旦其出现安全问题,则保护数据的初衷将无法实现。因此,联邦学习的使用者对其安