《甲方视角下的联邦学习平台安全性评估——邱震尧(28页).pdf》由会员分享,可在线阅读,更多相关《甲方视角下的联邦学习平台安全性评估——邱震尧(28页).pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、甲方视角下的甲方视角下的联邦学习平台安全性评估联邦学习平台安全性评估中国银联中国银联 邱震尧邱震尧甲方视角下的甲方视角下的联邦学习平台安全性评估联邦学习平台安全性评估目录目录n 联邦学习概述联邦学习概述n 联邦学习安全基础联邦学习安全基础n 方案安全性评估方案安全性评估n 安全问题案例安全问题案例n 总结语总结语MPC(Multi-Party Computation,多方安全计算)一直是学术界比较火的话题,但在产业界的存在感较弱,直到谷歌提出了基于 MPC 的在个人终端设备的“联邦学习”(Federated Learning)的概念,使得 MPC 技术一夜之间在产业界火了起来。联邦学习,是一种
2、机器学习框架,目的为在满足用户隐私保护、数据安全和合规的要求下,进行进行跨机构的数据使用和机器学习建模。跨机构的数据使用和机器学习建模。联邦学习是多方安全计算在AI领域的一个场景应用。狭义的多方安全计算大多由密码学领域的学者提出,一狭义的多方安全计算大多由密码学领域的学者提出,一般具备可形式化证明的安全性。而联邦学习方案大多由般具备可形式化证明的安全性。而联邦学习方案大多由人工智能领域的学者提出,因此在安全性方面值得安全人工智能领域的学者提出,因此在安全性方面值得安全领域专业人士的进一步关注。领域专业人士的进一步关注。联邦学习简介联邦学习简介国内对联邦学习进行了扩展与细分:根据多参与方之间数据
3、分布的不同,把联邦学习拓展为横向联邦学习和纵向国内对联邦学习进行了扩展与细分:根据多参与方之间数据分布的不同,把联邦学习拓展为横向联邦学习和纵向联邦学习。联邦学习。联邦学习分类联邦学习分类数据需求方、数据提供方通过在双方本地部署的隐私计算平台进行信息互通。利用安全求交技术进行数据需求方、数据提供方通过在双方本地部署的隐私计算平台进行信息互通。利用安全求交技术进行建模样本选择;在建模过程中,双方的原始数据均不出库,通过隐私计算相关技术实现模型共建。建模样本选择;在建模过程中,双方的原始数据均不出库,通过隐私计算相关技术实现模型共建。数据不动模型动密码学/系统级的方法保障参数传递的“可算不可见可算
4、不可见”模型无损,共同获益纵向联邦学习工作原理纵向联邦学习工作原理一方提供特征及正负样本标签数据,一方提供特征数据,进行纵向联合建模。一方提供特征及正负样本标签数据,一方提供特征数据,进行纵向联合建模。需求案例银行等金融机构对于不同客户的数据特征积累有限,为了提升营销对象的精准性,通常需要接入更多的外部数据源进行联合建模,提升模型效果。解决方案通过纵向联邦学习,在数据提供方、数据需求方的特征数据、样本标签数据、样本ID数据等不出库的条件下共建模型,满足各方的隐私保护需求 当前纵向联邦建模是隐私计算最为火热的技术之一,在金融领域的营销、风控等场景下,均有较多的应用与实践。其他场景应用场景:应用场
5、景:精准营销精准营销潜客挖掘潜客挖掘目录目录n 联邦学习概述联邦学习概述n 联邦学习安全基础联邦学习安全基础n 方案安全性评估方案安全性评估n 安全问题案例安全问题案例n 总结语总结语样本对齐安全基础样本对齐安全基础基于基于RSARSA的方案的方案其他类型的样本对齐方案还包括基于其他类型的样本对齐方案还包括基于DHDH(Diffie-HellmanDiffie-Hellman)、)、OTOT(不经意传输)的方法等。(不经意传输)的方法等。基于RSA的样本对齐方案的交互过程不完全对等,适用于双方样本ID数量相差较大的情况。同态加密(Homomorphic Encryption,HE)是指满足密文
6、同态运算性质的加密算法,即数据经过同态加密之后,对密文进行特定的计算,得到的密文计算结果在进行对应的同态解密后的明文等同于对明文数据直接进行相同的计算,实现数据的“可算不可见”。同态加密的实现效果如图1所示。n定义定义n分类分类n 应用情况应用情况全同态加密仍处于方案探索阶段,现有算法存在性能方面距离可全同态加密仍处于方案探索阶段,现有算法存在性能方面距离可行工程应用还存在一定的距离。行工程应用还存在一定的距离。因此,实际应用中的同态加密算法多选取半同态加密(如加法同态),用于在特定应用场景中实现有限的同态计算功能。用于在特定应用场景中实现有限的同态计算功能。当前比较成熟是Paillier算法