1、隐私保护图学习和推荐陈超超 浙大计算机学院 特聘研究员、金智塔科技 CTO|Privacy-PreservingGraphLearningand Recommendationhttps:/ 2021年9月,中华人民共和国数据安全法正式实施,要求确立数据分级分类管理、落实数据安全保护责任、支持促进数据安全与发展的措施。2021年11月,中华人民共和国个人信息保护法正式实施,对个人信息的采集、加工、使用全流程做责任落实要求。|Social GraphKnowledge GraphWeb GraphDevice GraphGene GraphBrain GraphMolecular GraphCon
2、trol Flow GraphGraph is Everywhere图数据孤岛Graph is IsolatedRong Y,Xu T,Huang J,et al.Deep graph learning:Foundations,advances and applicationsC/Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery&Data Mining.2020:3555-3556.|图孤岛-A Motivating ExampleC1s KGC2s KGChaochao Che
3、n,Jamie Cui,Guanfeng Liu,Jia Wu,Li Wang.Survey and Open Problems in Privacy Preserving Knowledge Graph:Merging,Query,Representation,Completion and Applications.Preprint.2021.|机器学习视角数据隐私模型隐私参数隐私PrivacyPreservingMachineLearningandDataMining|预备知识02|隐私计算技术分类|Security时效性可用性安全性差分隐私:Differentially Privacy(
4、DP)Cynthia Dwork,Frank McSherry,Kobbi Nissim,and Adam Smith.Calibrating noise to sensitivity in private data analysis.In Proceedings of the 3rd Conference on Theory of Cryptography,TCC 06,pages 265284,Berlin,Heidelberg,2006.Springer.Pr D O !Pr D O定义(-差分隐私):令为正实数,A为随机函数,其阈值为Ran(A)。如果对于在单个记录中不同的两个数据集和
5、以及函数的任何输出O,函数被称为可提供-差分隐私,是隐私预算,越小,隐私保护程度越高常用的噪声机制有拉普拉斯机制、高斯机制和指数机制,拉普拉斯机制是应用最广泛的噪声机制。算法A在相邻数据库上的输出概率|多方安全计算 Secure Multi-party Computation(MPC)在MPC计算模式中,不存在一个中立(可信)的第三方通常一个计算方需要跟其他所有参与方通信来协同计算以密码学为基石,除输入和输出外,不泄露任何中间信息,计算过程可以做到可证安全传统集中式计算模式基于MPC的计算模式秘密分享Secret Sharing有限域内的随机数混淆电路GarbledCircuit电路的生成与执
6、行同态加密Homomorphic Encryption依赖于密钥(私钥和公钥)零知识证明Zero-Knowledge Proof证明方的交底材料与验证方的试探Cramer,Ronald,and Ivan BjerreDamgrd.Secure multiparty computation.Cambridge University Press,2015.浙大计算机学院&金智塔科技 陈超超112022年07月|联邦学习 Federated Learning(FL)通过在模型(梯度)中加入噪音来提升安全性噪音可以由Client来加或者由Server来加在做模型(梯度)聚合时,使用MPC来做,而非明文