1、 联邦学习联邦学习场景应用场景应用研究报告研究报告 (2022 年)年)中国信息通信研究院泰尔终端实验室中国信息通信研究院泰尔终端实验室 2022022 2 年年 2 2 月月前前 言言数据作为数字经济和信息社会的核心资源,被认为是继土地、劳动力、资本、技术之后的又一个重要生产要素,其在企业数字化转型中发挥重要作用,并对国家治理能力、经济运行机制、社会生活方式等产生深刻影响。与此同时,数据安全的重要性愈发凸显。依法采取严密的监管措施,保障数据安全无虞,有利于为数字经济发展夯实安全基础,为国家安全和公共利益保驾护航。2021年以来, 中华人民共和国数据安全法 、 中华人民共和国个人信息保护法 相
2、继实施, 个人隐私和产业机密数据保护日趋完善,在着重强调数据安全和个人信息保护的同时,完善了数据相关合规监管框架,为数据流通和使用进一步拓展了空间。与此同时,以联邦学习技术为代表的隐私计算赛道产业生态逐渐丰富,互联网厂商、初创专精型厂商、人工智能厂商等各领域企业纷纷加入,在进一步加深技术研究的同时,相关垂直领域的行业应用也逐渐丰富,形成百花齐放的行业发展态势。本报告在中国信息通信研究院前期对于联邦学习技术、产业的研究基础上,联合联邦学习产业链上下游企业,深入探讨联邦学习在政务、医疗、金融、广告、物流的应用价值,以期为数据应用价值的释放带来解读和参考。目目 录录一、 联邦学习简介 . 1 (一)
3、 数据隐私安全及孤岛问题 . 1 (二) 联邦学习定义 . 1 (三) 联邦学习主要作用 . 2 (四) 联邦学习技术优势 . 2 二、 联邦学习发展历程 . 3 (一) 传统隐私保护 . 3 (二) 联邦学习 . 4 (三) 安全联邦学习 . 5 三、 联邦学习进阶 . 6 (一) 主要技术原理 . 6 (二) 联邦学习的分类 . 8 (三) 联邦学习模型 . 15 (四) 联邦学习能力 . 17 (五) 联邦学习流程 . 18 四、 安全联邦学习 . 19 (一) 可信计算环境 . 20 (二) 多方安全计算 . 21 (三) 同态加密 . 21 (四) 差分隐私 . 22 (五) 安全性
4、 . 23 (六) 性能 . 25 五、 应用场景 . 27 (一) 政务开放 . 27 (二) 医疗应用 . 28 (三) 金融应用 . 38 (四) 数字广告 . 56 (五) 物流行业 . 62 六、 展望 . 63 (一) 政策引导、持续释放行业红利 . 63 (二) 凝聚共识、加速应用场景探索 . 64 (三) 标准建设、加强平台互联互通 . 64 图图 目目 录录图 1 传统机器学习和联邦学习的对比 . 3 图 2 联邦学习的两种架构模式 . 7 图 3 横向联邦学习数据分割示例 . 9 图 4 纵向联邦学习数据分割示例 . 10 图 5 迁移学习数据分割示例 . 11 图 6 联
5、邦学习参与方的数据网络结构 . 13 图 7 VTE 数据分析示例 . 33 图 8 隐私保护的跨国川崎病研究 . 34 图 9 医学影像学深度分析引擎技术架构 . 35 图 10 FedCIE:电子病历结构化联邦学习框架 . 37 图 11 全业务信贷风控流程示意图 . 40 图 12 银行联邦反欺诈方案示意图 . 43 图 13 基于隐私计算的营销风控平台级解决方案 . 45 图 14 应用隐私计算后的营销风控场景表现 . 46 图 15 银保营销方案示意图 . 50 图 16 银保营销方案示意图 . 55 图 17 联邦学习 AI 联合建模应用于广告投放场景 . 59 图 18 多方数据
6、融合反作弊模型 . 60 表表 目目 录录表 1 不同隐私保护计算技术的安全能力范围 . 25 表 2 隐私保护的不同技术路线 . 26 联邦学习场景应用研究报告(2022 年) 1 一、一、联邦学习简介 ( (一一) )数据隐私安全及孤岛问题数据隐私安全及孤岛问题数据孤岛普遍存在于所有需要进行数据共享和交换的系统之间,包括不同部门之间的数据信息能不能共享、 不同公司之间的数据信息能不能共享,以及不同产业之间的数据能不能共享等等。在 2019 年中国互联网协会对外公布的中国网民权益保护调查报告显示,在 2019 年,七成左右的网民个人身份信息和个人网上活动信息均遭到泄露。78.2%的网民个人身