1、 版权声明 0102 本报告版权属于出品方所有,并受法律保护。转载、摘编或利用其它方 式使用报告文字或者观点的,应注明来源。违反上述声明者,本单位将追究 其相关法律责任。 引言 当前,随着大数据和云计算等新一代信息技术的发展成熟,人工智能技 术和应用获得重大突破性进展,并快速向各个行业和领域渗透。其中,数据 是人工智能技术开发和应用的基础,人工智能算法模型在开发训练时需要海 量经过良好标注的数据作为支撑,并依赖于训练数据的丰富程度。数据的质 量、多样性将对算法模型的成败产生重大影响。然而,随着越来越多的数据 在人们的生产和生活场景中被收集和利用,数据安全和隐私保护成为人工智 能系统在开发和应用
2、过程中面临的严峻安全挑战。如何兼顾数据安全和人工 智能技术发展成为各国棘手的难题。本报告对当前人工智能发展带来的数据 安全风险进行了全面梳理,并分别在政策法规和技术层面对目前国内外的相 关应对举措进行了分析。在此基础上,报告提出了人工智能数据安全治理的 目标、框架及治理措施,致力于为有效解决人工智能中的数据安全问题提供 建议和思路。 出品方: 上海观安信息技术股份有限公司 上海赛博网络安全产业创新研究院 咨询专家: 黄道丽 公安部第三研究所网络安全法律研究中心主任 吴承荣 复旦大学国家保密学院副院长 乐嘉锦 东华大学计算机科学与技术学院教授 孟海华 上海市科学学研究所副研究员 朱易翔 翼盾(上
3、海)智能科技有限公司CEO 观安信息 观安信息 观 安 信 息 赛 博 研 究 院 观 安 信 息 赛 博 研 究 院 版权声明 0102 本报告版权属于出品方所有,并受法律保护。转载、摘编或利用其它方 式使用报告文字或者观点的,应注明来源。违反上述声明者,本单位将追究 其相关法律责任。 引言 当前,随着大数据和云计算等新一代信息技术的发展成熟,人工智能技 术和应用获得重大突破性进展,并快速向各个行业和领域渗透。其中,数据 是人工智能技术开发和应用的基础,人工智能算法模型在开发训练时需要海 量经过良好标注的数据作为支撑,并依赖于训练数据的丰富程度。数据的质 量、多样性将对算法模型的成败产生重大
4、影响。然而,随着越来越多的数据 在人们的生产和生活场景中被收集和利用,数据安全和隐私保护成为人工智 能系统在开发和应用过程中面临的严峻安全挑战。如何兼顾数据安全和人工 智能技术发展成为各国棘手的难题。本报告对当前人工智能发展带来的数据 安全风险进行了全面梳理,并分别在政策法规和技术层面对目前国内外的相 关应对举措进行了分析。在此基础上,报告提出了人工智能数据安全治理的 目标、框架及治理措施,致力于为有效解决人工智能中的数据安全问题提供 建议和思路。 出品方: 上海观安信息技术股份有限公司 上海赛博网络安全产业创新研究院 咨询专家: 黄道丽 公安部第三研究所网络安全法律研究中心主任 吴承荣 复旦
5、大学国家保密学院副院长 乐嘉锦 东华大学计算机科学与技术学院教授 孟海华 上海市科学学研究所副研究员 朱易翔 翼盾(上海)智能科技有限公司CEO 观安信息 观安信息 观 安 信 息 赛 博 研 究 院 观 安 信 息 赛 博 研 究 院 1 、人工智能技术发展与数据需求 2006年,随着深度学习模型的提出,人工智能引入了层次化学习的概念,通 过构建较简单的知识来学习更深、更复杂的知识,真正意义上实现了自我训练的 机器学习。深度学习可从大数据中发现复杂模式,具有强大的推理能力和极高的 灵活性,由此揭开了崭新人工智能时代的序幕。在人工智能第三波发展热潮中, 深度学习逐渐实现了在机器视觉、语音识别、
6、自然语言理解等多个领域的普遍应 用,也催生了强化学习、迁移学习、生成式对抗网络等新型算法和技术方向 。 然而,当前阶段以机器学习为代表的人工智能技术需要海量数据作为支撑, 数据越多,训练得到的算法模型效果越好,模型的泛化能力越强。因此,现阶段 的人工智能技术对数据的依赖性极强。同时,数据与人工智能是相互依存的关 系,人工智能为数据提供智能分析的手段,数据为人工智能提供输入和学习资 料。由此,将导致在人工智能的发展进程中,数据安全将是一个极其关键的议 题,对人工智能的安全、健康、快速发展非常重要。 1 0304 CONTENTS 目录 1、 人工智能技术发展与数据需求 2 、人工智能数据安全风险