1、货拉拉大数据安全体系建设实践和思考王海华 货拉拉目录1背景和挑战大数据安全体系总结与思考232-1 大数据安全规范2-2 大数据安全能力建设2-3 大数据安全治理背景和挑战6+业务线352国内城市66万月活司机3+IDC20K+日均任务数1000+机器数10PB+存储量950万月活用户货拉拉介绍大数据基础平台基础层离线计算(Hive/Spark/Presto/.)实时计算(Flink)资源管理(YARN/K8S)离线存储(HDFS/OBS)OLAP多维分析(Druid/CK/Doris)在线存储(Hbase/ES)实时数据接入埋点数据接入数据对账数据链路监控离线数据接入数据接入平台接入层数据门
2、户权限中心个人中心内容管理知识库建议反馈数据门户权限中心个人中心内容管理知识库建议反馈门户首页平台层&数仓数据研发平台飞流实时开发BQ数据即席查询IDP数据集成开发数据仓库DWB基础整合层DWT明细数据层数据湖接入(T+1、近实时、实时)DWS公共汇总服务层用户集市司机集市主数据库数据治理平台数据成本管理元数据管理数据安全管理数据质量管理数据工具箱自助分析可视化大屏数据服务工具快捷分析快速报表数据智能支撑工具服务层预警/告警监控多维分析固定报表AB Test特征平台大数据分析平台数据应用支撑服务工具数据工具箱自助分析可视化指标库管理数据上报固定报表用户画像数据云服务大数据分析平台数据应用辅助决
3、策类应用赋能业务类应用应用层智能营销智能广告投放实时报表鹰眼监控经营分析用户分析数据资产ODS贴源数据层DWS公共汇总服务层DIMDWD明细数据层DWB明细数据整合层集市层标签画像体系特征体系指标体系AI平台大数据使命:驱动业务数智化,助力公司业务持续增长DIM维表层货拉拉-大数据货拉拉-数据流为什么要做大数据安全?数据资产保护要求 商业机密 经营数据 用户信息1法律法规要求 个人信息保护法 网络安全法 数据安全法 数据安全管理办法2难点与挑战10P+数据量,8+数据资产数据集中存储、敏感数据多生命周期长数据资产类型多,管控复杂度高 10+使用场景 需要统筹考虑使用场景多,攻击面广 20+大数
4、据产品 5000+用户数量数据产品多,用户数量大难点基本安全线业务曲线安全需求初创期平衡数据安全和业务发展的关系挑战爆发期稳定期大数据安全体系建设思路数据采集数据处理数据销毁数据交换数据传输数据存储数据全生命周期围绕数据生命周期构建安全能力建能力02PART TWO有法可依立规范建立组织保障建组织04解决存量安全问题做治理03建立全数据生命周期的安全防护体系,防止数据泄露,满足合规需求01PART OnePART THREEPART FOUR大数据安全体系大数据安全体系概览数据全生命周期安全防护能力数据采集数据敏感分级数据质量监控数据传输传输加密数据存储数据备份和恢复数据加密存储数据处理报表权
5、限管控库表权限管控指标权限管控认证和鉴权行为审计云桌面数据交换下载分享审批数据水印数据销毁数据生命周期数据脱敏研发平台权限治理报表权限治理库表权限治理公网访问治理库表权限系统报表权限系统库表安全管理规范决策层(高管、信息安全委员会):制定数据安全目标和愿景,发布安全制度和规范管理层(信息安全部门、大数据部门):负责制定数据安全策略和规划,及具体管理规范,组织安全培训执行层(业务部门数据安全接口人、大数据部门):负责保证数据安全工作推进落地安全治理技术工具数据质量管理平台元数据管理平台数据灾备系统数据血缘管理数据资产管理制度规范报表安全管理规范敏感数据存储和使用规范组织建设其他规范2-1大数据安
6、全规范数据安全规范-敏感分级分级名称定义被利用价值使用范围重要程度公开数据(C1)已通过正规渠道正式对外发布的数据,不会对公司造成影响的数据无价值外部公开一般限制数据(C2)不适合对外公开,但是对内部人员访问基本无限制的数据,一旦发生泄露,不会对数据主体造成直接损害低价值公司内部敏感商业秘密(C3)公司专有或公司保密的,一旦发生泄露,将显著影响相关业务的开展,对数据主体造成直接或者间接损害中价值可间接利用公司内部限于相关人员重要核心秘密(C4)具有最高安全属性要求,一旦发生泄露,可能导致公司法律或商业上造成重大影响和损失高价值可直接利用公司重要部门特定人员关键数据敏感分类分级结合公司业务场景,