第二章大数据离线批处理场景化解决方案.pdf-三个皮匠报告

1、版权所有 2019 华为技术有限公司大数据离线批处理场景化解决方案第2页版权所有 2019 华为技术有限公司前言进入大数据时代，企业产生的数据出现爆发式增长，部分数据需要实现离线存储分析，而传统的数据处理方案满足不了海量数据存储和海量数据处理需求。结合大数据离线技术，如何提出行之有效的解决方案以及如何去实施应用，成为企业面临的难题。第3页版权所有 2019 华为技术有限公司目标学完本课程后，您将能够：熟悉离线批处理应用场景熟悉离线批处理采用的技术方案学习离线批处理的实际案例第4页版权所有 2019 华为技术有限公司目录 1. 离线处理方案 2.离线处理技术框架介绍

2、数据存储HDFS 数据仓库Hive 离线分析SparkSQL 数据采集工具 3.离线批处理实战第5页版权所有 2019 华为技术有限公司人口系统公安系统出入境系统旅店系统社会系统网吧系统数据源增量文件全量文件实时数据缓存库原始数据刑专系统案件信息系统刑侦业务综合情报研判人员信息系统情报业务烟花爆竹管理特种行业管理治安业务数据预处理作业视频/图像数据非结构化文本数据复杂结构表数据传统关系表数据用户标签作业数据碰撞作业轨迹分析作业关系分析作业访问数据访问数据访问数据明细数据基本信息交往圈信息轨迹信息行为信息结

3、果数据可疑人群重点关系行动轨迹高危行为离线处理平台业务场景 - 安平领域第6页版权所有 2019 华为技术有限公司大数据平台交易系统区数据服务区数据应用区数据仓库系统监管报送类应用数据集成区外部数据人行征信社交网络内部结构化数据核心信贷收单内部非结构化数据电话银行网银信用卡影像平台电商平台数据采集网络爬虫数据操控数据传输数据分发数据压缩数据加载实时加载准实时加载操作型数据仓储（准实时ODS）实验数据区历史数据区缓冲层基础层汇总层公共实验区分行实验项目大数据存储个人/企业征信银监会1104报送证监会报送审计署平台 BI类应用零售分析系统电子银行BI 信用卡BI 新型分析类应用精准营销系统反欺诈/反洗钱个人信贷评分 KPI考核指标大数据多表关联分析大数据算法分析离线分析平台。业务场景 -

第二章 大数据离线批处理场景化解决方案.pdf

相关报告

第二章大数据离线批处理场景化解决方案.pdf