1、企业数字化转型的数据治理概述ClassifiedClassified数字化生产模式:以数据为处理对象,以ICT平台为生产工具,以软件为载体,以服务为目的的生产过程智能终端平台1接触客户获取数据平台2数据处理数据分析机会平台3开发部署服务服务商业循环:数据变机会、机会变服务、服务变收入初始数据123456加工需求收入4在今天,数字化生产已逐步成为普遍商业模式ICT:Information and Communication Technologies 信息与通讯科技应用筛选提供Classified人工智能销售预测模型的建立数据要准确考量数据特性预测目标计算资源业务需求模型的评估和调优;交叉验证、超
2、参数调整Classified人工智能销售预测模型的建立.传统时间序列分析纪要历史数据来预测未来趋势 自回归()、移动平均()、自回归移动平均()季节性自回归移动平均.机器学习模型 线性回归 决策树、随机森林(处理非线性关系).深度学习模型 循环神经网络(RNN)、卷积神经网络(CNN).混合模型Classified信息来源:Gartner数字化转型的核心:“业务优化”和“业务转型”Digital Business OptimizationDigital Business TransformationBetter CustomerExperienceImproved Productivity a
3、nd Existing RevenueNew BusinessModelsNet-New RevenueProduct and ServicesDigital Business Strategy4Classified数据分析1.提出问题2.理解数据选择全集或子集中列名重命名缺失数据处理数据类型转换数据排序异常值处理4.构建模型3.数据清洗5.数据可视化数据量数据类型数据内容数据属性E-R图描述数据组织数据对数据进行操作描述数据库类型和属性为什么要分析哪些分析指标得到什么结果需要哪些数据将数据转换成图或表,以更直观的方式展现和呈现数据ClassifiedE-R图(实体关系图)ER图是一种描述现实
4、世界的概念模型的方法,用来表示实体,属性和联系Classified表格:由行和列组成,用于比较变量。表格以结构化方式展示大量信息。饼图和堆积条形图:这些图形分成多个部分来表示一个整体的不同部分。它们提供了一种简单的方法来组织数据并比较组件的大小。线形图和面积图:这些视觉显示通过绘制一段时间内的一系列数据点,来展示一个或多个数量的变化。线形图利用线条展示这些变化,而面积图用线段将数据点连接起来,然后将变量堆叠起来,并用颜色区分不同的变量。直方图:该图形使用条形图绘制数据分布(条形之间没有间隔),表示属于特定范围的数据数量。这种视觉表示使终端用户容易识别给定数据集内的异常值。散点图:这些视觉表示对
5、于揭示两个变量的关系十分有用,通常用于回归数据分析。但是,有时可能会与气泡图混淆,气泡图用于通过 x 轴、y 轴和气泡大小来呈现三个变量。热图:这些图形显示有助于按位置呈现行为数据。位置可能是地图上的地点,甚至是网页。树形图:以一组嵌套形状(通常是矩形)展示层级数据。树形图非常适合根据面积大小比较类别比例。数据可视化ClassifiedClassifiedClassified什么是数据治理 数据治理是一项战略计划,用于优化企业处理数据的方式。它旨在对数据资产进行规划、监控、执行、管理;组织和改进公司用于定义、收集、存储、保护、管理和货币化业务数据的政策和程序,并有目的性的实践活动;良好的数据治
6、理不仅旨在保护数据,而且旨在寻找为企业创造数据价值的新方法。Classified什么是数据治理 战略规划组织和角色理念植入政策和标准项目和服务技术和支持成本和资源Classified全流程监管的数据治理体系关键数据资产有清晰的业务管理责任IT建设有稳定的原则和依据作业人员有规范的流程和指导数据管理数据采集数据处理数据应用全流程监管的数据治理体系010101010101010101010101010101010101010101010101010101010101010101010101010101010101010101010101010101010101010101010101当面临争议时,