《郭杰-数据治理企业智能化的命脉论坛-公开分享版.pdf》由会员分享,可在线阅读,更多相关《郭杰-数据治理企业智能化的命脉论坛-公开分享版.pdf(24页珍藏版)》请在三个皮匠报告上搜索。
1、DataFunCon#2024企业数据编织演变:从物理到逻辑,创造新质生产力郭杰Denodo Technologies大中华区技术总监Contents目录成功与挑战逻辑数据编织优势企业角色与使用场景成功客户故事Denodo公众号数据编织咨询群成功与挑战将您的数据迁移至单个.数据仓库数据湖云业务需求也在发生变化IT减少 ETL 作业和数据移动对节省成本有巨大影响降低数据复制比率可以减少开支优化查询执行时间可以显著影响云成本更快的数据预配置可以提高 IT 效率并降低成本企业所有者数据敏捷性对于寻找新商机至关重要很多公司正在实施策略,以提高数据利用率,并采用明确的指标来衡量进展数据民主化是所有大型组
2、织的首要任务数字化转型计划需要数据以进行分析并获得见解CEO关心以上所有内容CDO 和合规经理 出于合规原因,数据安全和对数据管道的控制是 CDO 的首要任务降低风险和监管合规性对公司运营有巨大影响数据治理和控制可为企业提供可信数据Denodo 一种完全不同的数据管理方法现代数据架构必须.接受分布式数据环境接受数据驻留在多个位置或系统中的事实,其中包括本地、混合、多云环境。所有数据均需以一致方式进行管理使用逻辑方法来管理现代数据架构使用者通过与数据位置和物理架构分离的集中式语义模型访问数据,该模型可以强制执行安全性和治理要求逻辑数据编织优势逻辑数据仓库(LDW)数据虚拟化逻辑数据仓库架构什么是
3、数据编织?要点“连接”不同数据源的数据元数据驱动可自由组合使用 AI/ML 进行推荐不同数据集的逻辑抽象数据源2.数据模型合并、转换 和语义3.发布1.源抽象使用应用程序4.开发/运维由数据虚拟化支持的数据编织架构数据虚拟层(数据不在此落地)实时连接不同位置不同格式的异构数据逻辑合并相关数据为统一语义模型的视图使用BI、数据科学、数据目录、API自服务混合云/多云数据治理查询优化人工智能推荐安全逻辑数据编织数据分析工具数据科学工具数据目录发现-探索-文档数据服务RESTful/ODataGraphQL/GeoJSONSQL消费者大模型应用200+数据接口应用软件流式数据数据服务类API数据文件
4、(结构化/半结构化)OLAP数据Hadoop与 NoSQL云存储/SaaS传统数据库和数仓数据来源API什么是数据网格?数据网格是一种新的数据管理架构范式 由Thoughtworks顾问 Zhamak Dehghani 于 2019 年提出 它实现了从单个团队管理的集中式数据架构向分布式组织的迁移 多个自治单位(域)负责管理自己的“数据产品”,并将它们公开至组织的其余部分 组织的其余部分应能轻松发现、理解和访问这些数据产品数据网格Data Mesh的理念尊重差异数据即产品:数据产品应易于发现、理解并可供组织其他部门使用自服务平台:允许域以自助方式构建、部署、发布和管理数据产品由中央团队运营,但
5、中央团队不开发产品联合计算治理:确保互操作性和全局政策共享实体的通用语义和惯例全局安全和管理政策虚拟化群集中的数据网格SQL操作型企业数据仓库数据湖文件SaaS APIRESTGraphQLOData事件产品客户地点员工1.每个域都有一个单独的虚拟模式。公共域可能对于处理跨域通用的集中式数据产品十分实用。2.各个域连接自己的数据源。3.将元数据映射到关系视图。4.各个域可对自己的数据产品进行建模。产品可用于定义其他产品。5.为了执行,产品可以直接由它们的源提供,也可以复制到一个中心位置(例如湖)。公共域事件管理人力资源6.中央团队可以制定准则和治理策略,确保互操作性和安全性。8.基础架构可在群
6、集中轻松扩展。MDX7.可通过 SQL、MDX 访问产品,或将产品以 API 的形式公开。无需编码。企业角色与使用场景Denodo数据虚拟化主流应用场景360视图客户360产品360XX 360数据服务相关数据服务用于数字化应用的数据服务用于 SCV/MDM 应用的数据服务应用程序迁移云端相关SaaS数据分析云应用的数据服务云现代化多云混合数据合规相关治理,风险与合规GDPR/PIPE数据隐私数据遮罩BI与分析相关自助BI增强逻辑数据仓库企业数据编织大数据技术相关逻辑数据仓库逻辑数据湖数据仓库卸载大数据/高级分析Denodo数据虚拟化19自1999年以来