当前位置:首页 > 报告详情

2.快手从模型规范开始的数据治理实践-孙伟.pdf

上传人: li 编号:29685 2021-02-07 27页 10.90MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了快手法数据研发专家孙伟关于数据治理的实践和思考。孙伟负责新业务公共数据和治理方向,关注数仓技术、数据架构和数据治理领域。文章提出了数据治理的背景和重要性,以及快手法数据治理体系的思考和实践。 数据治理的目标是降低数据成本、提升数据质量、减少数据风险,实现数据价值化。数据治理是对数据资产管理行使权和控制的活动集合,包括规划、监控和执行。快手法数据治理体系思考主要包括数据治理体系思考、模型规范治理实践和未来规划。 在模型规范治理实践方面,快手法存在数据孤岛、数据不一致、模型不稳定和模型产出时效差等问题。为解决这些问题,快手法制定了模型规范和标准,确定治理目标和方法,采用元数据驱动治理。模型规范治理思路是合理的规范和标准需要结合企业特点和现状,数据驱动是快手法文化的一部分。 快手法模型规范治理实践包括模型分层规范、指标定义规范和指标管理流程规范。模型分层规范包括数据域维度、业务过程维度和模型事实模型、汇总模型等。指标定义规范要求基于指标规范,辅助流程和工具实现指标的一致性开发和服务。指标管理流程规范包括数据孤岛、指标不一致、模型不稳定和模型产出时效差等问题。 未来规划方面,快手法致力于系统化治理工具的执行层、基础层、标准层和目标层的构建,包括数据质量管理、数据安全管理、数据服务、数据价值、元数据管理、数据成本管理、质量规范、安全规范和模型规范等。通过全局过程管理和度量体系的建立,提升数据治理的健康度和价值。
"数据治理如何提升数据质量?" "模型规范治理实践中的挑战与解决方案是什么?" "如何通过数据治理实现数据价值化?"
客服
商务合作
小程序
服务号
折叠