当前位置:首页 > 报告详情

3-2 淘系数据模型治理最佳实践.pdf

上传人: 云闲 编号:102550 2021-01-01 33页 6.41MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了淘宝/天猫数仓在数据模型管理方面的问题与治理方案。问题部分指出,数仓存在临时表多、命名不规范、CDM过度设计、ADS重复建设与跨集市依赖等问题。原因分析认为,这些问题的产生与导出/报表/算法工具过程中的临时表管理不当、缺少onedata工具规范管控、CDM与ADS研发分工不明确等因素有关。 治理方案部分提出了一系列措施,包括:建立模型项目共建机制、规范数仓分层标准、推动公共层表的复用性、优化数据模型评估体系、实现数据体系目录结构化与模型设计线上化、加强智能建模等。同时,治理方案还强调了在日常研发流程中,需遵循规范,并借助工具提升效率与保证规范治理。 未来规划方面,计划将研发工作重点放在应用层,并通过完善研发规范、构建智能建模功能、集成数据测试与运维功能、优化事中事后治理能力等措施,提升研发效率与运维效率,实现效率与规范的平衡。
"数据模型管理挑战" "如何提高数据治理效率" "数据模型生命周期问题"
客服
商务合作
小程序
服务号
折叠