1、非结构化数据管理知识与实践(2023版)2023年4月上海鸿翼软件技术股份有限公司中国电子技术标准化研究院北京中船信息科技有限公司华迪计算机集团有限公司北京数科网维技术有限责任公司福昕鲲鹏(北京)信息科技有限公司北京点聚信息技术有限公司友虹(北京)科技有限公司永中软件股份有限公司参编单位编写组成员张群罗永秀黄永庄王雷周兆锋刘赛赛王长胜尹卓姚宝敬任歌吕艳静方俊徐志东曹幼林闫述陈亚军张程张治杨吉云龙凌云张凯彭革非刘丹陆猛梁勇版权声明版权声明本白皮书版权属于上海鸿翼软件技术股份有限公司、中国电子技术标准化研究院,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或观点的,请注明:“来源:电子文件
2、管理推进联盟”。违反以上声明者,将追究其相关法律责任。目录1.前言.12.非结构化数据管理.31.前言.12.非结构化数据管理.32.1.非结构化数据定义及特征.32.2.非结构化数据管理的发展历程.42.3.OFD归档用电子文件的标准格式.73.非结构化数据管理体系.103.非结构化数据管理体系.103.1.数据管理能力成熟度模型.113.2.非结构化数据应用分级要求.133.3.非结构化数据战略与顶层设计.193.4.非结构化数据治理.213.5.非结构化数据管理.223.6.非结构化数据价值.334.非结构化数据管理解决方案.384.非结构化数据管理解决方案.384.1.非结构化数据管理
3、与 ECM 企业内容管理.384.2.ECM 内容管理成熟度模型 CM.414.3.ECM 内容管理平台架构.434.4.ECM 内容管理核心技术.464.5.新一代 ECM 平台的发展方向.515.非结构化数据管理应用实践.545.非结构化数据管理应用实践.545.1.非结构化数据管理应用类型.545.2.非结构化数据管理应用实践.566.结束语.746.结束语.74非结构化数据管理知识与实践(2023 版)11.前言1.前言数据,是当今时代企业生产生存的命脉。企业的持续经营必将产生大量数据,而海量的数据也无时不刻地在影响着企业的经营。无论是在企业的战略层面还是执行层面,数据管理对于企业决策
4、都具有举足轻重的作用。在战略层面,基于数据管理能够有效梳理企业数据资源,支撑企业优化战略决策,提前洞悉业务中存在的潜在问题,把握市场,拓展机遇,抢占竞争先机;而在执行层面,通过数据管理能够帮助企业解决现有业务中的数据责权不清、数据标准不明、管理流程混乱、数据质量低下等常态问题,形成标准化的数据利用流程,提升运营效率,培养企业的核心竞争力。2018 年,全国信息技术标准化技术委员会大数据标准工作组组织制定的 GB/T 36073-2018数据管理能力成熟度评估模型(以下简称 DCMM)国家标准正式发布。在推动 DCMM 国家标准落地应用过程中,当前部分企业已经逐渐形成对数据的管理意识,并陆续开展
5、数据管理相关工作。因此,发布 DCMM是顺势而为,旨在指导国内企业的数据管理建设与数据文化培养,为企业数字化基础设施的形成与完善提供方向与建议。根据调查显示,企业数据管理工作目前侧重于结构化数据的管理,已经形成了多种针对企业业务中产生的结构化数据进行管理的专业软件,能够以体系化、动态化、甚至智能化的手段,对企业内的结构化数据进行高成熟度的管理。然而,相比之下,企业针对文档、图片、音视频等非结构化数据的管理方面仍投入不足。这些文件充斥在企业的存储系统与员工日常办公中,大部分企业却依旧处于非结构化数据的局部建设或者初步建设阶段。一方面,大部分企业尚未认识到非结构化数据管理的重要性;另一方面,缺乏成
6、熟的非结构化数据管理知识与实践(2023 版)2非结构化数据管理体系和工具的支撑,也缺乏针对非结构化数据实践的专门标准。为此,上海鸿翼软件技术股份有限公司、中国电子技术标准化研究院联合北京中船信息科技有限公司、华迪计算机集团有限公司,以及北京数科网维技术有限责任公司、福昕鲲鹏(北京)信息科技有限公司、北京点聚信息技术有限公司、友虹(北京)科技有限公司、永中软件股份有限公司等电子文件管理推进联盟会员单位,共同开展对非结构化数据管理相关的技术、应用以及标准化的研究探索工作。作为 DCMM在非结构化数据领域的补充与细化,本白皮书立足于非结构化数据管理应用实践,结合 DCMM国家标准体系框架,提出了非