1.元数据
元数据(Metedata),通俗来讲就是关于数据的数据或者是描述数据的数据,其概念起源于计算机科学,在20世纪60年代,为了描述数据集,JackMayers就定义了Metadata—词的概念:
它可以是数据的数据结构、数据的类型等数据。例如一个学生有姓名、年龄、班级、性别、学号等信息,这些信息就构成了一个学生基本信息的元数据,通过这些数据我们可以找到该学生。元数据所涵盖的范围很广,它包括了数据的名称、类型及数据源、数据间关系等信息。在关系型数据库中,元数据描述了数据库中数据表的名称、属性、表字段的名称、类型、表字段之间的关系等数据元数据也是数据仓库不可缺少的一部分,元数据描述了存储在数据仓库中数据的数据模型,例如数据表字段的名称、属性、类型等。
此外,美国信息标准组织( National Information Standards
Organization,NISO)从其本身的词源进行定义,即元数据是关于信息或关于数据的数据,是用来创建、解释和共享所描述事物的信息。元数据是一个具有抽象概念的结构化信息,主要用于对数据资源进行定位、描述、解释,帮助用户更快更好地检索、利用和共享信息。
2.元数据分类
根据元数据的状态,可以分为静态和动态元数据。静态元数据描述了业务规则、域、类别、索引、来源、格式、名称等;动态元数据描述了处理、存储大小、存储位置、状态、数据质量等。
根据使用情况,可以分为技术元数据和业务元数据。技术元数据是为了从操作性环境向数据仓库转换而建立的元数据,包含源数据库名称等信息;还描述数据仓库技术细节的数据,包括了数据仓库中的表结构、属性、维度、数据转换的映射规则等。业务元数据从业务的角度描述了数据仓库中的数据,提供了一个的语义层,便于用户可以理解数据仓库中的数据,还包括一些进行决策支持的分析工具等信息。

3.元数据作用
元数据在对数据的管理、共享等方面起着重要的作用,通过元数据的管理可以有效的对数据进行获取、保存等操作。元数据的主要作用包括:提供数据的类型、格式、属性等方面的信息;可以对数据进行检索、添加、删除等操作;可以对数据的类型、格式等进行转换,便于对数据进行分析;实现数据的共享等。
元数据在数据仓库中作用有一下几个方面:对数据的提取,从不同的数据库提取所需的数据;数据的转换,不同类型的数据库数据的格式类型是不一样的,需要将抽取的数据格式类型统一转换;数据的清洗,不同数据库中的数据可能存在缺失或错误等,通过对数据的清洗,确保数据的正确性;数据仓库中数据库的设计;查询与报表的设计等。
以上梳理了元数据的定义、分类及作用,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告的行业知识栏目。
本文由@2200 发布于三个皮匠报告网站,未经授权禁止转载。
推荐阅读:
大数据服务产业链及其发展趋势分析
什么是大数据服务?大数据服务类型有什么?
什么是大数据营销?特点是?与传统营销的区别