1.数据整合是什么意思
数据整合是指将不同存在形式的问卷进行筛选和录入后,整合到一起,形成规范、完整的原始数据,方便后文的分析运用。在数据整合的实现机制上,主要有Mediator/Wrapper整合机制、Agent
合机制,P2P整合机制以及数据仓库整合机制等。

2.数据整合的优点
(1)底层数据结构的透明:为数据访问(消费应用)提供了统一的接口,消费应用无需知道:数据在哪里保存、源数据库支持那种方式的访问(XQuery,SQL)、数据的物理结构、网络协议等。
(2)性能和扩展性:数据整合把数据集成和数据访问分成了两个过程,因此访问时数据已经处于准备好的状态。
(3)提供真正的单一数据视图:数据视图data view这个概念大家很容易理解,
数据整合的优势是经过了数据校验和数据清理,你看到的数据更加真实、准确、可靠。
(4)可重用性好:由于有了实际的物理存储,数据可以为各种应用提供可重用的数据视图,而不用担心底层实际的数据源的可用性。
(5)数据管控能力加强:管控是SOA里面重要的概念。数据整合的优势是数据规则可以在数据加载,转换中实施,保证了数据管控。
3.数据整合和集成的区别
数据整合和数据集成的区别在于:
数据整合是单纯的数据整合,而数据集成的涵盖范围要比数据整合要广。
数据整合解决方法主要通过各种不同数据源之间的数据传递、转换、清洗、集成等功能实现。它从用户的业务需求和实际应用出发,对现有的数据资源和处理流程进行综合分析,以信息资源规划为标准,通过数据层面的整理提炼,将分散在各个"信息孤岛"中的有效信息资源,构筑在临时存储空间区域中,并根据临时存储空间区域中的规则库中设定的业务规则将数据进行清洗和转换,这些经过清洗和转换的数据形成完善的数据中心系统,从而能够全面支持数据共享、统一管理和分析决策。由于信息孤岛具有多维度性,因此信息孤岛的消除是一个十分复杂且极具挑战性的工作。所以数据整合技术具有极强的专业性,以及与实际业务的紧密相关性,如若再次缺乏前瞻性的设计规划和整合处理,势必会在消除一部分信息孤岛的过程中衍生出一些更大的信息孤岛。
以上就是有关于数据整合的定义、优点及其与数据集成的区别的全部介绍,如果还想了解更多数据整合的相关内容,敬请关注三个皮匠报告网站。
推荐阅读
什么是数据安全?包括那哪些?特点梳理
什么是数据质量?重要性及影响因素介绍
什么是数据驱动?数据驱动是什么?