1、数据合规要懂的100个产品/技术常识、基础技术名词什么是数据发现?1.旦数据收集完成,下步就是数据发现。数据发现是识别可于数据分析和/或数据整合的数据集的过程。这阶段对于评估数据质量关重要,因为数据发现具可以浏览数据或应级分析来监测模式和异常值。帮助商务进常操作和业务决策这的,可以通过可视化分析来实现。数据准备这关键阶段往往被忽视,然在正确处理数据之前了解数据意味着数据在共享使时会更加可靠。数据发现过程使具及专业知识,在数据专家的协助下、从收集到的数据中观测到模式或趋势。数据发现可以分为两类:数据发现是传统的商业智能过程,由数据专家凭借他们渊博的应案例知识、理解和丰富经验,绘制数据图。这种法完
2、全依赖个理解,由数据专家构思并勾勒出数据图表,以关联和理解数据。智能数据发现是种更现代的商业智能形式,使机器学习的动化过程来揭数据价值、并提供质量的商务解。使智能的优点是,耗时少,可以准备、构思、整合和共享相关联的数据。也可以编制数据可视化,呈现隐藏的模式和有价值的解。什么是分级分类?2.分类:更多是从业务度出发,在企业理清数据家底后,明确知道哪些数据(其实应该是元数据,更贴切些应该是字段)属于哪个业务范畴,也就是类别。这个业务范畴囊括的范围可可,完全依托于企业前期基于业务的梳理结果。举个例:份证号这类数据,既可以属于个信息范畴,也可以属于个基本信息范畴,前者的范围明显于后者。也许有朋友会发出
3、疑问,给业务划分类别当然是越细越好。这就是笔者要在此处强调的,做数据分类,并不是业务越细分越好,因为很有可能细分业务之后,最终却发现数据可进归类,这是典型分类失败的体现。当然反过来也成,分类少了,数据归不进去,也是分类失败的体现。分级:不同于数据分类,对于多数企业来说,更多是从满监管要求的度出发。数据分级属于数据安全领域,或许称呼它为敏感等级更为贴切。企业中的数据有的密级程度、有的低、有的可公开、有的不可公开,敏感等级不同的数据对内使时受到的保护策略不同,对外共享开放的程度也不同。如果企业对内部的数据没有个明确地认识,先不说是否可以满监管要求,对于的运营来说都是严重的隐患,因为很可能不就将内部
4、的敏感信息泄露了出去。什么是元数据?3.元数据(Metadata)中的元(Meta)可以理解为事物或对象,数据(data)当然就是指该对象的相关数据。你可能接触过照的元数据,其中包括图像尺、拍摄时间或者是光圈和快信息、GPS数据,对于视频件也样,如画的尺、视频和频的编码、时等等。实际上你可以理解成,关于该件或对象的切信息都是元数据,论是技术相关的信息还是内容信息的切。技术型元数据技术型元数据通常涵盖了从相机或摄像机获得的信息范围,这很然,因为这些数据主要就是由其拍摄和成的。其中除了包括前提到的图像、帧速率、编码以外,还可能(取决于相机和来源)包括镜头型号、焦距、平衡、相机硬件序号、镜头硬件序号
5、等等。取决于摄像机型号的不同,些基本数据会跟随数字媒体件的成被嵌到媒体件内部,另些可能会被单独存储在个称为Sidecar的件中,这通常是个XML件,且带有硬件产商的特定属性。内容型元数据这通常是更有的元数据,因为它包括的范围更。内容型元数据除了能来描述媒体或段的内容以外,还可以被来对素材进管理、分类、纳上下游操作流程,甚也能提供些技术型元数据的功能。基本上,你可以把内容型元数据直接理解成关键字,但它有除了可以是字符型内容以外,还可以是评分、勾选框等类型。内定型元数据可以常简洁,也可以常冗,但相同点在于,它们前来说都是由作员在制作流程中动添加和修改的也许是摄像师在拍摄中添加的场号、镜号,也许是D
6、IT员添加的卷号、样号、机位编号、景别附注、外观附注,也许是剪辑助理或VFX艺术家添加的各种注释等等。什么是数据映射(DataMapping)?4.给定两个数据模型,在模型之间建起数据元素的对应关系,将这过程称为数据映射。数据映射是很多数据集成任务的第步,例如:数据迁移(datamigration)、数据清洗(datacleaning)、数据集成、语义构造、p2p信息系统。什么是数据迁移?(datamigration)5.数据迁移是指将数据从个位置转移到另个位置,从种格式转换为另种格式,或从个应程序移动到另个应程序的过程。数据迁移通常是为数据引新系统或位置的结果。业务驱动因素通常是应程序迁移或