云原生数据湖存储的架构发展和数据治理-程力.pdf

编号:153037 PDF 23页 9.92MB 下载积分:VIP专享
下载报告请您先登录!

云原生数据湖存储的架构发展和数据治理-程力.pdf

1、云原生数据湖存储架构发展和数据治理数据湖存储负责人/程力腾讯云数据湖存储GooseFS介绍腾讯云原生数据湖存储的架构数据湖存储GooseFS大数据业务实践数据湖存储GooseFS模型训练业务实践数据湖存储架构演进对象存储 COS大数据AIHPC基因HadoopCompatible可架构智能缓存集群化部署FUSECompatibleNativeFS InterfaceS3Compatible渲染鉴权认证监控告警志管理COS 加速器元数据加速Data LakeGooseFSGooseFS数据湖三层加速架构数据湖三层加速架构:近计算端缓存:计算端 -缓存加速 元数据加速:数据端 -元数据加速 COS

2、加速器:存储端 -数据加速AZ 1EMR AI ML K8SCOS 对象存储GooseFS(Cache Accelerator)元数据加速器(Metadata Accelerator)数据加速器(Data Accelerator)AZ 2EMR AI ML K8SGooseFS(Cache Accelerator)数据加速器(Data Accelerator)IcebergIceberg计 计 算 算 端 端 加 加 速 速A AZ Z端 端 加 加 速 速存 存 储 储 端 端 加 加 速 速GooseFSGooseFS:CacheCache Accelerator:Accelerator:

3、运行在EMR/AI/ML/K8S集群内,基于集群MEM/SSD资源,提供Data Cache能力;热数据缓存在Cache中,对象存储保存全量数据;针对各种计算引擎,提供Data Locality能力;提供磁盘模式和内存模式,支持淘汰COSCOS加速加速器器:DataData AcceleratorAccelerator:AZ级部署,全SSD存储介质,热数据读加速;提供Tbps带宽,满足高吞吐需求;提供ms级别时延;元数据加速元数据加速器器:MetadataMetadata AcceleratorAccelerator:提供文件系统级别元数据操作能力;Rename操作,无需Copy/Delete

4、数据;List操作,无频控;每个Bucket,提供10万 QPS;数据湖存储数据湖存储GooseFSGooseFS拓扑拓扑COS 对象存储TablesHive MetaStore/DLF MetaStoresub-prefix(Partitions)FilesprefixMetadata Cache(RAM/SSD/HDD)H Hi iv ve e/I Ic ce eb be er rg g T Ta ab bl le e 预 预 热 热:Table相关的数据从COS对象存储中,被加载到计算节点DataCache中。Data Cache(RAM/SSD/HDD)P Pr re ef fi ix

5、 x预 预 热 热:COS对象存储中对应Prefix的Objects,被加载到计算节点DataCache中。MMe et ta ad da at ta aC C a ac ch he e:元数据被缓存到计算节点MetadataCache中,并通过RocksDB进行持久化。DataData CacheCache:支持Hive Table Level预热,面向业务加速;支持Iceberg Table Leve预热;支持Prefix Level预热,按目录加速;支持多种数据缓存淘汰策略,LRU/LRFU/TTL;支持缓存数据同步/异步写入COS;MetadataMetadata CacheCache

6、:避免了大量的list operations;提高了Metadata 访问性能;GooseFS 大数据业务加速EMR C oreNodeExecutorGooseFSWorkerExecutorSpark DriverSpark ExecutorGooseFSClientCOS 对象存储C lient NodeSpark ContextEMRMaster nodeGooseFS MasterYarn Resource ManagerYarn Node ManagerEMR C oreNodeExecutorGooseFSWorkerSpark ExecutorGooseFSClientYarn

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(云原生数据湖存储的架构发展和数据治理-程力.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠