3、马进-基于Flink + iceberg 的湖仓一体.pdf

编号:101895 PDF 26页 19.90MB 下载积分:VIP专享
下载报告请您先登录!

3、马进-基于Flink + iceberg 的湖仓一体.pdf

1、网易 马进ArcticArctic:基于:基于Flink+icebergFlink+iceberg 的湖仓一体的湖仓一体Arctic:Using flink and iceberg to build netease lakehouse背景与目标背景与目标#1Background and goalsArctic Arctic 特性特性#2Arctic featuresArctic Arctic 架构架构#3Arctic architecture总结总结#4Summary#1#1背景与目标背景与目标Background and goals离线数据中台体系数据传输batch transferbatc

2、h tableolap systemBI/AI businessspark/prestohivespark/hivespark/hiveimpala/sparksql数据开发数据资产数据血缘数据质量数据分析有数数据模型任务运维Timing scheduling drive数据服务实时数仓体系cdc/event fetchstream tableolap systemBI/AI businessflinkcdc/canal/ndckafkaflinkimpala+kududruid/doris/clickhouseredis/mysql/oracle实时开发实时血缘实时任务监控运维flinkba

3、tch transferbatch tableolap systemBI/AI businessTiming scheduling driveEvent drive存在的问题主题域/数据分层modelDQCpropertiessensorslogsdatabases数据源demanddemanddemand数据治理VS点对点开发datalakedata governingp2p developing目标:实时数据中台batch transferfused tableolap systemBI/AI businessspark/hive/flinkspark/flinkimpala/sparks

4、ql数据开发数据资产数据血缘数据质量数据分析有数数据模型任务运维数据服务cdc/event fetchTiming scheduling driveEvent drive流批一体目标拆解存储流批一体开发流批一体工具流批一体统一 schema统一存储引擎统一存储介质消除二义性使用一套代码覆盖实时和离线场景统一 UDF统一开发规范数据模型数据资产数据质量数据血缘数据传输one data fits allone tool fits allone code fits allArctic 需求支持基于主键的流式更新支持流式读/增量读(Stream and CDC)支持各类引擎的并发读写,提供ACID 保

5、障提供分钟级数据延迟的 olap 能力提供湖仓一体服务,而不是软件库support streaming update based on primary keysupport streaming/incremental read(stream and CDC)support concurrent reading or writing with ACIDprovide minute latency olap abilityprovide lakehouse service,not libs#2 2Arctic Arctic 特性特性Arctic featureschange file(insert

6、/update/delete)base file(insert)tmp filenew base tablechange tablebase tabletmp filesSTEP 1:Hive MR 增量传输方案map and shufflereduceIO 效率低(IO/有效更新)写放大与实时性 trade off没有 ACID 保障适合小时级别的增量同步low io efficiencywrite amplification vs data latencyno ACID guaranteesuited for hour latencySTEP 2:基于 Bucket 数据整理方案chang

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(3、马进-基于Flink + iceberg 的湖仓一体.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠