当前位置:首页 > 报告详情

2020Flink峰会报告:6- Flink SQL-TSY.pdf

上传人: li 编号:29337 2020-12-01 39页 9.35MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Flink在数据集成方面的应用和优势。Flink支持数据仓库和数据集成的集成,提供数据集成的主要步骤:数据接入、数据清洗、数据入仓和入湖。数据仓库是一个集成的、面向主题的、随时间变化的、不可修改的数据集合,用于支持管理决策。Flink支持流式数据集成,可以处理实时、离线数仓的数据,并且支持全量读取和CDC增量读取。Flink的Temporal Join特性可以处理复杂的数据关联,支持多版本的数据状态,并且可以自动清理过期的数据。Flink还支持小文件的自动合并,并且可以将其与Iceberg数据湖结合,实现流式数据写入。总的来说,Flink提供了丰富的数据集成能力,包括全量读取、流式读取、CDC流式读取、维度关联、流式写入和CDC写入等,适用于各种不同的数据存储和处理场景。
"Flink如何实现数据集成?" "实时数据仓库如何构建?" "数据打宽在Flink中如何操作?"
客服
商务合作
小程序
服务号
折叠