当前位置:首页 > 报告详情

康琪KangQi - 十荟团基于Flink SQL与Zeppelin构建实时数仓的实践 .pdf

上传人: 云闲 编号:101891 2021-01-01 29页 46.31MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了康琪作为十荟团的大数据工程师,同时也是Apache Flink的贡献者,分享了基于Flink SQL与Zeppelin构建实时数仓的实践经验。实时数仓的建设经历了从Spark Streaming到Flink的发展过程,当前已实现平台化、标准化,并支持实时OLAP。文章详细阐述了数仓的建设过程、分层设计、Flink SQL的增强以及与Zeppelin的集成。在数仓平台化方面,统一了数据标准、开发流程和元数据存储,同时面临人员短缺、前后端技术栈不足等挑战。Zeppelin作为Web-based的多功能笔记工具,提供了丰富的数据处理解释器,支持Flink SQL、Scala和Python等语言,实现了作业监控、数据血缘、组件调优等功能。未来计划包括迁移至K8s、数据湖集成以及Zeppelin相关的优化和改进。
"实时数仓建设如何进行?" "Flink SQL有哪些增强功能?" "未来计划中涉及哪些方面?"
客服
商务合作
小程序
服务号
折叠