当前位置:首页 > 报告详情

基于Hudi+Flink打造流式数据湖的落地实践.pdf

上传人: 2*** 编号:121871 2023-03-29 31页 12.98MB

报告标签

流式数据湖落地实践
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了陈世治,资深开发工程师,在bilibili如何基于Hudi+Flink打造流式数据湖的实践。主要涉及到背景与挑战,典型场景案例,基建与内核,以及未来工作展望四个方面。在背景与挑战中,他们面临的主要问题包括批流双链路,数据孤岛问题,查询效率低等。在典型场景案例中,他们通过RDB一键入湖,流量日志分流等方式解决了这些问题。在基建与内核中,他们对Hudi和Flink进行了优化,实现了实时数仓演进。在未来工作展望中,他们计划增强数据湖内核能力,完善数据湖基建,以及在流批一体场景落地等方面进行工作。
"Hudi+Flink如何实现数据湖?" "流式数据湖实践中的挑战与解决方案是什么?" "未来流批一体数据湖的发展趋势有哪些?"
客服
商务合作
小程序
服务号
折叠