当前位置:首页 > 报告详情

2020年终大会-大数据应用:9-2.pdf

上传人: li 编号:29875 2020-12-01 35页 1.37MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了数据湖的初步探索与实践落地,早期数据架构存在的痛点,以及Snowflake Paper的概念解读。作者提出了增量入湖、数据传输架构、数据入湖架构、ODS层增量化、DWD层Append和Upsert增量挑战等解决方案。其中,核心诉求是支持Append、Upsert增量写入,底层依赖Flink、HUDILancer等技术。同时,文章还介绍了数据湖的存储计算分离、MVCC、LSM、time-travel等特性,以及数据质量、稳定性、时效性等方面的优化。最后,作者展望了未来的发展方向,包括资源灵活伸缩、引入Flink CDC Source、ADS层的Upsert尝试等。
"数据湖如何提升数据时效性?" "如何解决大数据环境的稳定性问题?" "数据湖架构未来的发展趋势是什么?"
客服
商务合作
小程序
服务号
折叠