当前位置:首页 > 报告详情

华为云实时数据湖查询优化.pdf

上传人: 2*** 编号:121851 2023-03-29 25页 1.81MB

报告标签

华为云 实时数据湖查询
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
华为云实时数据湖查询优化演讲人孟涛在2023年介绍了华为云数据湖的基础架构、数据湖的查询能力以及基于Hudi的性能优化。Hudi支持流式计算、FlinkSQL、SparkSQL和Spark交互式分析。Hudi的数据布局优化包括clustering、compaction和clean,以及支持范围查询、等值查询和聚合操作。Hudi的索引优化包括数据索引、Lucene索引和Bitmap索引。华为云基于Hudi的性能优化包括索引优化、统计信息优化和查询瓶颈分析。通过优化,华为云的Hudi表在1.5T数据和120亿条数据的情况下,性能提升了3x到11x。未来的工作包括热点数据缓存、实时物化视图和Mor表读性能优化。
Hudi性能优化解析" Hudi如何提升效率" Hudi未来规划与挑战"
客服
商务合作
小程序
服务号
折叠