Apache Celeborn和数据湖计算引擎云原生实践.pdf

上传人： 2***

编号：121844

2023-03-29

PDF 22页 7.87MB

《Apache Celeborn和数据湖计算引擎云原生实践.pdf》由会员分享，可在线阅读，更多相关《Apache Celeborn和数据湖计算引擎云原生实践.pdf（22页珍藏版）》请在三个皮匠报告上搜索。

1、Spark/Flink+Celeborn:更快，更稳，更弹性演讲人：一锤阿里云2023 背景性能稳定弹性背景传统Shuffle的问题传统Shuffle的缺陷依赖大容量本地盘/云盘 IO放大高网络连接磁盘随机读单副本限制不够高效不够稳定不够弹性Apache Celeborn(Incubating)Celeborn:大数据引擎统一中间数据服务引擎无关 Shuffle+Spilled datahttps:/ 700+Commits 33 Contributors,7 Committers(3 in-coming)370+Stars性能核心设计Push Shuffle+Partitio

2、n数据聚合Partition切分存算分离写放大磁盘随机小IO网络高连接小IO支持Spark AQEPartition合并Join Strategy切换Skew Join优化Partition范围读Map范围读12Split切分Sort On Read3Range Read列式Shuffle 行列转换代码生成解释执行代码生成行列转换:(Int,String,Decimal)Shuffle Size缩减40%，行列转换开销低于5%多层存储内存/本地盘/OSS(HDFS)可任选1/2/3层配置让数据尽可能存在快存储稳定原地快速升级向前兼容优雅重启流控参考TCP的拥塞控制慢启动拥塞避

3、免拥塞检测其他实现:Credit Based Flink Shuffle Read负载均衡磁盘监控坏盘刷盘速率未来用量隔离坏盘尽量分配给快盘/大盘弹性Spark on K8S开源方案:spark.dynamicAllocation.shuffleTracking.enabled=true限制：几乎无法释放podEvaluation典型场景完全混部提升性能&稳定性Celeborn独立部署提升性能&稳定性源数据和Shuffle数据分离部分弹性存算分离提升性能&稳定性计算，数据，临时数据分离完全弹性超大作业混部场景：大作业稳定性&性能显著提升 1000+Celeborn Worker 压缩后4PB Shuffle Data存算分离存算分离场景 100台Celeborn Worker 数万pods，极致弹性性能和稳定性显著提升TPCDS 3T TPCDS 20%性能提升感谢您的观看演讲人：一锤-阿里云

Apache Celeborn和数据湖计算引擎云原生实践.pdf

报告标签

相关报告