当前位置:首页 > 报告详情

使用 DELTA LAKE 大幅降低处理成本.pdf

上传人: 张** 编号:167686 2024-06-15 23页 1.12MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了Amadeus IT Group在数据处理成本方面通过Delta Lake实现显著降低的实践。主要内容包括: 1. Amadeus的数据处理应用挑战:CPU利用率低,吞吐量不达标。 2. 引入Scala、Spark和Delta Lake,进行迭代优化。 3. 优化历程:M1为基础线,M2解决线程争用,M3引入Z-Order和DFP,M4启用Photon和删除向量,M5修订历史合并策略。 4. 成果:CPU利用率提升,网络成本降低,总体处理成本减少90%。 5. 经验:迭代改进、深入调查、求助专家、设定雄心勃勃的目标。 关键数据: - M1基线成本:100%-99% - M2线程争用解决后成本:不详 - M3引入Z-Order和DFP后成本:不详 - M4启用Photon和删除向量后成本:不详 - M5修订历史合并策略后成本:1% 通过这些优化,Amadeus显著降低了数据处理成本,并将在未来的实践中继续分享经验。
"如何通过Delta Lake降低处理成本?" "Spark和Delta Lake如何简化旅行预订?" "如何通过调整线程竞争来优化Spark性能?"
客服
商务合作
小程序
服务号
折叠