当前位置:首页 > 报告详情

爱奇艺在 Iceberg 落地相关性能优化与实践(1).pdf

上传人: 2*** 编号:121860 2023-03-29 31页 3.50MB

报告标签

数据湖技术 Iceberg
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了数据湖平台的建设、优化和未来规划。文章提到,数据湖平台采用了Iceberg作为表格式,支持PB级数据存储,并可通过分区减少文件数量,提高查询效率。平台通过优化小文件合并、写入参数控制、BloomFilter索引和Alluxio缓存等策略,显著提升了数据处理性能和存储效率。例如,订单ID查询的性能从948秒降低到10秒,存储空间增加仅3%。此外,数据湖平台支持流批一体,实现了广告和会员订单等业务的实时报表和分析。未来规划包括更多业务场景的应用,如BI Pingback,以及特征生产的支持。技术层面,文章提到将探索Puffin统计信息用于查询加速,以及Branch和Tag的应用。
"数据湖平台如何实现流批一体?" "Iceberg表格式如何优化数据存储?" "如何通过BloomFilter提高Iceberg查询效率?"
客服
商务合作
小程序
服务号
折叠