当前位置:首页 > 报告详情

数据湖技术IceBerg如何解决腾讯看点业务痛点v5.pdf

上传人: li 编号:29784 2021-02-07 24页 2.44MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯看点在使用数据湖技术,特别是Iceberg时的实践和收获。腾讯看点的业务痛点主要集中在万亿级别的数据处理上,包括内容加工审核链路数据的写入和用户消费行为数据的写入问题。传统的数据仓库解决方案如Hive和HBase在这些场景下存在性能瓶颈和资源浪费的问题。 Iceberg作为新一代数据湖技术的开源方案之一,在腾讯看点的实践中有以下几个关键点: 1. 通过Flink消费HBase写流水,再利用Flink-Iceberg Connector写入Iceberg,实现了高效的数据写入。 2. Iceberg的时间旅行(Time Travel)和Snapshot机制,使得历史版本数据的访问和读取的ACID保证成为可能。 3. 用户行为流水按分钟粒度直接入库Iceberg,结合Presto计算引擎构建了T+0准实时数仓。 4. Iceberg的Merge On Read特性使得迟到数据可以轻松地合并到表中,大大提高了数据的实时性和稳定性。 总的来说,Iceberg在腾讯看点的实践中的应用,解决了传统数据仓库解决方案在处理海量数据时的性能瓶颈和资源浪费问题,提高了数据的实时性和稳定性,使得数据的价值得到了提升。
"腾讯看点如何解决数据存储难题?" "Iceberg技术在腾讯看点的实际应用效果如何?" "腾讯看点如何利用数据湖技术提高数据处理效率?"
客服
商务合作
小程序
服务号
折叠