当前位置:首页 > 报告详情

刘石伟-【企业实践】Flink在字节跳动数据流的实践.pdf

上传人: 云闲 编号:101810 2021-01-01 24页 5.59MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了字节跳动在数据流处理方面,特别是Flink在实时数据处理中的实践和治理经验。字节跳动面临业务数据量大、实时性要求高、ETL需求变化频繁等挑战,通过不断优化技术架构,如从PyJStorm迁移到PyFlink再到Java Flink,实现了流式任务托管平台和一站式大数据开发。在治理实践中,针对单机负载不均、Kafka集群问题、埋点治理等常见问题,提出了Flink BacklogRescale方案、Yarn策略优化、BMQ等多机房容灾和成本优化方案。未来规划包括流批一体、云原生架构探索、提升链路保障和资源利用率等。
"字节跳动如何利用Flink进行数据治理?" "Flink在字节跳动数据流的实践有哪些亮点?" "字节跳动如何应对数据流ETL的挑战?"
客服
商务合作
小程序
服务号
折叠