当前位置:首页 > 报告详情

张康-字节跳动大规模HDFS存储运维实践_v1.1.pdf

上传人: 2*** 编号:122041 2023-04-04 23页 7.43MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了字节跳动在HDFS存储方面的运维实践和探索。张康,字节跳动大数据存储SRE负责人,分享了他及其团队在HDFS架构设计、运维挑战、实践经验和未来展望方面的深入见解。 字节跳动的HDFS架构经历了三个阶段:基于开源HDFS的定制化,上线自研DanceNN,以及全面支持近在线业务。目前,字节跳动的HDFS单集群节点已超过15W,数据量达到20EB+,采用三机房架构。 在运维挑战方面,张康指出,大规模分布式存储场景下的稳定性体系、成本优化、平台效率及业务运营是核心关注点。他提到了数据倾斜、数据放置/迁移/容灾、跨机房带宽、海量小文件问题等挑战。 在运维实践方面,字节跳动构建了高可用运维体系、自动化运维运营平台Kepler V2,以及Data Insight体系,实现了业务分类、负载分析、资源管控等目标,提升了运维效率和稳定性。 未来展望方面,字节跳动将继续推进全自研、元数据分布式智能化运维,致力于成本和数据治理。此外,还将关注存算分离架构、高性能低成本存储、自适应多机房容灾等方面的技术创新。
"大规模HDFS如何实现稳定性运维?" "字节跳动HDFS架构演进历程是怎样的?" "如何通过Data Insight体系优化HDFS成本?"
客服
商务合作
小程序
服务号
折叠