当前位置:首页 > 报告详情

专场11.4-百度沧海.存储万亿级元数据底座TafDB设计和实践-曹彪(脱敏版).pdf

上传人: 2*** 编号:126868 2023-05-01 32页 2.34MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
百度沧海存储的TafDB是一种万亿级元数据底座,旨在解决云存储系统中的扩展性和性能问题。文章概述了云存储元数据面的技术演进,包括层级Namespace和分布式文件系统,以及面临的挑战,如数据爆发式增长和元数据面的扩展性。TafDB的关键设计包括避免2PC事务高额开销,通过异步索引和自定义分裂策略优化性能,以及采用两层墓碑机制解决删除后的范围查询性能问题。为实现高可扩展性和可用性,TafDB消除了全局时间戳服务器的单点瓶颈,采用分布式时钟方案。TafDB的应用效果显著,例如在对象存储中,单Bucket容量从百亿级别提升到万亿级别,小文件延迟降低42%。文件系统方面,单集群容量从十亿级别提升到万亿级,写延迟为2ms,读延迟为百us级。未来的规划是打造业界领先的元数据存储底座,面向元数据场景设计最优的读写路径,打造零运维的存储系统,提供更丰富的功能层。
"百度沧海存储如何实现万亿级元数据的底座设计?" "TafDB如何解决云存储元数据面扩展性面临的挑战?" "百度沧海存储的TafDB在实践中遇到了哪些问题,又将如何解决?"
客服
商务合作
小程序
服务号
折叠