当前位置:首页 > 报告详情

李钰:HBase在阿里搜索推荐中的应用(28页).pdf

上传人: 云闲 编号:84278 2021-01-01 28页 3.57MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了HBase在阿里巴巴搜索推荐中的应用,从历史规模、应用场景、问题优化、开源未来四个方面进行了深入阐述。 历史规模方面,HBase自2010年以来,历经10多个版本,集群规模达到5000+节点,最大集群节点数为2000+,日常吞吐量为集群超过5000万次/秒,单机峰值超过10万次/秒。 应用场景方面,HBase作为核心存储系统,与计算引擎紧密结合,主要服务于搜索和推荐业务,关注高吞吐、低延迟。 问题优化方面,针对HBase的RPC瓶颈、异步与吞吐问题、GC与毛刺问题、IO隔离和优化问题,阿里巴巴进行了多项优化,如基于Netty实现HBase RpcServer,降低平均响应时间,提高RPC吞吐能力;基于netty实现非阻塞客户端,提高实时性;通过优化读路径E2E的offheap,降低GC频率,提高读吞吐;利用HDFS的Heterogeneous Storage功能,优化IO利用;通过Compaction限流、Flush限流、多WAL支持等手段,提高写吞吐。 开源未来方面,阿里巴巴积极参与HBase开源社区,贡献了多项优化方案,如Netty based rpc server impl、异步hbase客户端等。未来,HBase 2.0将带来更平稳的gc、更少的毛刺、全路径offheap等新特性,以应对硬件发展的挑战。 综上,阿里巴巴在HBase的应用和实践方面取得了显著成果,不仅解决了实际问题,还推动了HBase开源社区的发展,为HBase在搜索推荐领域的应用提供了有力支持。
"HBase在阿里搜索如何应用?" "HBase架构如何优化RPC性能?" "HBase的未来发展有哪些新特性?"
客服
商务合作
小程序
服务号
折叠