当前位置:首页 > 报告详情

2019年搜狗EB级别大数据平台架构优化实践.pdf

上传人: 云闲 编号:97379 2021-01-01 36页 11.25MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
搜狗公司的大数据平台基于Apache Hadoop生态系统,为各类大数据应用提供一站式数据处理服务。面对每天数十亿数据增量和数以万计的数据计算流程,搜狗通过优化其Hadoop集群,实现了稳定高效的数据分析系统。关键点包括:1. 搜狗对HDFS架构进行了二级目录拆分,并提出了相应的解决方案。2. 引入了YARN集群间的弹性计算,解决了集群资源有限和不同任务优先级的问题。3. 使用了智能数据管理平台,实现了数据的生命周期管理,并对HDFS数据管理工具进行了优化。4. 采用了Observer模式,提升了读请求的处理能力和写吞吐量。5. 搜狗计划升级Hadoop至3.2版本,并继续推进机器学习平台、DockerContainerExceutor、CapacityScheduler等领域的发展。
"搜狗Hadoop如何实现弹性计算?" "搜狗大数据平台如何处理海量数据?" "搜狗Hadoop生态系统面临了哪些问题?"
客服
商务合作
小程序
服务号
折叠