当前位置:首页 > 报告详情

4-马浩_沐瞳出海实践业务分享之大数据成本优化_1_副本.pdf

上传人: 张** 编号:169072 2024-07-06 32页 3.90MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要分享了上海沐瞳科技在大数据运维方面的实践经验,特别是他们在AWS平台上进行大数据系统成本优化方案的探讨。文章指出,大数据存储面临的主要挑战包括如何提高计算资源利用率、对数据进行分层以降低整体数据成本,以及如何有效监控、管理、筛选存储数据以解决冗余问题。 核心数据和关键点如下: 1. **计算资源利用率提升**:文章提出通过离线计算的弹性伸缩,针对工作周期性进行优化。例如,将一定比例的常驻机器转化为弹性资源,仅在产生业务需求时对应拉起所需的计算资源,从而提高整体资源利用率。 2. **数据分层与成本优化**:为了降低数据上升带来的整体数据成本,文章建议使用S3存储层成本优化策略,对冷热数据进行分层。通过使用不同的S3存储类型(Standard、Standard-IA、Glacier),可以根据数据的实际访问情况有效降低存储成本。 3. **数据监控与管理**:文章提出使用S3 Inventory和S3访问日志分析来有效地监控Bucket的数据情况以及增量情况。S3 Inventory能提供关于S3的所有存储信息,而S3访问日志分析可以帮助识别数据的冷热,并实现自动化。 4. **自动化工具**:文章还提到了Class Analysis这个高级自动化工具,它能持续分析Object的访问情况,帮助用户决策将冷热数据存储到正确的存储类中,进而监控与决策何时对什么文件进行操作。 5. **存储策略优化实践**:沐瞳科技采取了三阶段的大数据存储策略优化实践,一阶段通过存储清单和日志分析删除存量数据,目标是优化存量存储30%;二阶段通过日志分析对历史低访问数据存储类进行优化,目标是成本优化20%;三阶段则是通过长期分析自动写入数据库表,实现自动化策略执行,以长期优化S3存储成本。
如何通过AWS优化大数据计算成本? 如何利用S3存储分层降低数据成本? 如何通过S3 Inventory和日志分析实现数据监控和管理?
客服
商务合作
小程序
服务号
折叠