当前位置:首页 > 报告详情

11-4网易实时数仓实践与展望.pdf

上传人: li 编号:29719 2021-02-07 31页 31.72MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
网易数据科学中心的马进在分享中介绍了网易在实时数仓领域的实践和未来展望。实践方面,网易采用了自主研发的sloth平台,实现了一站式的实时计算开发和运维。该平台整合了数据中台,支持流计算,并基于Flink、Kudu等技术构建了实时数仓架构。马进强调了实时计算在网易的应用,如热词统计,通过Flink实现了毫秒到秒级的实时性,大幅提高了效率。 在规划与展望部分,马进提出了实时数仓的分级概念,根据实时性需求将数仓分为毫秒到秒级、分钟级到小时级和天级,分别采用不同的技术组合,如Flink + Kudu、Flink + Arctic等。他提出了流批一体的配套存储方案,将compaction从存储中抽离,以解决写放大问题和提升效能。马进还提到了实时数仓面临的挑战,如存储写放大、checkpoint瓶颈、随机IO等问题,并提出了相应的解决方案。 总结来说,网易通过sloth平台实践了一站式的实时计算开发和运维,并在实时数仓的建设上提出了创新的解决方案和分级架构,以平衡实时性与成本,提高数据处理的效率和稳定性。
网易实时数仓如何实现流批一体? Flink在实时数仓中的应用有哪些优势? 实时数仓如何解决写放大问题和存储计算分离的延迟问题?
客服
商务合作
小程序
服务号
折叠