当前位置:首页 > 报告详情

第四章 大数据实时流处理场景化解决方案.pdf

上传人: li 编号:29757 2021-02-07 103页 2.45MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了大数据实时流处理场景化解决方案,包括实时处理技术框架介绍和大数据实时流处理项目实战。 实时处理技术框架包括Flume、Kafka、Flink、Structured Streaming和Redis。Flume是一个分布式、高可靠和高可用的海量日志采集、聚合与传输的系统。Kafka是一个高吞吐、分布式、基于发布订阅的消息系统。Flink是一个批处理和流处理结合的统一计算框架。Structured Streaming是构建在Spark SQL引擎上的流式数据处理引擎。Redis是一个高性能key-value内存数据库。 大数据实时流处理项目实战以某电商平台为例,需要对交易订单数据中的交易金额进行统计,在大屏上实时展示总金额,并且每10分钟统计一次Top10商品名单及销售额。该项目使用Flink进行总销售额以及销售额门店排行展示的实时处理,使用Structured Streaming完成Top10商品名单的统计。
实时流处理技术如何实现? Flink和Structured Streaming在实时流处理中的应用场景有哪些? 如何使用Redis实现实时流数据的存储和查询?
客服
商务合作
小程序
服务号
折叠