当前位置:首页 > 报告详情

2019年流式数据处理在百度数据工厂应用与实践.pdf

上传人: 云闲 编号:97495 2021-01-01 33页 2.05MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
百度数据工厂是一个大数据分析的一站式处理平台,支持流式数据处理。该平台经历了从Hive到Spark的演变,提供了统一元数据管理、统一计算资源调度和多种作业提交方式等功能。流式数据处理在百度数据工厂的应用包括Spark流式SQL问题处理、流式数据处理实践以及实时转离线和实时流直接对接大屏等问题。百度数据工厂的实践案例主要集中在广告物料分析,通过实时流转数仓、流式SQL提交页面和Streaming实时监控页面等方法,实现了广告的pv、uv、点击率和转化率的实时统计和展示。未来,百度数据工厂将继续优化流式数据处理能力,提供更强大的流式SQL引擎、丰富的流式运维和监控功能,以及实时监控更多数据的能力。
"百度数据工厂如何实现流式数据处理?" "流式数据处理在百度数据工厂的应用案例分享" "百度数据工厂实时转数仓方案的优势与实践"
客服
商务合作
小程序
服务号
折叠