当前位置:首页 > 报告详情

5-孙晓光-知乎 Flink 数据集成平台建设实践-LYS.pdf

上传人: li 编号:29285 2021-02-07 21页 1.47MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要分享了知乎在数据集成平台建设中的实践经验,从历史设计到转向Flink的历程,以及Flink在知乎业务场景中的应用。 历史设计部分,知乎面临着数据源多样化、高吞吐实时性、准确性等技术挑战,采用MapReduce、Hive等技术和Sqoop工具进行数据处理,但存在系统复杂、可复用性差、可管理性弱等问题。 在转向Flink的决策中,知乎面临社区不活跃、可扩展性弱、可管理性弱等问题。经过技术选型,知乎选择了Flink,因其功能强大、整合门槛高、资源池建设维护成本高等优势。 在Flink的应用实践中,知乎通过Flink SQL实现流式同步,优化了性能,同时引入了TiDB、Zetta、Redis等数据源,实现了低成本引入数据源和资源效率的提升。Flink在知乎的应用扩展到了实时数仓、在线机器学习、报表及ETL等多个场景。
"Flink如何优化数据集成?" "实时数仓如何助力业务决策?" "Flink在数据处理领域有哪些应用?"
客服
商务合作
小程序
服务号
折叠