《2020Flink峰会报告:5、付典 - PyFlink 核心技术剖析及应用-ZH.pdf》由会员分享,可在线阅读,更多相关《2020Flink峰会报告:5、付典 - PyFlink 核心技术剖析及应用-ZH.pdf(42页珍藏版)》请在三个皮匠报告上搜索。
1、PyFlink 核心技术剖析及应用 付典阿里巴巴阿里巴巴 ApacheApache FlinkFlink PMCPMC | | 阿里巴巴技术专家阿里巴巴技术专家 PyFlinkPyFlink 核心技术核心技术 #2 PyFlinkPyFlink 简介简介 #1 PyFlinkPyFlink 应用场景应用场景 #3 PyFlinkPyFlink 未来规划未来规划 #4 AboutAbout Me Me Flink CEP PyFlink Flink Committer Hadoop, HDFS, Hadoop Security, Sqoop Sqoop Committer Apache Comm
2、ons Committer Flink SQL 2017.52017.102019.42020.12013.62016.12016.3 2020.8 Flink PMC PyFlinkPyFlink 简介简介#1 PyFlinkPyFlink 项目的目标项目的目标 Why Why FlinkFlink https:/blogs.apache.org/foundati on/entry/apache-in-2019-by-the 纯流架构的流批统一 的计算引擎 2019年度Apache最 活跃的开源项目之一 经历了大量的大数据生 产环境的历练 Why PythonWhy Python https
3、:/ 使命愿景 Flink能力输出给Python用户 Python生态功能分布式化 Python生态 分布化 Flink能力 Python化 PyFlinkPyFlink 项目的目标项目的目标 PyFlinkPyFlink 项目的发展历程项目的发展历程 PythonTableAPI JavaUDF Flink 1.9 PythonUDF Python依赖管理 Flink 1.10 向量化Python UDF Python UDTF UDF metrics支持 Python ML pipeline API Cython优化支持 纯SQL 作业以及Java Table API作业中 使用Python UDF Flink 1.11 2019-4 启动 2020-22020-7 向量化UDAF 及普通Python UDAF支持 Python DataStream API Expression DS