《1-3 基于阿里云实时计算 Flink 构建现代化数据流.pdf》由会员分享,可在线阅读,更多相关《1-3 基于阿里云实时计算 Flink 构建现代化数据流.pdf(30页珍藏版)》请在三个皮匠报告上搜索。
1、基于阿里云实时计算Flink构建现代化数据流晟柏 阿里云计算 产品经理|01什么是数据流02现代数据流趋势03现代数据流特性总结04现代数据流最佳实践目录CONTENT|01什么是数据流数据流概述|数据流表面的含义指数据从输入到输出端的流动,在实践中也称为数据集成。是指一系列用来帮助企业使用、整合和利用各种数据的实践、工具和架构程序。除了整合不同系统的数据外,数据集成还可以确保数据干净、准确,优化其对业务的价值。|02现代数据流趋势数据引领发展|传统企业数据企业定位变革:数据成为一种产品|组织与数据关系变革数据民主化数据流正式化模型变革:复杂到简单|强耦合声明式低代码用户服务界面运行环境集成工
2、具数据控制流业务变革:ETL到ELT|对比项对比项ETLELT趋势分散化,指标与模型交给数据团队统一化,业务团队处理弹性需求中高存储成本中高实时要求低高转向数据转向业务转向模型关注数据本身价值分离复杂耦合架构重视数据服务企业工具正规化工具简单化工具稳定化改变数据分配方式明确数据责任分配实现数据共享重用总结:期待更好的数据流|03现代数据流特性总结|业务数据实时化Flink:从流开启的大数据计算框架Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。流式场景事件驱动应用流批分析数据管道&ETL正确性保证事件驱动应用流批分析数据管道&ETL分层API
3、SQL on Stream&Batch DataDataStream API&DataSet APIProcessFunction(Time&State)运维增强灵活部署高可用保存点大规模计算水平扩展架构支持超大状态增量检查点机制性能卓越水平扩展架构支持超大状态增量检查点机制|大数据技术整体发展实时化趋势Apache Flink已成为实时计算标准阿里巴巴Apache Flink社区驱动者阿里巴巴Flink云上企业版一站式实时计算解决方案实时ETL实时推荐实时数仓实时风控实时监控实时IoT分析短视频本地生活新金融在线教育300万+代码Meetup/FFACommitter/PMC开源社区Apac
4、he FlinkVervericaApache KafkaConfluentApache SparkDatabricks社交媒体新制造Apache Flink 实时计算事实标准|阿里云的解决方案StreamSQL更加面向数据分析领域,分析师无需学习即可完成业务代码StreamSQL屏蔽底层复杂的一致性细节,提供Exactly-once的处理语义StreamSQL编译器内置优化算法,入门用户即可写出高效的流式处理逻辑StreamSQL集成大量函数、算子,用户无需底层编码即可实现日常业务StreamSQL开放UDF接口,特殊领域逻辑使用插件即可完成业务定制化该业务使用该业务使用StreamSQL来
5、表示来表示:SELECT count(*)FROM wordsGROUP BY word WITH WINDOW(2,3)SQL化|内置SQL函数,鼠标悬停提示 SQL语法校验,完善的错误提示 SQL作业版本管理、不同版本的对比 SQL Web-IDE 可视化编辑器 SQL DDL 声明Schema UDF 上传、管理 支持内置/外部Catalog管理表信息 支持文件夹和编辑锁一分钟上手IDE简单易用的SQL开发体验|企业级Connector,ETL的关键能力Connector,产品的关键价值之一 涵盖阿里云产品/开源社区40+主流引擎,远多于开源 在存储,调度、网络传输等方面,都调试到最佳效
6、果,正确性和性能有保障 Metric指标丰富,并提供监控、告警能力,开源基本不具备 支持模拟数据生成Connector(行数、速率、格式,范围等),更便捷地生成贴近业务含义的测试数据,满足您开发测试中验证业务逻辑的需要 具备完善文档说明,with参数详细说明和代码实例 业界领先的能力,快速推出新场景的connector,connector版本可以独立更新 支持创建自定义connector|SQL代码模板,场景化代码示例 提供了21种代码模板,每种代码模板都为您提供了具体的使用场景、代码示例和使用指导。通过代码模板快速地了解Flink产品功能和相关语法,实现自己的业务逻辑解决最常见的问题:Fli