当前位置:首页 > 报告详情

基于 DolphinScheduler 构建分布式大数据调度平台实践_代立冬.pdf

上传人: 你**** 编号:133701 2023-06-30 34页 3.86MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Apache DolphinScheduler,一个云原生、带有强大可视化界面的大数据工作流调度平台。DolphinScheduler具有高可靠性、高扩展性和丰富的使用场景,目前已有3000多家公司在生产环境中使用。它解决了大数据任务间的依赖和触发关系,支持多种任务类型,如Spark、Flink、Hive、MR、Python等,并支持自定义任务类型。DolphinScheduler的UI简单易用,支持多租户和权限管理。此外,它还支持任务失败策略、通知策略和优先级设定等。在架构设计方面,新版本的Master端采用了分片机制和线程模型重构,大幅提高了吞吐量和性能。DolphinScheduler还与OceanBase数据库进行了集成,利用了OceanBase的高可用性、低成本和高扩展性等特点。未来的Roadmap中,DolphinScheduler将支持更多的功能,如SeaTunnel Zeta引擎、动态任务插件、K8S Operator等。
"DolphinScheduler如何实现大数据任务调度的高可用性?" "OceanBase作为数据源如何优化DolphinScheduler的性能?" "DolphinScheduler的Roadmap有哪些值得期待的新功能?"
客服
商务合作
小程序
服务号
折叠