当前位置:首页 > 报告详情

专场17.3-快狗打车实时数仓演进之路-杨铮.pdf

上传人: 2*** 编号:126938 2023-05-01 28页 1.11MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了快狗打车实时数仓的演进之路。在过去,快狗打车的开发流程和实时计算存在诸多问题,如开发成本高、业务复杂度高等。2019年,快狗打车开始上云,并逐步实现OneData和OneService。为了解决痛点,快狗打车采取了实时和离线相结合的方案,建设了分层模型,实现了数据的重复利用。 快狗打车采用了Flink进行数据处理,与Spark相比,Flink具有开发成本低、自动优化等优势。在数据处理过程中,快狗打车利用WAL算法和Chandy-Lamport算法进行容错。此外,快狗打车还对日志进行了统一规范和处理,通过预处理确保了离线和实时数据的Schema信息一致。 在开发模板方面,快狗打车实现了参数化配置,任务可以根据传入的离线日志表自动获取相关信息,并自动配置到实时任务中。通过内部核心程序,自动创建topic,并将初步清洗好的日志数据传入topic。 在存储系统方面,快狗打车主要使用Hologres作为主要存储系统,同时结合Ad HocBase和ES进行数据存储和加速查询。此外,快狗打车还采用了云原生数据库ADB,支持存算分离、动态扩展等特性。 在应用接口方面,快狗打车提供了HTTP接口,具有高灵活性和可扩展性。通过内部研发的接口管理平台,实现了从测试到上线的快速部署。同时,快狗打车还构建了慢查询监控和预警系统,实现了实时预警和离线预警。 总体来说,快狗打车通过实时数仓的演进,实现了业务的智能化和数据的统一管理,提高了开发效率和数据处理能力。
"快狗打车实时数仓如何演进?" "如何实现数据处理的高效与一致性?" "快狗打车如何通过数据实现智能预警?"
客服
商务合作
小程序
服务号
折叠