《5 腾讯音乐-StarRocks在腾讯音乐的大规模实践之路.pdf》由会员分享,可在线阅读,更多相关《5 腾讯音乐-StarRocks在腾讯音乐的大规模实践之路.pdf(15页珍藏版)》请在三个皮匠报告上搜索。
1、StarRocks在腾讯音乐的大规模实践之路曹凤龙腾讯音乐专家工程师,业务运维中心总监010204QQ音乐数据仓库的演进历程StarRocks的存算分离模式在TME的实践QQ音乐数据仓库的演进历程01多维度&多场景运营&监控冷热&时效精细化&组件化2018-062021-122023-072024-03调研适配全面升级数据仓库的演进史StarRocks的存算分离模式在TME的实践02场景一、监控多维查询场景一、监控多维查询查询维度多维度多,数据随机性强,随机性强,即实时查询场景二、访问链路拓扑查询场景二、访问链路拓扑查询数据时效性时效性高,并发高并发高,查询条件相对固化相互影响相互影响耗时不稳
2、耗时不稳FlinkOverlordsCoordinatorsZookeeperMysqlHDFSHistorical Nodes(Hot)Historical Nodes(Warm)Historical Nodes(Cold)Broker NodesQueryKafkaServerMiddleManagersMiddleManagersPeonPeonPeonKafkaDC应用场景与数据服务框架场景三、业务日志流水查询场景三、业务日志流水查询数据时间跨度长时间跨度长,维度多维度多,并发低组件多、维护复杂、排查慢页面查询为主、未开放自定义Historical 发生重启,恢复周期长数据份数多,成本
3、高维护数据集群的挑战FlinkOverlordsCoordinatorsZookeeperMysqlHDFSHistorical Nodes(Hot)Historical Nodes(Warm)Historical Nodes(Cold)Broker NodesQueryKafkaServerMiddleManagersMiddleManagersPeonPeonPeonKafkaDCFlinkKafkaServerKafkaDCCOSCNCNCNFEFEFEQuery组件少,维护简单,排查快支持自定义管理支持自动冷热分离、恢复周期短数据份数少,成本降50%+集群组件升级后的优势查询代理缓存F
4、ECOSMQ计算引擎转发服务MQMVETLCN指标数据链路数据可观测监控告警BI智能分析其他存储运营数据日志数据监控数据性能数据多维分析决策调度实时查询数据应用权限管理审计日志ETL任务 Routine LoadMV物化视图3873715负责数据同步、清洗等主要的数据摄入方式查询加速北京集群CatalogODSDWDDWS上海集群ODSDWDDWS公有云的数据集群基表基表masteridmasterip masterareaslaveidslaveipsalveareamasterbusinessidsalvebusinessidinterfaceidresultretval.successC
5、ountfailCountdelayFailSumdelaySuccessSumdelaylogicSum晚高峰每小时 2.8 亿条数据 masterareamasterbusinessidsalveareasalvebusinessidsuccessCountfailCountdelayFailSumdelaylogicSumMasteridslaveidinterfaceid successCountfailCountdelayFailSumdelaySuccessSumdelaylogicSum晚高峰68w/h条数据晚高峰148w/h条数据晚高峰270w/h条数据主被调视图主被调视图接口
6、视图接口视图返回码视图返回码视图Masteridslaveidretval successCountfailCountdelayFailSumdelaySuccessSumdelaylogicSum物物化化视视图图降降维维FlinkKafkaServerKafkaDCCOSCNCNCNFEFEFEQuery监控集群的调优存储桶打散表结构分区物化视图降维增CN提速监控表的Compaction物化视图查询优化SPPgRPCtRPC分钟流水秒级流水可观测替代Prometheus(TSDB)整合caller_service