1、周永强新东方数据库资深工程师新东方基于 OceanBase 跨云多活架构与 HTAP 实践探索新东方教育科技集团作为国内著名私立教育机构,业务涵盖素质教育、国际教育、成人教育、智慧教育、直播电商等多个板块;在报转退、优惠、商机等业务系统里 SQL 逻辑复杂多样。为了保障业务系统稳定性,我们需要有一套低延时、高性能、高可靠的数据库基础架构,以满足日益增长的业务需求。01 新东方商机系统数据架构演进与数据库选型02 基于 OB Cloud 多云异地容灾架构实践03 OceanBase 后续在新东方项目的落地实践Contents目录01新东方商机系统数据架构演进与数据库选型新东方商机系统数据架构演进
2、与数据库选型业务背景与数据架构商机业务系统是新东方核心业务系统之一,包含商机数据录入,商机跟进,客户商机转化,商机搜索,商机区域系统报表等业务功能.既有数据录入等高并发低延时的数据写入需求,也有商机报表等高并发的 AP 类复杂查询需求,是一个典型的HTAP 场景.为了满足业务需求,我们进行了二次架构演变。收益与痛点解决了部分低并发的 AP 混合查询场景,但对于高并发 TP 和高并发 AP 场景引擎查询时延无法满足业务需求。某分布式数据库行存行存行存SQLSQL列存数据同步SQL商机录入商机跟进商机搜索商机报表针对商机系统的架构演进 第二次架构演变基于上述痛点,第二次商机系统数据架构采用了TP
3、数据库+CDC+AP 数据库分离部署的 HTAP 架构,也就是两套数据库集群,一套做 TP,一套做AP。其中对于报表数据单独写入AP集群,将业务数据通过 CDC 实时同步至分析库进行关联查询。收益与痛点解决了高并发场景下的 AP 查询需求,但这种架构在业务系统库出现大事务或者大的 DDL 时必然出现大量同步延迟会出现下游分析数据异常等问题,并且成本提高了 60%。TP 数据库行存行存行存SQL列存CDC数据同步SQL商机报表商机录入商机跟进商机搜索SQLSQLAP 数据库数据同步延时降本增效 机器成本控制 运维成本控制 标题文本HTAP需求 高并发 TP 场景业务连续性 AP 场景业务查询时延
4、数据同步延时 大事务延时 DDL 延时OceanBase 数据架构与特性一栈式满足业务需求 自研一体化架构兼容经典模式,实现单机和分布式、TP 和 AP 的融合Oracle 兼容MySQL 兼容SQL 优化引擎并行执行引擎存储过程分布式存储分布式事务分布式调度同城三机房双机房主备两地三中心三地五中心物理部署专有云/混合云公有云/多云原生多租户架构HTAP 引擎(TP+AP)集中式/分布式一体化架构基于 Paxos+数据同步的灵活的容灾架构灵活的部署模式完全自主研发的数据库,才能做到核心替代的真正落地全量数据校验真正实现数据强一致(Paxos协议,RTO8s,RPO=0),数据不丢失,高可用,平
5、滑扩展。原生分布式自研一体化架构突破高性能和高可用,实现应用无限扩展和服务永远在线单机分布式一体化私有云,专有云,公有云,混合云.不绑定硬件,给予用户自主可控的资源选择.适合任何企业。通用数据库+混合云架构一份数据既能做事务处理又能实时分析,通过 HTAP 助力拓展更多可能。HTAP资源隔离按需使用,灵活管理,适合微服务架构和 SaaS 行业应用。多租户管理业务少量修改甚至不改即可迁移到OB,自动评估和迁移工具。MySQL平滑迁移基于 LSM-Tree 的高压缩引擎平衡了“性能”和“压缩”的瓶颈,有效降低存储成本 70%-90%。低存储成本全链路诊断,白黑屏全生命周期管理工具,开源生态体系全面
6、对接.易用性与生态体系单机房三副本OceanBase 与其他分布式数据库业务压测PK 社区版配置测试模式数据量OceanBasev4.2.016C32G RAID10SSD单条SQL并发查询300万其他分布式数据库v6.x.x16C32G RAID10SSD 单条SQL并发查询300万性能对比CPU表现其他分布式数据库CPU使用率CPU使用率OB其他分布式数据库OB78.6293.23178.17189.09OceanBase 与其他分布式数据库业务压测PK OceanBase 与其他分布式数据库业务压测PK 单条 SQL 查询对比(5000万)OceanBase 与其他分布式数据库业务压测P