《作业帮-王俊星-百万级QPS常态化链路压测诊断平台.pdf》由会员分享,可在线阅读,更多相关《作业帮-王俊星-百万级QPS常态化链路压测诊断平台.pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、百万级QPS常态化链路压测诊断平台 王俊星 作业帮教育科技(北京)有限公司 产研中台组测试负责人 姓名 TITLE 近10年互联网从业经验 2018年初入职作业帮后,直播中台系统测试负责人 从0到1搭建了作业帮diff测试基础框架和全链路压测及问题诊断平台 请插入 您的照片 讲师简介 王俊星 8亿1.7亿5000万 摘要 双师角色成本低易维护可扩展稳定性 压测的痛点 每一步都提前精心准备 各方人员均到位 都在熬夜进行. 结果:啊.多么痛的领悟! 每一步都在预期内,为什么结果偏差如此之大? 问题回顾讨论 人力成本 场景化单一 数据构造 真实、安全、稳定 基于现状的反思 平台诞生 常态化场景配置化
2、安全诊断 平台架构 平台 - 客观数据展示页 压测:安全先行-服务与数据的隔离(研发、测试、运维共建) 压测标记 router 压测平台 正常请求 数据清洗 数据脱敏 日志服务 业务服务 集群 (程序识 别标签) 业务网关 基础服务隔离 DB DB MQ MQ 大型售卖活动实践 1、多场景链路压测+参数化2、梯度发压3、基于楼模型用户散列行为压测 hive 教学场景设定(基于私有协议) 日志服务 数据脱敏 按角色进行 行为序列化 . 主讲老师节点辅导老师节点 识别行为 触发动作 识别行为 触发动作 识别行为 触发动作 Student1Student2Student3 连 麦 对 话 . 激 励
3、 、 辅 导 . 学生行为注入 双师行为注入 学生行为随机性 课中互动的及时、稳定 老师角色的切换 行为数据、互动数据统计及时准确 私有协议:长连接、流媒体 保证教学质量,与学生体验 案例ROI分析 1、保证了售卖季各个集群服务正常稳定 2、课中角色转换、师生交互及时性、持续稳定性 3、基于安全、稳定做到了无人值守的压测,释放了人力投 1200+ 18000+ 灵活随机 90%+ 减少5000 人天+ 任务场景数目 压测次数压测时间 整体提效 过程中的沉淀 1、使用场景延伸 数据构造(衍生) 如课中预热数据、售卖预缓存,预热数据可能达数小时 持续压稳定性测试 即,在80%的性能压测下,持续并发1小时,部分场景持续压测24小时。 2、平台优化 基于稳定、安全发压思考 基于例行线上服务性能的验收思考 过程中的改进 基于2PC思想,优化发压。 基于内部系统联动,安全发压 基于用户使用场景的扩展进