《2018年主动监测在定位网络异常上的实践.pdf》由会员分享,可在线阅读,更多相关《2018年主动监测在定位网络异常上的实践.pdf(38页珍藏版)》请在三个皮匠报告上搜索。
1、主动监测在定位网络异常上的实践朱朝 2018.12 关于米路通关于米路通 从用户视角看问题从用户视角看问题 主动监测是什么主动监测是什么 具体实践具体实践 大网波动感知大网波动感知 CDNCDN效果评估效果评估 网络劫持监测网络劫持监测 目 录关于米路通米路通(https:/)来自内部需求 监测点覆盖440个地市 真实用户网络环境 关于米路通关于米路通 从用户视角看问题从用户视角看问题 主动监测是什么主动监测是什么 具体实践具体实践 大网波动感知大网波动感知 CDNCDN效果评估效果评估 网络劫持监测网络劫持监测 目 录 用户投诉反馈 用户选择沉默 服务不可用的严重问题 问题是通过用户发现 7
2、3%23%98%2%无法挽回 流失 沉默的用户从用户视角看问题用户 Web服务器 应用服务器 云服务 CDN Internet 设备 网络 目录关于米路通关于米路通 从用户视角看问题从用户视角看问题 主动监测是什么主动监测是什么 具体实践具体实践 大网波动感知大网波动感知 CDNCDN效果评估效果评估 网络劫持监测网络劫持监测 不同监测的特点技术点 技术点 主动监测 主动监测 被动监测 被动监测 用户类型 模拟用户 真实用户 样本量,样本偏差 采样,存在样本偏差 全样本/采样,样本偏差小或无 配置部署 灵活配置,无需部署 有部署工作量 性能影响 非侵入,无性能影响 侵入,轻微性能影响 网络性能
3、问题定位 支持 ping,traceroute,nslookup,抓包 无法精确定位网络问题 页面元素采集 可提供完整访问瀑布图,包括错误元素 出错的元素无法提供数据 样本分布 根据需要可以均衡采集 实际用户访问,有忙闲时 监测原理使用场景可用性监测 CDN评估 对比分析 云主机监测 压力测试 劫持监测 任务类型 全页面 文件 下载 Ping Trace route 直播 事务流程 私有协议 PC、手机、路由器、盒子 诊断依据 dig 点播 推流 MTR Header 源码 抓包 业务架构任务管理 数据报表 任务调度 节点管理 数据聚合 API接口 配置管理 调度管理 会员管理 数据收集 数据
4、传输 数据存储 数据监控 数据分析 账户系统 积分体系 调度日志 数据质量控制 支付体系 结算体系 节点管理 趋势 运营商 散点数据 汇总数据 任务配置 即时监测 任务配置 节点组配置 警报配置 账户管理 元素 主机 错误 PC数据采集 手机数据采集 监控报告 日志查看 运维监控 单点登录 客户端 采集 对账单 点次配置单 联系人 .目 录关于米路通关于米路通 从用户视角看问题从用户视角看问题 主动监测是什么主动监测是什么 具体实践具体实践 大网波动感知大网波动感知 CDNCDN效果评估效果评估 网络劫持监测网络劫持监测 什么是大网骨干网 北京大区 天津大区 上海、南京大区 杭州大区 广州大区
5、 成都大区 武汉大区 西安大区 北京 广州 陕西、新疆、甘肃、宁夏、青海 天津、河北、黑龙江、吉林、辽宁、山西、内蒙古 上海、江苏、安徽、山东 浙江、福建、江西 湖北、湖南、广西、海南、河南 四川、重庆、云南、贵州、西藏 当时的状态投诉 带宽图掉量 监控报警 访问日志 大网问题 自己问题 故障排查 问题分析 运营商 处理的思路服务故障 机房故障 ISP故障 区域故障 个体原因 任务 数据汇总:按运营商、地区、主机分布、时间粒度、错误类型 时间 指标 当时的数据通过查看分类汇总后的数据,可以推测出问题原因 当时的数据下钻后还可以看到详细信息,获取精确 的故障持续时间是11:46-12:23 数据
6、构成要素10000+任务 覆盖全国探针 分钟级频率 警报阈值 大网数据构成网络链路感知https:/ 实时判断区域间链路故障 扩展:故障诊断详情 异常关联分析 区域指数感知https:/ 实时判断区域网络故障 扩展:LDNS解析成功率 区分不同接入方式 更多地市数据 关于米路通关于米路通 从用户视角看问题从用户视角看问题 主动监测是什么主动监测是什么 具体实践具体实践 大网波动感知大网波动感知 CDNCDN效果评估效果评估 网络劫持监测网络劫持监测 目 录行业趋势云帆加速 白山云 同兴 快网 帝联 蓝汛 网宿 七牛