当前位置:首页 > 报告详情

浪潮&腾讯:2021年TIFDS数据中心服务器智能故障诊断系统白皮书(16页).pdf

上传人: 是*** 编号:63854 2021-12-02 16页 4.47MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯云与浪潮联合开发的TIFDS(Tencent&Inspur Fault Diagnosis System)故障诊断系统。TIFDS系统通过实时监控服务器的电压、电流、温度等传感器信息,结合AI技术对服务器运营数据进行分析,实现了对CPU、内存、硬盘、PCIe等设备的自动化预警,将服务器故障诊断自动明确化率提升至95%以上。 TIFDS系统可以覆盖由于IERR(Internal Error)和非IERR造成的系统宕机故障,并精准地定位出故障部件,如CPU、内存、主板、PCIe外插卡、存储等设备。服务器运行过程中一旦发生异常,TIFDS系统会立刻响应并准确诊断出故障的部件,将故障问题原因、故障部件具体位置、部件型号信息、维修建议等信息及时上报至运维管理系统。 此外,TIFDS系统还实现了故障预警与隔离,通过专家规则分析,找到第一个故障触发源,结合历史数据进行时间序列分析,实现智能回溯,建立案例库,测试标准以及自动化测试方法,减少人为判断,提高测试效率,保证固件发布质量。 TIFDS系统与腾讯云运维监控系统完美适配,保障了资产系统、备件系统以及故障处理系统自动关联,从而实现真正的硬件故障自动监控处理。 总的来说,TIFDS系统通过智能化故障诊断,提高了服务器故障预警能力、故障诊断明确率以及停机维护效率,减少了非计划停机时间,提升了服务器全生命周期的健壮的RAS特性(可靠性、可用性及可维护性)。
腾讯云TIFDS系统如何实现服务器故障诊断自动化? TIFDS系统如何提高服务器故障诊断准确率? 腾讯云与浪潮如何合作提升数据中心运维效率?
客服
商务合作
小程序
服务号
折叠