《EDCC:2024数字化业务安全生产应用案例汇编(55页).pdf》由会员分享,可在线阅读,更多相关《EDCC:2024数字化业务安全生产应用案例汇编(55页).pdf(55页珍藏版)》请在三个皮匠报告上搜索。
1、2024年9月数字化业务安全生产数字化业务安全生产应用案例汇编2024PREFACE前言自从2021年首次提出“建设新一代智能运维体系”以来,我国多次发布相关政策,高度重视企业智能运维转型,强化数字技术在事故应对中的运用。2023年1月,工业和信息化部等十六部门联合印发的 关于促进数据安全产业发展的指导意见 中提出“推进规划咨询与建设运维服务”。金融、证券、能源等行业先后发布了各自行业的“数字化转型的指导意见”、“三年提升计划”或“数字化智能化发展的若干建议”,提出了建立对信息科技资源全方位覆盖的统一监控平台;夯实系统运行保障能力;提高储能与供能、用能系统协同调控及诊断运维智能化水平。2023
2、年12月,国家市场监督管理总局、国家标准化管理委员会发布的 信息安全技术网络安全应急能力评估准则“规定了网络安全应急能力要求,给出了相应评估流程。近年来,AI大模型凭借其复杂推理能力,在运维、应急等场景保障各行业企业数智化转型,减少运维流程对人员的依赖,实现故障的快速发现、精准定位、及时恢复,对故障处置“事前+事中+事后”全流程闭环管理,推动生产提效,辅助精准决策,助力运维服务改进与创新,保障业务连续性、安全性、稳定性。为积极响应政策号召,中国信息通信研究院联合政、产、学、研、用多方力量,搭建企业数字化发展共建共享平台,凝聚产业共识,整合优质资源,开展技术研究,完善标准体系,搭建合作桥梁,引领
3、各行业数字化转型发展为目标,聚焦政府支撑、技术研究、标准制定、适配测试、实践推广的主要工作内容,联合众多行业龙头企业研制 企业数字化转型成熟度模型IOMM 标准体系,提出适合落地的数字化转型方法论;联合平台内各方力量,丰富健全面向赋能者的 数字化可信服务能力要求 系列标准和评估体系;联合多家企事业单位共同编制数字化生态兼容性要求,并依据要求开展评估测试工作,通过下设的企业IT数字化成熟度委员会、数字化可信服务委员会、数字化生态适配中心、低代码无代码推进中心、业务中台推进中心、数字化业务安全生产推进中心和企业架构(EA)推进中心持续引领企业数字化发展方向,在企业数字化转型发展方面发挥了重要的支撑
4、作用。数字化业务安全生产推进中心积极响应市场需求,以规范数字化业务安全生产产品的能力水平,深入研究智慧运维、信息技术应用创新运维、应急管理、AI技术融合应用等标准和企业选建相关产品的方式方法,推动企业运维组织人员、流程规范、工具、平台、数据、智能等要素融合管理与应用,促进技术与业务的融合,输出数字化业务安全生产在不同场景下的实践路线及解决方案为主要工作内容,联合各行业企业力量,汇聚业界共识,开展技术研究、标准制定、评估测试、落地推广等相关工作,驱动数字化业务安全生产发展,充分赋能企业数字化转型。本案例汇编精选各行业领域提供的数字化业务安全生产实践案例,重点从需求分析、方案介绍、特点描述、解决成
5、效等方面对案例进行详细介绍。感谢各界人士对本案例汇编的关注和支持,欢迎业界企业持续投稿,我们将共同探索数字化业务安全生产解决方案,提升业务连续性、安全性、稳定性,努力为数字化转型发展提供支撑。CONTENTS目录基于联邦可信AI的跨行业数据安全融合营销系统21242831IT云智能运营优化平台基于AI+的中间件智能运维管理平台建设与实践中国联通网络数字化系统可观测稳定性保障体系-集约化运营监控管理平台创新应用与规模实践重庆移动智慧监控指挥调度助力企业安全生产343740云南移动网管支撑高可用能力赋能企业安全生产BSS系统容灾案例43以场景驱动的数字化运维场景平台上海虹口区智能小虹464951金
6、融行业信创安全运营中心解决方案主题公园业务安全生产设备管理平台中海油信息系统智能运维项目010305华中公司应急指挥平台国家管网为数字化体系核心能力形成提供平台支撑和数据服务保障,打造“一屏观全域、一网管全库”坚强储库以评促优,构建SRE评测体系,促进中国移动运维数智化转型09中国铁塔全面可观测智维平台助力运维能力跃升护航IT系统安全生产071317数字化监控平台稳定性保障左移创新实践北京轨道交通经营管理数字底座智能运维技术的应用实践19网络安全态势感知通用技术要求在轨道交通经营管理云场景下的应用实践2024数字化业务安全生产应用案例汇编01中海油信息系统智能运维项目案例应用单位案例实施单位案
7、例应用领域中海油能源发展股份有限公司中海油能源发展股份有限公司能源行业需求分析案例介绍根据集团公司的工作部署,特别是习近平总书记关于国企改革发展和数字经济建设的重要论述,需要实现从传统管理模式向现代化、数字化、智能化的跨越,以建设具有中国特色的世界一流能源公司。基于此,海油发展智能运维体系仍面临如下的挑战和不足:本项目以能源行业中的信息系统智能运维为目标驱动,专注于IT运维服务的创新与优化。技术细分包括智能化监控、CMDB配置管理、自动化巡检、事件与问题管理、安全防护等。应用场景覆盖集团总部至分子公司的IT基础设施运维,服务于跨地域、跨业务线的信息系统。案例的主要方案是依托于集中化的IT运维服
8、务平台,构建智能运维项目的整体价值体系,同时,优化组织架构,建立多领域人才发展和培训体系,驱动数字技术中心智能运维以体系化、数字化、规模化的服务运作,实现数字化转型过程中的降本、增质、提效、增收。通过这一系列的思路和措施,海油发展旨在实现数字化转型的总体目标,提升企业核心竞争力,确保在能源行业的领先地位。方案整体描述依托于海油发展数字化转型发展要求,结合TOGAF、ITIL、COBIT、ISO20000、ITSS等业界标准,进行现状及需求梳理。方案设计工作中以数字化转型、智能运维、信创覆盖等相关政策及降本、提质、增效、客户体验等战略要求为指引,充分考虑客户对应用系统安全性、稳定性、可用性、响应
9、处理及时性、服务人员素质高等核心诉求,梳理四大服务类问题、组织保障类问题、流程服务类问题、平台工具类问题、内部协作类问题、生态合作类问题等六大类运维现状问题及差距,对标石化盈科、昆仑数智、工银科技、股份银行、三大运营商、互联网企业等业界领先企业智能运维建设理念,提供覆盖组织体系、服务体系、工具体系的整体解决方案设计,技术架构如下:技术架构及设计思路智能运维体系构建的挑战01智能化运维的短板02数据服务与运营服务的不足03运维服务视角的挑战04深化开发视角的需求05合作伙伴管理视角的挑战06内部人员赋能视角的需求07短期目标完成IT运维服务体系建设,包括组织体系、服务体系、工具体系的初步构建和实
10、施。中期目标实现IT运维服务体系的升级,补全研发效能体系、客户体验体系、项目管理体系、知识管理体系的建设。长期目标到2035年,基本建成具有中国特色的世界一流能源服务公司,实现全面数字化转型和智能化运维。123方案覆盖了从组织、服务、工具层面的多个方面,适用于需要进行数字化转型和提升运维管理水平的各种场景,包括组织架构优化场景、IT服务体系建设场景、应用智能化运维场景、资产全景视图场景等。本案例根据国家和能源行业1534”发展思路的战略部署,系统化地为推进企业的数字化转型提出了产品服务方案,包括技术层面的升级、管理模式和组织文化的变革。通过数字化转型帮助海油信科实现从传统管理模式向现代化、数字
11、化、智能化的跨越。本案例通过智能化运维科研课题,展示了利用AI和大数据等先进技术来提升运维服务的能力。智能场景依托于运维全域数据与AI智能手段,聚焦质量保障、效率提升、成本管理三大方向运维场景,4个研究课题与海油发展运维场景结合,通过实际运维数据训练算法模型,落地应用智能化运维场景。应用场景本案例通过组织、服务优化及智能运维平台的实施,增强了系统的稳定性和可靠性确保了服务方案的标准化和高效率交付,同时,自动化的数据采集和管理流程提高了数据的准确性和实时性,为决策提供了有力支持。此外,通过专业培训与人才培养,核心人员全员获得ITIL国际资格认证,确保了服务的专业性和可靠性,最后,强化的网络安全措
12、施和数据保护机制,确保了服务的安全性和合规性,降低了运营风险。目前已通过智能运维显著提升了运维效率。借助统一告警管理和故障影响分析定位功能,进一步降低了故障响应时间和系统恢复时间,减少了潜在的业务损失;利用智能化工具和自动化流程确保了快速响应和处理运维事件,减少了人为干预,提高了服务的响应速度和质量,增强用户体验;基于智能平台,降低了公司内部创新门槛,缩短了创新周期,加快了创新速度,降低了企业运维成本。综合来看,本案例通过技术创新和服务优化,全面提升了企业的服务质量,不仅增强了客户信任和满意度,还为企业在激烈的市场竞争中建立了强有力的质量优势,助力海油信科实现可持续发展,为未来的业务增长和市场
13、扩展奠定了坚实的基础。方案成效方案特点描述构建了一体化运维平台,整合了现有的运维工具和平台,实现了资源纳管、配置管理、监控告警和自动化巡检等关键场景。设计了包括展示层、能力层、纳管层和平台层的多层IT架构,以支持智能运维服务的高效运作。明确了数字技术中心提供的IT运维服务地图,包括端到端全景服务和SaaS服务体验。通过业务架构设计,实现了服务流程的标准化和自动化,提升了服务质量和效率。利用AI技术,开展了智能化运维科研课题,探索应用健康度量、运维服务度量等场景,提升运维服务的智能化水平。1-主体IT架构:2-业务架构:3-智能化能力:实用性特点创新性特点中海油信息系统智能运维项目建设蓝图020
14、32024数字化业务安全生产应用案例汇编华中公司应急指挥平台案例应用单位案例实施单位案例应用领域国家石油天然气管网集团有限公司华中分公司国家石油天然气管网集团有限公司华中分公司能源行业需求分析全国先后发生天津港“812”瑞海公司危险品仓库火灾爆炸事故、江苏盐城“321”、大连“716”、青岛“1122”等事故,对危险化学品企业应急管理提出了严峻考验。2019年5月全国应急管理科技和信息化工作会议要求贯彻落实“推进应急管理科技信息化工作跨越式发展”的重要指示精神;2019年12月应急管理部印发危险化学品企业生产安全事故应急准备指南的通知,要求危险化学品企业建立安全生产风险监测预警系统和应急指挥“
15、一张图”,开展信息化条件下的应急演练。基于以上要求,华中公司研发建设了应急指挥平台。通过调查研究,华中公司之前的应急管理存在以下几方面问题:1.没有整合感知手段,不能第一时间预报预警。报警信息不统一,SCADA工艺、火灾报警等分散在不同信息系统,分散割裂,不便于统筹管理、实施快速高效应急响应,没有建立一个从感知预警到核实研判到指挥调度闭环的系统。2.无法第一时间掌握现场情况,缺少第一时间定位事件位置与周边监控和人员,无法快速核实事态及周边风险。3.没有整合通讯终端、实现快速调度,缺少能整合各部门通信终端的系统,多手段进行音视频资源的快速调度。4.无法精准调用应急力量和装备,难以第一时间定位应急
16、救援队伍及装备信息,缺少数据的统筹管理和数据空间化调用。为解决以上问题,需要建设华中公司应急指挥平台。案例介绍描述为应对上述需求、挑战及痛点等,华中公司成立了“应急指挥平台建设工作专班”,2023年1-12月完成基础功能开发、基础版本部署、深化设计、上线试运行等。2023年12月正式上线试运行。2024年1-6月期间对功能进行了完善与优化。方案整体描述华中公司应急指挥平台通过事前感知预警汇聚、事发快速应急响应、事中精准指挥调度、事后救援过程全记录及多维度事件复盘,实现监测预警、事件上报、核实研判、报警转事件、可视化指挥调度等功能。技术架构及设计思路该产品适用于油气长输管道企业,在数据层面具有接
17、入和扩展的开放性,在辅助决策层面也可融入更多计算模型。通过信息化的模拟演练,可以促进提升数据的准确性和完整性,模型计算的准确性,为“战时”状态应急处置提供有效支撑。通过与身份认证集成,在网络安全和数据安全方面遵从网络安全制程要求,安全性可以得到保障。应用场景1.依托大数据平台,实现工艺报警和火灾报警数据的对接2.可视化综合值守包括监测预警、应急值守、应急预案和视频调度3.实现工艺和火灾报警的可视化,实现了报警的集中监控、信息共享4.可对资源图层的高后果区、管线、场站、地下管道等信息进行查看5.通过应急值守可对值班人员进行实时通信及值班任务跟踪6.通过通信录可对组织架构内成员进行音视频通话以及会
18、议会商7.针对高后果区绑定了“一区一案”,以及突发事件的专项应急预案8.通过视频调度可对站点监控画面进行实时调阅查看,以便于实时观察现场环境9.可视化综合值守可根据某一报警时间进行场景下钻10.可将一个具体事件的信息和业务进行针对性研判和处理方案特点描述0411.针对座机、单兵、对讲机可发起音视频会议12.专项处置模式下,系统支持基于事件位置在GIS一张图上进行资源与风险分析13.可快速获取半径圈内人员清单,并通过消息及时通知撤离14.同时可调阅事件周边监控实时跟进现场情况15.可一键启用事件关联的专项结构化应急预案分级响应及时控制事件进一步扩大16.系统可实时接收现场人员反馈回的图像、视频、
19、文字等信息17.指挥中心可通过任务模板对现场单兵人员一键派发任务18.针对指挥中心下发的不同任务,app端可进行实时反馈,反馈的内容可实时展示在事件处置记录中留存19.除了报警转事件,系统还支持移动端上报和值班座机上报20.同时还支持基于操作系统的应急实战演练的创建和定时触发21.业务数据管理模块可实现事件查询统计、过程复盘、空间数据管理及值班排班管理,支持导出事件初报、续报及终报22.编制查看应急预案、演练计划和过程复盘等功能23.支持融合通信业务能力在应急指挥系统的调用提高应急响应速度和效率:实现信息的实时共享和快速传递,减少应急事件的影响和损失。提高应急决策的准确性和科学性:提供全面、准
20、确、实时的信息,帮助应急指挥人员做出更加科学、准确的决策,提高应对应急事件的能力和水平。降低应急事件损失:通过快速、准确的信息共享和融合通信调度能力,能及时采取措施,有效控制应急事件的发展,降低损失。提高应急管理水平:促进应急管理制度的完善和优化,提高了应急管理水平,增强了应急管理的能力和效率。增强企业信心和稳定:应急指挥系统可以提高应对应急事件的能力,增强企业的信心和稳定,保障了国家、企业和人民的生命财产安全。推动信息化发展:应急指挥系统的建设促进了企业信息化技术的应用和发展,推动了信息化水平,为衔接未来应急管理的现代化提供了基础。解决成效华中公司应急指挥平台实践图052024数字化业务安全
21、生产应用案例汇编国家管网为数字化体系核心能力形成提供平台支撑和数据服务保障打造“一屏观全域、一网管全库”坚强储库案例应用单位案例实施单位案例应用领域国家管网集团储能技术有限公司国家管网集团储能技术有限公司能源行业需求分析为保证储气库的高效安全运行,需要对储气库的气藏特性进行深入研究,便于更准确地评估储气库的储气能力和调峰潜力、以及安全注采边界。该项研究工作需要基于对气藏的精细建模。气藏地质建模需要收集和分析大量的数据以确保模型的准确性和可靠性。包括单井资料、测井资料、地震资料、实验室资料、历史生产数据。通过井壁取心可了解地下岩石类型、结构、古生物、沉积环境、岩石矿物、孔隙类型、孔隙结构及物性特
22、征等;通过测井资料了解气藏的岩性、物性等数据;通过地震资料了解地层、断层、构造等的空间分布和形态;通过实验室可进行岩石的物性分析,如孔隙度、渗透率、油气水饱和度、毛细管压力曲线等;通过建库前气井的历史生产数据,可进行历史拟合。文 23 储气库 2019 年 7 月建成投产,当时交付的历史资料包括建库前 40 年的井史文件、生产运行文件等,现以 PDF 格式保存,不利于数据的使用。需要对相关资料进行恢复处理。储气库建库至今,一二期设计、施工、竣工资料都是以 PDF 格式保存,需要对其进行数字化处理,提取相关数据入库。从日常业务角度分析,储气库主要任务是注采气,从单井动态的注采气能力分析角度看,要
23、满足该业务的日常数据消费需求仍面临不少困难。案例介绍根据国家管网十四五信息化规划,基于“平台+数据+应用”信息化建设模式,在数字化治理和网络安全两大体系保障下,围绕数字平台建设和运营,连接 物联管网,支撑一体化全融合应用,逐步营造能源生态,对内赋能,对外增值,发展能源平台经济,促进数字化转型。进行 7 个方面的信息化规划部署。其中数字化治理体系,数据治理建设方面要求借鉴相关行业的最佳实践,充分利用已有数据标准成果,按照远近结合策略,遵循数据治理原则,分层次、分阶段开展 数据治理,对历史数据采用新标准进行整改,对增量数据按新的数据标准管理。以文23储气库工程建设数字化交付成果为基础,构建了地质、
24、井筒、地面设施三位一体的信息化支持平台,实现站场生产运维管理“集中监视、集中远控、联合巡检、预防维修、无人操作、有人应急“的目标,打造数智化坚强储库。方案整体描述结合文 23 储气库智能化建设需要,按照平台+数据+应用的建设理念,系统采用分层架构体系,构建统一的数据服务、业务服务,支撑文 23 储气库各类应用应用的灵活、敏捷构建,实现打造数智化坚强储库的建设目标。系统将基于管网云平台提供的基础设施资源,在各层级提供数据采集、数据集成、数据存储和业务支撑服务;在业务应用层,系统逐步实智能生产运行、智能安全管理和综合管理,系统用户可以通过浏览器访问系统。技术架构及设计思路基础设施层:基于管网云平台
25、提供的基础设施资源。包括计算资源、网络资源、存储资源、安全资源以及其他资源。数据采集层:整合各类业务数据,为文 23 储气库智能化应用提供数据支撑,并建立数据装载、数据清洗、数据转换、数据抽取、数据汇聚等一系列步骤,实现数据的统一集成。数据存储层:考虑到文 23 储气库智能化建设过程中,涉及不同专业、不同类型、不同颗粒度的数据资源,因此在数据存储过程中,结合数据特点、应用需求,采用分区存储的方式。业务支撑层:基于统一数据资源,提供包括算法模型、应用模型、专业模型、预算模型等各类模型服务,以及在线计算、离线计算以及内算计算等计算服务。业务应用层:为用户提供智能化注采以及数字孪生体应用,包括业务逻
26、辑实现、用户界面展示、数据交互与处理、业务流程管理等功能。06基于储气库建库前数据、一期、二期生产数据的恢复、拉通整合,以及地质气藏数字孪生模型建设等成果,开展储气库气藏相关应用探索,一方面通过数据应用更好地检验数据恢复成果,为现场气藏管理提供便捷分析工具;另一方面通过数据应用为下一步储气库智能化向更高层级推进提供基础技术分析支撑。本项目计划利用历史数据恢复成果开展三方面的应用探索,智能气藏监测建设、智能注采方案建设以及动态模拟与模型训练。应用场景依托统建、自建系统及物联网等采集的实体数据、动静态数据,建立储气库数字模型、物理实体和管理流程相互映射的一体化孪生模型,优化储气库建设、生产和安全管
27、控过程。以地上地下一体化数字孪生体为核心,以安全管控、智能建设、智能生产为三条主线,以数据资产为依托,集成大数据分析、人工智能算法、大模型等新技术,打造“全方位感知、综合性预判、一体化管控、自适应优化”为特征的智慧储气库,实现每年约300万元的增量营业收入,带来新的商业模式,为文23储气库提升决策效率。方案特点描述基于文 23 储气库现有基础,通过坚持一体谋划,为实现打造“三位一体”数智化坚强储库,实现站场生产运维管理“集中监视、集中远控、联合巡检、预防维修、无人操作、有人应急“的远景,本项目主要目标包括。实现地下、井筒、地面相关的全生命周期历史数据建设采集。实现科学化动态气藏管理、安全风险管
28、控,安全高效智能注采管理。为高层提供决策支撑、为中层提供管理手段、为基层提供执行依据、为市场提供需求分析。解决成效国家管网为数字化体系核心能力形成提供平台支撑和数据服务保障打造“一屏观全域、一网管全库”坚强储库业务流程图072024数字化业务安全生产应用案例汇编中国铁塔全面可观测智维平台助力运维能力跃升护航IT系统安全生产案例应用单位案例实施单位案例应用领域中国铁塔股份有限公司中国铁塔股份有限公司通信行业需求分析随着中国铁塔数字化转型的深入,对IT建设也提出新的挑战。基于以上IT建设需求及挑战,亟需进行中国铁塔智能IT运维建设,实现业务、应用、平台运维的全面贯穿,形成对业务系统的多维度评价,推
29、进业务系统优化,深化数字化转型,实现最大化运维价值。IT的平台化支撑能力与业务的快速建设发展要求出现矛盾01IT技术与业务生产环节的融合应用程度不够02现有IT系统安全生产需求呈现出多样化的趋势03业务的快速发展,尤其是两翼业务的个性化发展,业务模式更加灵活,业务创新更加快速,要求IT具备规模化平台化支撑能力,能够快速响应业务需求。技术和数据等要素价值有待进一步挖掘,尤其是生产环境基础资源数据标准化管理和规范化运营能力亟待增强。运维智能化、业务运维数字化以及业务端到端可观测等需求,对整体IT集约化管理带来挑战,要实现全面的系统安全生产运营保障,仍存在差距。案例介绍基于中国铁塔“十四五”数字化转
30、型的要求,确定IT建设的指导思想为:以推动高质量发展为主题,牢牢把握建设数字化企业的目标要求,加快推进铁塔数字化发展,有效提升IT核心能力。通过多项举措的稳步推进,全面建设数字化运维底座,实现“运维同行”,赋能数字化转型发展。IT 运维定位也需相应“跃升”至业务伙伴型的高度,这需要 IT 运维进行全面的转型,达到“运维同行”。方案整体描述结合铁塔当前运维工具现状,为了达成一体化智能运维的智能化运维目标,需要分阶段、分批次的稳步开展IT运维建设工作。为了实现一体化智能运维的愿景,具备以智能IT运维助力IT系统安全生产的能力,中国铁塔构建IT运维工具的总体目标架构,以实现更加全面的系统观测、更加快
31、速的故障定位、更加高效的运维管理、更加智能的态势感知。构建以CMDB为核心,以运维工单为贯穿,包括配置管理、基础监控、应用监控、日志监控、运维工单5大模块的智能化智维平台,实现一站式的全栈监控能力,配置管理能力、运维服务能力。平台分为公共组件部分和系统服务部分,所有系统组件均无单点部署;单独节点故障不会影响整个系统运行。系统服务采用微服务架构,统一注册到服务管控中心,当某个服务节点故障,会自动下线该服务,将请求转发到正常的服务中。技术架构及设计思路中国铁塔坚持整体规划、优先满足业务支撑的原则,采用“快步小跑、分步分阶段”的模式,通过健全完善基础设施平台能力、提升数智化运维能力,全面保障IT系统
32、安全生产。应用场景搭建平台化能力:以资源配置管理(CMDB)为核心,以运维工具(基础监控、应用监控、日志监控、自动化能力)为基础,以流程为驱动,打造综合网管监控平台。生产资源全量纳管:实现生产环境资源、性能、告警、配置的全量纳管覆盖和有效管控。端到端的业务可观测:以“一码到底”涉及的十个核心系统为试点,实现业务全流程、端到端服务指标的监控及呈现,形成端到端业务可观测能力。智慧运维支撑:初步实现故障发现、故障识别、故障诊断、指标异常检测等自动化、智能化场景。有效地支撑系统和服务的稳定运行,保障业务的可用性、连续性。08中国铁塔全面可观测智维平台助力运维能力跃升,护航IT系统安全生产业务架构图方案
33、特点描述中国铁塔智维平台,面向中国铁塔各类业务,提供了强有力的运维、运营支撑,全面助力中国铁塔IT生产系统安全运营,包括如下特点:面向业务的全量资源纳管:以业务系统的运维管理诉求为出发点,进行全量资源建模,资源模型覆盖业务系统运维工作的各个环节,全面涵盖业务系统、业务组织结构、业务系统人员、业务系统角色、业务模块、业务模块开发厂商、业务系统相关工单等业务维度资源对象;面向业务的全方位可观测:通过基础监控、业务应用性能监控、业务日志异常监测等手段,面向业务运维提供全维度的可观测能力,包括基础设施软硬件/云化资源运行状态的实时监控、应用调用端到端分析、代码级诊断分析、应用性能问题一键诊断分析、业务
34、流转耗时分析等;面向业务的智能化运维:面向业务系统提供异常检测、故障诊断等智能化能力,通过关键业务异常检测、全部1类/2类/3类业务系统故障自动诊断场景的逐步落地,辅助业务侧及时发现业务潜在隐患、提升故障定位效率;信创纳管及适配:实现IT网管全面支持国产软硬件资源监控,为IT国产化演进提供全面的监管支撑;IPV6双栈支持:具备IPV6设备的资源纳管、运行监控、网络流量分析能力,及时发现IPV6资源、网络潜在的问题;AI运维注智:在面向业务的运维场景中,通过AI技术手段,辅助业务隐患识别、业务故障识别及处置,为日常业务运维工作赋能;原子能力外放:通过IT网管在资源、性能、告警上的管理优势能力,向
35、第三方系统提供能力输出。解决业务系异常不能及时发现无法保障业务连续性的问题解决无法及时识别系统瓶颈无法保障系统稳定性的问题解决IT运维安全手段不足无法提供全方位安全保障的问题解决人工、资源投入大无法满足降本增效要求的问题解决可量化的IT数据不足缺少决策参考依据的问题解决成效092024数字化业务安全生产应用案例汇编以评促优,构建SRE评测体系,促进中国移动运维数智化转型案例应用单位案例实施单位案例应用领域中移信息技术有限公司 中国移动通信集团浙江有限公司中移信息技术有限公司 中国移动通信集团浙江有限公司通信行业需求分析案例介绍方案整体描述经过3年的持续迭代和打磨,SRE成熟度测评体系形成了“1
36、+3+4+1”框架。1个目标:以“保障业务连续性”为1个目标;3项原则:遵循SRE管理规范化、SRE能力标准化、SRE支撑数智化3项原则;4类能力支撑:基于SRE生命周期的运维实践,构建了以能力模型为基础的1个能力成熟度模型和6类场景成熟度模型、最佳实践以及评测组织4类能力支撑。1套推广服务:通过1套推广服务进行落地。大型组织的IT部门内传统研发团队和运维团队的工作目标通常是互相矛盾的,因此行业上提出了Devops概念进行文化变革破局,SRE是对Devops文化的具体实践;近些年应用架构云化微服务化架构演进的趋势极大地增加了运维难度,SRE运维研发化转型是必由之路;传统运维模式依赖人力、琐事繁
37、杂、技术含量低、运维人员获得感较差,SRE转型也是传统运维人员的积极主动选择。在SRE转型过程中所面临的挑战,主要表现五个方面:转型没有方法论、能力缺乏标准、转型过程缺少指南、转型效果无从评估。为了解决这些问题,中移信息技术有限公司充分调研国内外SRE建设经验,并结合运维域战略任务和实际情况,构建了一套完整的SRE成熟度等级测评体系。通过以评促改、以评促建,同时沉淀出全网共享的SRE最佳实践,优化模型,建立PDCA的SRE闭环支撑能力。10基于DevOps研发运维一体化、SRE生命周期管理思想,分为架构设计、入网控制以及运行治理三个主要阶段;对三个阶段主要能力进行识别、拆解、归类和映射,提炼出
38、SRE八大能力域。其中,能力分段有6大能力域,能力贯穿的有2大能力域;“SRE组织保障能力”为其他7大能力域提供组织保障。SRE能力模型:遵循管理驱动技术的原则,由八大能力域组成,能力域由能力项、能力子项构成;能力子项分别从SRE管理、SRE运维两个维度进行构建。SRE运维最佳实践是SRE能力模型中所有能力子项的最佳落地经验,可以用于SRE专家指导具体单位实践八大能力的参考。基于SRE能力模型中八大能力域的能力子项构成情况,SRE运维最佳实践分为管理篇和实践篇,分别由管理类能力子项和实践类能力子项的落地经验组成。另外,根据落地单位的运维现状和实际需求,SRE运维最佳实践也支持按需裁剪使用。通过
39、SRE场景领域成熟度,来评估SRE能力在日常运营工作场景的成效;六大主要SRE场景领域,支持单独或者按需组合进行参评,对场景成熟度进行认证。通过评测,推动各单位SRE整体能力提高,保障业务连续性持续提升。技术架构及设计思路11SRE成熟度等级测评体系是一套适用范围较广的指导SRE转型的解决方案,各大企业的IT团队在遇到以下几个问题场景时,均可使用参考该体系。由中移信息技术有限公司牵头制定评估计划、组建评估团队,按计划对参评单位实施评估,提供SRE成熟度评估报告。2022年,对信息技术中心7个部门20个核心系统进行了评测;2023年,这7个部门持续参与滚动评测外,对10省共计30个核心系统进行了
40、首次试点评估。信息技术中心7个部门:5个团队成熟度达到了L3稳健级,1个团队成熟度处于L2发展级,1个团队成熟度处于L1启始级;整体能力都有较大提升。10个试点省公司:2个省公司达到L5卓越级,3个省公司达到L4优秀级,2个省公司达到L3稳健级,1个省公司达到L2发展级,2个省公司为L1起始级。2024年持续对信息技术中心7个单位、31省公司、以及金科公司、在线公司等外部单位进行SRE成熟度评测工作。应用场景1、SRE转型应该从哪些方面着手:IT团队在实施SRE转型时,首先面对的问题就是SRE转型应该从哪些方面进行着手,基于此才能设计SRE演进的整体方案和工作计划。2、SRE组织架构和工作流程
41、如何设计:SRE团队的组织架构应该如何设计,角色职责如何设计,在实际工作中工作流程应该是怎样的,应该有哪些环节控制点。3、SRE应该重点建设哪些能力:SRE应该重点建设哪些能力支撑IT系统的连续性,这些能力应该实现哪些具体功能。4、SRE能力建设是否有标杆进行对标:SRE建设的这些能力有没有标杆案例参考,建设过程中如何避坑、少走弯路。5、SRE能力建设水平如何客观评价:SRE转型和能力建设的过程中,IT团队如何客观评价自身的SRE成熟度水平并在行业横向对比,找出短板、持续提升。SRE成熟度等级测评体系主要从三个方面协助IT团队解决上述场景问题。1、SRE能力成熟度评估:从组织保障、架构设计、入
42、网管控、发布变更、测试管理、运行治理、混沌演练和数智化运维八大能力域全方位客观评价IT团队的SRE成熟度水平及评分定级,并为IT团队的SRE转型方向、组织流程、能力建设落地等提供提升指引。2、SRE场景成熟度评估:SRE场景成熟度评估模型将SRE日常运营工作场景总结归类为六类关键场景领域,通过对具体关键场景领域的评测,推动IT团队提升该场景领域的运维能力,快速提升专项运维能力。3、SRE最佳实践:SRE最佳实践是SRE能力模型中所有能力子项的最佳落地经验总结,可以用于指导IT团队提升SRE运维能力,支持按需裁剪使用。方案特点描述行业内领先的SRE成熟度等级测评体系:SRE成熟度等级测评体系是行
43、业内领先的和较为完整的SRE成熟度等级解决方案,自2022年初构建起,已经过三年的试用和持续迭代,在近20家单位使用,包括了SRE能力成熟度评估模型、SRE场景成熟度评估模型和最佳实践集等。基于运维生命周期的SRE能力成熟度评估模型:基于DevOps研发运维一体化、SRE生命周期管理思想,分为架构设计、入网控制以及运行治理三个主要阶段;对三个阶段主要能力进行识别、拆解、归类和映射,提炼出SRE八大能力域,构建SRE能力成熟度评估模型。基于专业场景领域的SRE场景成熟度评估模型:将SRE日常运营工作场景总结归类为六类关键场景领域,通过对具体关键场景领域的评测,推动参评单位提升该场景领域的运维能力
44、,快速提升专项运维能力。SRE管理和运维能力最佳实践集:SRE管理和运维能力最佳实践是SRE能力模型中所有能力子项的最佳落地经验总结,可以用于指导参评单位提升SRE运维能力,支持按需裁剪使用。SRE成熟度等级测评体系在构建过程中,八大能力域共输出了10篇专利。解决成效12132024数字化业务安全生产应用案例汇编数字化监控平台稳定性保障左移创新实践案例应用单位案例实施单位案例应用领域中国联合网络通信有限公司软件研究院中国联合网络通信有限公司软件研究院政府、制造、教育、通信等行业领域需求分析案例介绍随着云原生技术的不断成熟,企业数字化转型也在不断加速,企业IT架构进入云原生时代,多云多集群部署已
45、经成为常态和趋势,几何增长的云资源、微服务以及复杂化的调用关系与业务场景,传统人肉运维难以为继,如何保障系统的全面稳定,保证业务流程的高效运转,安全生产工作面临一系列严峻挑战,主要有以下三项:Redis-sdk助力生产使用拦截:基于开源Redis-sdk(客户端代码开发依赖包)进行创新性升级改造,实现在编译阶段识别拦截使用高危命令及不符合安全管理要求的服务,将升级后的依赖包植入现有的微服务研发框架(脚手架),在代码开发阶段,减少隐患的引入概率,接入cBSS、智慧客服系统,推进组件使用的健康规范合理化,提升系统稳定性。数字化监控平台严把安全生产七道关,重点聚焦稳定性左移涉及三道关,上线关:构建系
46、统架构隐患预防能力,防火于根源;优化关:开创系统性能隐患线上化分析能力,防火于未然;应急关:打造系统自动化应急处置能力,灭火于初起。方案整体描述主要功能:健康模型线上化扫描:创新性的将运维人员对于容量评估经验沉淀为容量隐患评估模型,构建通用化的容量隐患扫描线上化能力,应用层基于微服务内存、堆内存、交换分区、TPS、MAJOR GC次数、响应时间8项指标打造应用层容量隐患扫描评估能力,在cBSS 系统进行5轮整改扫描,发现并治理1400+应用容量隐患问题;组件层完成3类组件Redis、Kafka、Hbase的容量隐患扫描评估能力,累计识别容量隐患问题并治理900+项,有效解决核心集群高水位运行以
47、及亚健康隐患。业务链路性能瓶颈隐患自动分析:创新性的将人工链路性能分析经验沉淀为以业务为入口的自动化性能瓶颈分析能力,共计在在线咨询系统、联通APP-cBSS开展30+条核心业务链路全链路压测,总计闭环治理20+性能瓶颈问题。123业务连续性的挑战01云原生的挑战02运维生态的挑战03中国联通随着系统集约及全面上云工作推进,全国性、区域性的系统故障也时有发生,造成企业经济损失的同时严重影响企业形象。由于系统架构复杂,在面对系统故障时,常常处于被动防御和紧急救火的状态,无法做到快速抢通、恢复业务,安全生产面临严峻挑战。随着云原生技术的发展,系统可观测性面临的挑战也随之增加,由于云原生环境的复杂性
48、和松耦合性,运维人员很难完全理解并掌控整个系统,并且由于各层级指标定义不标准、数据不互通,核心业务跨数据中心、跨云平台、跨系统调用复杂,这给运维工作带来了很大的困难。由于系统维护职责分工不同,且各个运维团队相互独立,造成了运维工具重复建设、运维工具功能不精不强、运维工具间能力割裂的问题。14架构图依托SRE稳定性指标的MTTR理论分批分层构建工具:在入网控制时即介入,对入网控制、发布上线、故障预防、故障发现、故障定位、故障恢复以及故障改进提供端到端工具覆盖,全流程工具闭环贯通。重点聚焦Pre-MTBF,故障事前将稳定性进行左移。端到端流控创新:开创性的将调用链探针进行升级改造,构建端到端QPS
49、、并发流控能力,牵头cBSS系统以及上、下游系统完成限流方案模型评估、制定限流策略,实现cBSS系统及上、下游系统服务批量限流及容量告警能力,顺利完成10余次促销活动专项重保,其中识别并治理系统内隐患7项。告警自愈及应急自动化:打造系统告警自愈及应急自动化能力,共计覆盖400+项自动化应急处置场景,结合oncall事件,全年有效预防98起事件升级为故障,预防占比88.28%。45技术架构及设计思路Redis-sdk助力生产使用拦截:聚焦系统痛点、历史故障为切入点,结合Redis的规约规范,确定实现一套与现有微服务框架适配的redis-sdk,助力核心系统在开发阶段拦截高危及不合规操作,以此减少
50、故障引入概率,用数字化手段提升系统稳定性。应用场景健康模型线上化扫描:聚焦持续交付部署、隐患治理、架构优化,制定容量、质量和稳定性规范规约,并通过线上手段进行检查落地,提升了工具化隐患排查闭环运营能力。已完成从隐患标准制定、扫描工具研发、整改举措落地的全流程闭环,有效提升服务的稳定性。15业务链路性能瓶颈隐患自动分析:通过自动化技术手段,针对复杂业务流程自动识别并预警潜在的性能瓶颈点,快速找出影响系统响应速度及稳定性的关键风险因素,降低人工介入门槛,助力团队更准确地掌握业务链路的真实状况,实现整个服务链路性能的持续改进与提升。端到端流控创新:开创性的将调用链探针进行升级改造,使之具备端到端、无
51、侵入的QPS、并发流控能力,结合全链路压测容量评估、全层级监控告警发现,实现监控、流控、压测一体化解决方案。告警自愈及应急自动化:基于自动化作业引擎,构建自动化应急预案与告警自愈两级应急处置能力,通过双终端触点提升故障抢通效率,引入AI智能算法实现异常自主修复,实现由人机交互向机机交互的演进。16方案特点描述1、创新实现Redis-SDK嵌入研发框架和CICD流程,Redis-SDK在cBSS系统累计识别高危命令100+服务,慢sql数量下降97%,空密码拦截59次,实现连接服务实例的秒级追溯,符合规范项占比提升29.68%,2023年全年redis的稳定性能够提升至99.999%,0事件、0
52、故障发生。2、开创性的沉淀应用服务、Redis、Kafka、Hbase的容量健康模型,累计在cBSS系统中发现并整改900+项容量隐患,有效解决核心集群高水位运行亚健康隐患。3、创新性的将人工链路性能分析经验沉淀为以业务为入口的自动化性能瓶颈分析能力,共计在在线咨询系统、联通APP-cBSS开展30+条核心业务链路全链路压测,总计闭环治理20+性能瓶颈问题。4、2023年开创性构建端到端QPS、并发流控能力,牵头cb以及上下游系统完成限流方案整体评估以及限流实施,实现cBSS及上、下游系统服务批量限流及容量告警能力,顺利完成10余次促销活动专项重保,其中识别系统内隐患7项。5、打造系统告警自愈
53、及应急自动化能力,共计覆盖400+项自动化应急处置场景,结合oncall事件,全年有效预防98起事件升级为故障,预防占比88.28%。解决成效Redis-sdk助力生产使用拦截:攻克开源的Redis-sdk(客户端代码开发依赖包)源码,有目的性的改良优化,开发轻量组件包,适配生产系统。健康模型线上化扫描:基于开源扫描组件SonarQube,通过全自研增强sonar-scanner扫描器能力,实现针对基础代码、熔断配置、组件配置、部署配置等相关标准落地定期输出明细清单,推动隐患问题整改,有效提升系统稳定性。业务链路性能瓶颈隐患自动分析:聚焦核心业务链路的自动化性能瓶颈分析,支持自动分析SQL、微
54、服务循环调用等19 种性能风险识别及近百万级压测数据分析,分钟级瓶颈点结果呈现。告警自愈及应急自动化:引入移动端应急处置能力,突破人员、地点、时间、操作难度限制,实现随时随地可执行、任意授权人员可执行、批量操作一键可执行。到端流控创新:有效评估业务链路各节点容量水位,落地流控策略,防火于未然。12345172024数字化业务安全生产应用案例汇编北京轨道交通经营管理数字底座智能运维技术的应用实践案例应用单位案例实施单位案例应用领域北京市基础设施投资有限公司北京市基础设施投资有限公司交通行业需求分析鉴于北京市基础设施投资有限公司(简称:京投公司)当前面临的复杂网络架构以及孤立的运维安全监控平台问题
55、,迫切需要构建一个灵活、高效且便捷的“掌上智能化综合运维安全监管平台”(简称“掌上运维平京投公司在信息基础设施建设过程当中使用了多种安全监管和运维监管工具。但这些平台各自独立运行,导致信息孤岛现象严重,运维效率低下,无法及时响应安全事件,这不仅增加了运维成本,也对业务连续性和数据安全构成了潜在威胁。当前人工智能技术的发展和应用,正逐渐改变着诸多领域的工作模式。因此,京投公司也在结合行业经验的同时,探索使用AI技术+大数据+自主研发的模式,通过整合各平台运维数据、利用人工智能模型学习和分析运维数据,发现潜在的问题和风险威胁,从而提前采取措施进行预防和修复。同时,AI还可以自动化执行一些繁琐的运维
56、任务,提升运维效率,减轻运维人员的工作负担。台”)。该平台旨在统一数据整合,实现跨平台协同管理,提供实时监控与智能分析,优化成本控制,采用灵活的架构设计,支持移动端管理,并保障安全性和合规性。具备统一数据整合、跨平台协同管理、实时监控与智能分析、资源优化与成本控制、灵活的架构设计、支持移动端管理、安全合规性保障等特性。案例介绍方案整体描述基础设施层:包括服务器集群、存储系统、网络设备等硬件资源,以及操作系统、数据库等基础软件,为平台提供稳定可靠的运行环境。数据资源层:整合汇聚各运维系统数据,通过数据接口对接、数据标准化处理,构建统一的数据仓库,支持实时与历史数据的存储与访问。数据服务层:包含数
57、据查询服务、实时监控服务、异常告警服务等核心服务模块,支撑上层应用的灵活扩展与高效运行。业务应用层:构建统一门户界面,集成监控、告警、资源管理、报表分析、任务调度等功能模块,实现运维业务的一站式管理。用户交互层:通过移动端H5页面、Web界面等多渠道,提供便捷、直观的交互体验,满足不同用户群体的使用需求。技术架构及设计思路该平台主要服务于公司内部运维团队,给其带来了多方面的价值和收益,具体体现在以下几个方面:应用场景采用自主研发方式开发,能够根据运维团队实际运维问题与关键需求实现高度定制化的系统设计开发,并在系统全生命周期内根据业务变化情况实现功能动态调整与优化,不仅节约了软件采购成本,而且系
58、统与业务的匹配程度要远高于采购软件,达到了一平台尽览云网健康状态的效果。同时平台通过智能分析,帮助运维工程师基于数据实现资源优化使用,避免了资源浪费。1提升了用户体验。平台的实时监控和故障预警功能,确保了系统的高可用性和稳定性,减少了服务中断时间,提升了用户体验。2缩短了部署周期。平台的模块化设计和标准化部署流程,使新功能或服务能够快速上线,使得系统能够更快响应运维要求的变化。3提升了产品质量。平台的智能分析能够根据实时监测状态数据提前预警潜在问题和故障信息,使运维工程师和系统管理员能够在故障发生前就及时采取预防处置措施,避免了因系统故障导致的产品质量问题。以及通过对资源使用情况的持续监控和分
59、析,平台能够提供性能优化建议,提升系统性能和稳定性。418实现多平台数据的统一接入。本方案开发了一套全面的多平台数据接入系统,包括API、FTP、SNMP等多种数据接口。不仅解决了当前市场运维产品难以相互集成与对接的问题,还为未来新系统的快速整合奠定了基础。数据标准化整合创新。通过自主开发数据转换算法和建立本地化的大数据对接机制,平台能够有效处理来自不同来源的异构数据。更重要的是,平台利用数据中台技术对汇集的数据进行综合治理和标准化处理。本地化大模型应用。本平台创新性地开发了本地化私有部署的大模型服务,通过提示工程优化,平台能够在保护数据隐私的同时,实现高效的智能分析。自动化运维的探索性实践。
60、首先,通过开发自定义过滤算法和智能判断机制,有效降低了各系统的误报率。其次,平台利用机器学习和大模型技术,对运维状态信息和事件信息进行综合研判与分析,有效提高运维人员对数据的掌握理解程度。数据驱动的运维管理决策支持。基于标准化的数据和本地化大模型,平台开发了一套创新的决策支持系统。该系统能够实时综合多个系统的数据源,生成多维度的运维分析报告,为管理层提供直观、准确的决策依据。掌上运维平台作为一款基于大模型及大数据技术的创新型运维产品,在轨道交通行业领域数字化转型中展现出了卓越的问题解决能力和广泛的应用范围。方案特点描述它有效解决了不同品牌、架构、开源与商用并存的运维监控和安全管理工具数据接入难
61、的问题。该平台具备简便易行的特点。其整体设计高度模块化,各企业可根据自身需求,对所需模块进行定制化调整,对企业的技术要求相对较低。该平台的可复制推广性极强。其通用的设计理念和灵活的架构,使其能够快速适配不同规模、不同行业的企业。无论是互联网科技公司、金融机构、制造业企业,还是医疗、教育等领域,只要存在服务器资源管理需求,都能顺利应用该平台,适用场景极为广泛。该平台的应用优势十分突出。其一,智能化的监控大幅提升了运维效率,降低了人工监控的成本和压力。其二,基于大模型的分析,能够提供精准的性能优化建议,延长服务器的使用寿命。其三,实时的监控和预警功能,增强了服务器的安全性和稳定性,有效保护企业的核
62、心数据和业务。解决成效北京轨道交通经营管理数字底座智能运维技术的应用实践功能架构图192024数字化业务安全生产应用案例汇编网络安全态势感知通用技术要求(GB/T 42453-2023)在轨道交通经营管理云场景下的应用实践案例应用单位案例实施单位案例应用领域北京市基础设施投资有限公司北京市基础设施投资有限公司交通行业案例介绍随着城市轨道交通的快速发展,北京市基础设施投资有限公司(以下简称:京投公司)作为拥有轨道交通投融资、建设管理、运营服务、沿线土地开发经营、装备制造“五大业务板块”的管理单位,面临着新的网络安全挑战。近年来网络安全威胁形式越发严峻,各类新型攻击和0DAY攻击层出不穷,一旦发生
63、网络安全事件或数据泄露等事件将严重影响轨道交通建设、运营和装备制造,特别是北京作为中国的首都,发生类似问题对国家、城市、行业、企业形象造成严重影响。为了提高网络安全水平,满足国家相关标准的要求,京投公司在网络安全监测方面,自2019年开始探索采用态势感知技术对全集团网络安全风险进行监测。在近几年网络安全攻防演练中,态势感知设备发挥了极大的作用,但也面临着缺少体系性的管理文件支撑、市场上产品较多缺少规范性的选择标准和使用标准等问题。2023年,GB/T 42453-2023网络安全态势感知通用技术要求发布后,京投公司紧密围绕规范内容对当前态势感知监测的技术和管理体系进行整体规划和布局调整。通过与
64、专业机构合作,对现有态势感知设备进行全面评估和升级,确保其符合国家标准的要求。同时,公司还加强了内部网络安全培训和意识提升活动,提高了员工对网络安全的认知和应对能力。方案整体描述打通企业全供应链条的态势感知效应,京投作为主体将网络态势安全监控体系纳入公司网信领导小组工作中和全集团网络安全总体应急预案中,以统筹推进规划落地,有效整合内部资源,确保工作依法合规、平稳有序,形成职责分明、资源共享,协同管理、利益共享的运作机制,明确职责权限及工作制度。建立安全运维流程和运维管理平台,安全运维流程的目标主要是建立符合公司经营管理自身情况的安全流程,如事件处置流程、漏洞修复流程、应急响应流程等,并将这些线
65、下的运营流程通过态势感知平台实现电子化的线上流程,实现高效安全运营。为提高经营管理云网平台建设的整体水准,结合轨道交通运营管理的业务特点、信息化建设情况、安全需求,参考GB/T42453-2023、GB/T20985.1-2017、GB/T30279-2020等一系列标准,为经营管理云网平台建设提供了基本的技术和理论参考。123组织保障机制安全管理制度和流程系统建设和测试评估根据GB/T 42453-2023网络安全态势感知通用技术要求,开展组织保障、安全管理制度和流程、系统建设和测试评估等工作情况,具体如下:技术架构及设计思路本案例主要应用于京投公司经营管理云网场景下,涵盖京投公司本部、事业
66、部及直属二级所属公司。在检测中,我们针对各类应用系统共计114项进行了全面的态势感知监测,包括轨道交通投融资、乘客服务、采购供应链、日常运营管理(如排班、车辆、能耗等)、企业财务、人力资源、资产管理、科研、综合办公、党建等重要领域。主要应用场景包括以下几个方面:应用场景20网络入侵检测与防御:通过对网络流量、日志等数据进行实时监测和分析,及时发现并阻止网络入侵行为,保障网络安全。威胁情报共享与分析:建立统一的威胁情报共享平台,实现对各类威胁情报的收集、分析和处理,为安全防护提供有力支持。安全评估与优化:定期对信息系统进行安全评估,发现潜在的安全风险,并采取相应措施进行优化,降低安全风险。应急响
67、应与处置:建立健全应急响应机制,确保在发生安全事件时能够迅速、有效地进行处置,降低损失。安全培训与宣传:通过开展安全培训和宣传活动,提高员工的安全意识和技能,形成良好的安全文化氛围。为了使网络安全态势感知通用技术要求的国家标准真正在公司经营管理云网场景下落地并起到示范作用,项目建设初期,以京投为主体联合体系内各供应链企业,开展了网络结构和资产信息的全面梳理,了解了现有业务系统、网络安全的现状和需求。通过分析和研究GB/T 42453-2023网络安全态势感知通用技术要求,确定了以“顶层设计、统筹规划、模块推进、重点先行、权责明确、共建共享”的原则。在2022年,已完成新宫云算力服务中心、磁各庄
68、云算力服务中心、京投集团内部署网络安全态势感知,进行重要节点的流量分析从而实现风险的预警和识别。该项目严格按照GB/T 42453-2023网络安全态势感知通用技术要求建立了基于分布式级联平台架构体系,构建轨交经营管理供应链全网的安全态势监测、安全事件分析研判和响应处置为一体的基础平台。在网络安全态势感知的业务架构上,通过在京投公司建设网络安全态势感知主平台,在成员单位构建子平台的模式,实现平台级联的模式,实现上下协同,联动响应。方案特点描述构建公司经营管理全供应链网络安全态势感知能力:实现公司经营管理全供应链网络安全态势感知关键安全数据的集中采集、存储、检索及对外接口,建设安全数据湖(dat
69、a lake)中台。公司经营管理全供应链网络安全威胁集中管控:实现对各类安全风险的快速定位和分析处理,甄别源头和成因、还原事件的发生过程、评估风险的影响范围、为安全监控运维管理提供可依据的技术手段。提升公司经营管理全供应链高级威胁监测与预警能力:实现各安全组件数据共享与协同,目前正在研究以AI为技术核心驱动,基于轨道交通行业业务典型实际的安全场景构建高效AI安全算法与模型,融合大数据与威胁情报分析技术,构建一体化、智能化威胁监测体系,显著提升高级危威胁的检测与预警能力。缓解专业人员不足的难点问题:在网络安全感知平台中应用自动化高危风险处置、平台与安全设备的联动处置响应、SOAR安全流程编排以及
70、工单系统在京投与供应链企业的对接,实现高效、智能、精准的快速响应体系。满足政策法规与监管要求网络安全态势感知通用技术要求(GB/T 42453-2023)在轨道交通经营管理云场景下的应用实践架构图解决成效212024数字化业务安全生产应用案例汇编基于联邦可信AI的跨行业数据安全融合营销系统案例应用单位案例实施单位案例应用领域中国移动通信集团天津有限公司中移动信息系技术有限公司通信、金融行业需求分析2019年底,一场突如其来的疫情让各行各业都经历了一次压力测试,运营商和银行业也不例外。多数运营商和银行关闭了线下网点,也因此失去了客户经营的重要抓手。一些先知先觉、数字化程度高的运营商、银行在疫情期
71、间纷纷转战线上,但暴露出数字化经营能力的不足。例如:银行虽然坐拥大量客户数据,但仅局限在单一金融业务数据,缺乏运营商、社交平台等三方机构间的数据,难以围绕客户体验打造“精准营销”。数据隐私易泄漏,数据资产易流通,各行业之间数据难以互联互通,导致行业间存在数据孤岛效应,跨行业的数据引入合规挑战大。急需联邦学习算法解决阻碍电信、金融跨行业联合营销的信任机制问题。行业数据很难直接与中国移动做简单的聚合,需要基于多方安全计算模式进行联合,多参与方模型参数传递与交互由第三方机构进行协调,难以保证第三方的信任机制,模型训练完毕在投入应用前应检测其安全性,因仍然存在信任的问题。如没有合适的安全管理机制则会限
72、制中国移动联邦学习服务延申的广度和深度,因此急需将区块链技术运用到跨行业数据融合营销中,解决跨行业数据安全可信问题,打消数据合作的顾虑。案例介绍跨行业企业在进行联合营销建模时,需要将电信运营商的消费等级、上网偏好、用户忠诚度、语音流量使用习惯数据,和银行、保险等金融领域的数据融合,构建更加全面精准的识别模型,但不同行业单位不会把数据做简单的聚合,需要基于多方安全计算模式进行联合。因此中国移动、渤海银行这两家在天津区域内处于主导地位的电信和金融单位进行数据联合建模,并以此为牵引打造联合可信AI平台,就是必由之路。联邦可信AI平台的基础能力就是信息安全和跨行业数据防泄露,天津移动和渤海银行在技术研
73、发和数据融通达成合作,建立联合专项,重点研究:高效地确定多参与方的贡献、便捷地进行事后的数据安全审计、推动联邦学习和区块链更好地技术融合,最终实现安全可信的跨行业联防联合营销识别。方案整体描述解决跨行业数据融通的隐私保护问题,让数据要素在阳光下流通联邦学习和区块链技术结合紧密,在多方共同参与模型训练后,利用联邦学习来建立数据模型,并且仅共享数据模型而不是原始数据,从而将数据共享问题转化为机器学习模型共享的问题。以区块链解决联邦中心依赖的问题通过建立联盟链,使得每个参与方成为联盟链上的节点。借助联盟链去中心化特征,节点们在该点对点网络下进行通信,摆脱了对中心节点的依赖。解决多数据提供方联邦建模中
74、激励不足的问题 项目巧妙地在“建模-推理”中,实现了各联邦参与方贡献度的判断。建模时,“特征变量IV值”上链,以此计算参与方特征的贡献度;推理时,双方操作日志指纹上链,并通过智能合约自动将收益分配给各参与方。该方式与现有的按条计费不同,可以更精准地评估每次调用的质量,为联邦参与方的合作提供谈判依据。12322建设“多方数据分布式”联邦学习平台,实现数据不动模型动”,确保参与方数据隐私安全,在电信、金融、保险、医疗等行业都有应用价值。基于区块链的电信欺诈识别数据融通系统“信息安全态势感知平台”,定位电信欺诈和风险防空,实用性强,不仅可以用于电信金融欺诈识别,也可以扩展到风控管理、联合营销、跨行业
75、组合推荐等场景。数智场景服务:从标杆性场景出发,“点-面-体”多管齐下的生态赋能。天津移动已经与渤海银行进行信用卡营销、风控评估,与渤海银行开展电信反欺诈服务,与浦发银行进行区域化营销交流,在电信、金融、公安多个行业显示出优异的应用前景。123本项目的技术特色是“区块链+联邦学习”,实现人工智能跨行业数据融通的典型应用,重点针对运营商联合营销识别的联邦模型训练流程实现能力优化。方案创新地在建模前的特征筛选、建模中的模型训练、建模后的模型推理,引入区块链智能合约技术,对多方数据进行统一管理,以区块链代替联邦模型的中心节点,解决了联邦学习的中心节点审计问题。系统使用的区块链底链类型为EOS,主要承
76、载方为中国移动CMBaaS区块链平台。联合营销系统主要有数据对齐、特征筛选、模型训练、模型推理四个数据流:技术架构及设计思路项目在天津移动、渤海银行、浦发银行的跨行业欺诈防控工作中应用,改善了跨行业数据融合中多方安全计算的可信程度。以中国移动集团总部的梧桐平台全国数据为核心,进行业务场景化延伸,在电信欺诈、风控场景落地。应用场景数据对齐:在模型开始训练之前,各参与方需要共享加密后的用户id数据,同步给其他参与方进行id对齐。建模前的特征筛选:联邦参与方本地数据特征提取,计算、筛选IV得分高的特征进入联邦建模并上区块链,以此计算各联邦参与方对整体模型的贡献度。建模中的模型训练:联邦参与方进行本地
77、模型训练,模型参数通过区块链上链服务进行数据上链,经过CMBaaS的智能合约判断,并通过区块链共识算法后,生成新的区块。其他参与方的区块消费服务检测发现新区块的生成,获取到区块数据后进行自己模型的参数迭代优化,更新参数,直到所有联邦参与方均达到模型预设收敛条件。在模型收敛后,可以对全部参与方对最终模型的贡献度进行量化判断,为联邦参与方的合作提供谈判依据。区块回溯与审计:对参与方的链上数据进行调用和查询。由第三方审计系统发起审计请求,区块 服务返回,获取时间段内的所有区块数据,并按照审计要求对区块数据进行解析,用于后续审计操作。建模后的模型推理:中国移动及合作伙伴发起模型推理请求,区块服务进行推
78、理请求上链,智能合约及共识算法进行数据验证并生成区块,其他参与方监测新区块生成,判断推理请求是否与自身相关,双方分别进行本地局部模型推理解密,智能合约进行双方推理结果合并,请求方获得最终模型推理结果,返回业务系统。同时,在多个参与方进行联邦推理的同时,部署区块链用于记录用户服务的接口调用日志指纹、各参与方的贡献、该服务所产生的收益,并通过智能合约自动将收益分配给各参与方。1234523以AI技术提升联合建模精准度,对外变现收入100万元,营销带来价值2036万元,减少群众资产损失6003万元,节省人力成本40万元,提升中国移动品牌价值。解决成效打造可信AI标杆场景赋能,以点带面,提升行业数据合
79、作效率天津移动与渤海银行、浦发银行、招商银行合作,进行信用卡风控、信用卡联合营销、金融反欺诈的跨行业合作。“区块链+联邦学习”技术融合,实现电信、金融反欺诈识别依托联邦学习技术,可打通银行-电信运营商企间存在的数据孤岛,基于金融特征、交易特征、行为特征和干系人特征等信息构建联合反欺诈体系,共同提升银行业和电信企业反欺诈能力。针对银行业当前面临的主要欺诈风险和联邦学习技术特点,重点建设金融同业反欺诈、社交金融反欺诈和消费金融反欺诈等反欺诈业务场景。科技创新助力产业发展,促进“运营商+”的生态基因推广本项目除了在反欺诈有着应用场景,其“联邦学习+区块链”多方数据共享模型引擎,还有拓展到更多商业场景
80、,例如:“运营商+互联网公司”多方共享的智慧零售,“运营商+银行”联合信用评估,显著助力产业的数智化转型。方案特点描述跨行业联合营销系统架构图24该方案包括数据采集层、数据应用层、领域服务层、UC层等关键组成部分:数据采集层:管理和自动下发采集前置机,按照业务任务生成采集任务,通过SSH/Telnet/RESTful等协议与客户网络中的IT运维系统、云管系统、物理设备对接,采集告警、性能和资源数据,并提交到数据应用层。数据应用层:向下提供数据接收和处理能力,静态数据存入CMDB,动态数据存入动态库。向上面向各领域服务提供针对CMDB各类对象和动态库中各类指标的数据访问接口,以及基于CMDB和动
81、态库的数据分析和处理的应用服务扩展。领域服务层:按照评估、规划、迁移、部署、运维、优化六个领域提供对应领域基础能力,支撑上层业务UC构建。同时提供面向运维的公共能力。UC层:面向一线使用场景提供对应UC,当前提供如下UC。迁移中心:主机迁移 资源效率提升:资源状态、资源优化、资源预测、资源告警 存储辅助运营:存储管理、虚拟化管理、作业管理、报表管理、存储架构评分总览 虚拟机访问诊断 资源与应用配置:资源中心、应用配置案例介绍面对上述需求,山东移动制定了系统化的应对思路,以期通过科学规划、高效执行全面提升IT云资源利用率,优化成本结构,强化业务支撑能力,确保安全合规,推动企业数字化转型的深入实施
82、。案例建设思路如下:基于全量指标数据采集分析,融合大数据、AI等技术构建IT云智能运营优化平台,实现智能编排调度、智能节电、消除主机热点、削峰填谷、动态弹性伸缩等能力,提高资源运营管理效率,提升资源整体利用率。方案整体描述山东移动IT云智能运营优化平台以裸金属、物理机、虚拟机等相关资源数据、性能数据、日志数据、业务数据等为数据源,方案整体逻辑架构围绕资源优化、智能管理、安全保障三大核心功能展开,旨在构建一个高效、灵活、安全的云资源管理优化体系。方案整体架构如下:技术架构及设计思路2024数字化业务安全生产应用案例汇编IT云智能运营优化平台案例应用单位案例实施单位案例应用领域中国移动通信集团山东
83、有限公司中国移动通信集团山东有限公司通信行业需求分析2023年公司业务部门分别提出数智化转型发展方案,其中包括B、O、M域共100多个业务重构上云需求,需要IT云提供大量算力资源支撑。然而山东移动IT云资源分配率较高,但利用率较低,造成资源闲置、浪费。为实现按需分配,提升IT云资源效能,亟需引入新技术手段提高CPU平均利用率,充分利用闲置资源,全量支撑业务需求。鉴于上述需求与挑战,山东移动实施“IT云资源利用率提升”项目显得尤为迫切和必要。首先,提升资源利用率是降低成本、提高效益的直接途径,有助于企业竞争力的增强。其次,优化IT云资源管理是实现业务敏捷性和快速响应市场变化的基础,对提升客户满意
84、度和市场份额至关重要。再者,面对安全合规的高压线,优化后的云环境能更好地满足国家和行业安全标准,保障企业信誉与数据安全。最后,通过此项目,山东移动能够在内部推动技术革新,为持续的数字化转型打下坚实基础,推动行业进步。因此,此案例的实施不仅是对现有问题的解决,更是对未来发展的战略投资。IT云智能运营优化平台架构图25资源智能分配3:基于多维装箱算法的资源智能分配为实现最大化虚机装入个数、最小化宿主机使用个数、最小化虚机迁移次数,减少资源碎片的产生,通过多维装箱算法基于主机、虚机的四维向量(CPU可用容量和实际使用率、内存可用容量和实际使用率),制定综合最优的虚机发放方案。全栈IT信息采集与智能处
85、理通过集成高效的采集引擎与框架,实现Linux与Windows平台的自动化脚本执行,以敏捷的响应速度完成设备信息的全面自动采集,并且运用图计算技术从海量数据中有效挖掘出潜在联系。系统充分考虑业务关联约束与批次执行均衡,通过迭代计算不断优化批次质量,最终实现高效均衡的全栈IT信息处理策略。应用场景全栈信息采集处理2:基于指标智能分析的节能和负载均衡智能节电:根据宿主机负载情况,通过“热迁移”技术对虚机进行整合,下电空闲物理主机,降低能源消耗。热点消除:根据虚机负载情况,精准识别短缺、低效、不均衡资源,自动生成优化迁移方案,消除算力热点,实现负载均衡。主机负载均衡指标智能分析与优化在全量指标数据采
86、集分析基础上,融合大数据、AI等技术构建IT云智能运营优化平台,实现智能编排调度、智能节电、消除主机热点、削峰填谷、动态弹性伸缩等能力,提高资源运营管理效率和整体利用率。1:基于指标健康度的智能优化分析历史数据,利用时序预测和深度学习算法构建主机健康度模型,精准识别短缺、低效、不均衡资源,科学解决谁要扩缩、扩缩多少的问题。实现由“人工测算+手工执行”向“智能评估+流程自动化”转变,保障业务稳定运行。基于指标健康度的智能优化26该案例解决了目前IT云资源池资源利用效率低、运营优化手段落后的痛点问题,使IT云资源运营管理更加自动化、智能化。平台上线后,持续跟踪IT云资源池三个月的CPU平均利用率,
87、逐步提升到50%以上。本方案在设计过程中遵循标准化、模块化原则,其成功经验与技术框架易于在不同行业和企业中复制推广,特别是对于已具备一定云基础设施的企业,只需适当调整即可快速应用。同时,该方案依赖深度神经网络进行资源预测,预测模型具有良好的泛化能力,可推广性强。目前,本方案已应用到山东移动的IT云、网络云与合营云,实现了闲置资源的充分利用,大幅节约了运营成本,未来计划推广到移动云与政务云。算法应用创新:该方案深度融合业务信息与数据洞察,通过业务特征的精细化分析,实现了对资源需求的精准预测。基于深度学习与强化学习等前沿算法,不仅能够实时响应业务动态,灵活调度IT云算力资源,还提供了富有前瞻性的决
88、策支持,确保资源分配与业务需求的完美匹配。这种智能化的资源管理策略有效提升了IT云资源的运营效率。技术创新:方案集成了自适应性算法、实时处理技术、多目标优化模型及深度学习等关键技术,共同构建了一个高适应性、高度智能化的IT云智能运营优化平台。系统能够根据环境变化自动调整,实时优化资源使用,同时在保障性能的前提下,实现成本、效率、可用性等多目标的最优化平衡。技术创新的深度应用,不仅确保了系统的高效稳定运行,还通过持续的性能调优,推动了服务质量和用户体验的全面提升。方案创新:在方案设计上,充分利用云计算的弹性伸缩特性,深入分析业务特征和算力波动曲线,基于AI和大数据技术实现了算力资源的智能分配、负
89、载均衡、削峰填谷和弹性伸缩,大大提高了资源利用效率。该方案最大化发挥了算力资源价值,实现了对业务需求的全量支撑,无论是在资源高峰期的弹性扩容,还是在低谷期的智能收缩,都做到了高效、精准。该方案的成功实践,不仅为业务的快速增长提供了强大的算力支撑,还为行业内的资源运营优化提供了新的思路和范例,具有显著的创新价值和示范意义。方案特点描述解决成效混合部署:对具有明显周期特性的业务,如在线、离线业务等,通过混合部署实现削峰填谷,提高资源利用率。削峰填谷:通过AI算法分析算力波动曲线,对同一时间段峰值差异大的虚机,通过将虚机合并部署,共享同一底层资源,实现削峰填谷,提高资源利用率。4:基于峰谷叠加技术的
90、削峰填谷混合部署和削峰填谷动态弹性扩缩容引入大数据+AI+标签化技术,结合时序、业务特征画像和算力波动曲线,运用AI算法提前预测/精准识别业务的资源需求,根据配置的动态弹性扩展策略来实现服务的弹性扩展,突破大量操作依赖传统人工处理的瓶颈,提高资源利用率。5:基于策略指标的动态弹性扩缩容产品图272024数字化业务安全生产应用案例汇编基于AI+的中间件智能运维管理平台建设与实践案例应用单位案例实施单位案例应用领域中国移动通信集团江苏有限公司中国移动通信集团江苏有限公司通信行业需求分析案例介绍中间件作为大型分布式系统的基石,桥接于应用与数据库/操作系统间,高效管理组件间交互,其多样性如缓存、Web
91、、消息队列等,对运维与集成提出差异化要求。随着云化浪潮,中间件容器化部署成常态,运维复杂度激增,系统稳定性成为业务连续性的核心保障。中间件不仅关乎数据处理效率,更承载着高可用性与性能优化的重任。然而,现有故障预测与性能优化手段尚难全面满足业务SLA需求。在此背景下,聚焦标准化、平台化、数智化转型,以中间件稳定性为突破口,融合AI技术,打造“AI+中间件智能运维管理平台”。该平台旨在通过智能化手段,实现故障预判、性能调优与自主修复。构建通用运维能力,打造出新兴信息技术领域标志性成果,引领信息技术领域迈向新高度。在移动集团磐基的底座上,构建“AI+中间件智能运维管理平台”,融合标准化、平台化、数智
92、化理念。面向中间件的性能预测和优化、故障诊断和自愈两大目标,构建能力与场景实现双轮驱动,解决中间件共性运维难题。通过深度分析中间件的关键性能指标(如连接数、内存使用率等),运用预测算法以及自动化手段实现优化和调整(如连接数趋势触发的集群扩缩容、内存使用率趋势触发的内存阈值调整场景),提高中间件承载系统的性能和可用性。同时监控和分析中间件的异常关键指标数据,结合波形识别算法等实现故障秒级诊断与自愈,有效减轻中间件故障对业务的冲击,保障业务连续性与稳定性。方案整体描述基于“AI+的中间件智能运维管理平台”在“场景+算法+模型+数据”四维框架的基础上,融入执行、感知、分析、决策、知识更新五个系统化维
93、度过程。通过数据管理能力、算法能力、场景化模型构建、场景应用等能力,紧密结合中间件的特征,构建面向中间件故障的全生命周期运维能力,并融入磐基生态体系,保障中间件服务的稳定性。方案设计思路场景图架构图28接入缓存型中间件的典型指标连接数、内存利用率,经过数据预处理、以及数据特征的波形识别,进而进行预测算法分析、预测和性能优化:基于内存使用率异常,触发内存阈值调整的优化操作;基于连接数异常,触发集群扩缩容的优化操作。流程图2、基于内存和连接数使用趋势,触发故障预测、性能优化基于中间件关键指标自相关函数特性判断周期性特征,应用针对性的算法训练指标特征模型,实时检测。生产检测同时作为模型增量训练过程,
94、基于LOF离群检测算法增量更新模型,优化检测效果。形成“中间件典型三类异常”的场景覆盖。流程图3、聚合监控指标数据异常检测,实现中间件领域典型场景分类流程图故障诊断以应用服务管理为入口,从业务,应用/服务、基础架构三维一体进行整体思考。同时基于CMDB关联关系、告警数据和算法,挖掘潜在告警因果关系,固化标准告警因果关系,构建告警因果关系图谱;并结合诊断规则的配合和相关算法能力,快速实现故障的多维情形的诊断和定位,有效缩短故障排查时长。再通过调用自动化运维平台的预案接口,实现故障的自愈。4、基于应用的资源配置和告警数据,实现分层钻取的根因定位和故障自愈实践图提供对中间件全方位、全栈的监管能力,变
95、被动处理为主动防御,提前规避应用性能风险。通过可视化界面实现信息的高效交互,满足应用运维的需要。5、构建全景视图监管,全方位掌握中间件运行状态基于缓存型中间件多维指标数据,实现指标对象的异常波形识别、异常状态判定、容量需求测算,大大提高了指标数据分析的敏感性及准确性。流程图1、接入中间件关键指标数据,智能分析判定海量数据波形特征29“AI+中间件智能运维管理平台”适用于多种行业领域。可以帮助企业确保其关键业务系统的稳定性和可靠性,降低运营成本。支持容器方式部署、提供了详细的安装和配置指南,以及自动化脚本,以简化部署过程。“AI+中间件智能运维管理平台”聚焦中间件的稳定性和高可靠性,关注“事前-
96、健康检查”、“事中-异常感知”和“事后-运维反哺”三个融合过程的运维能力升级,达成中间件从原生监控能力向智能运维高阶段能力的转变。其先进性包括:实时监控和诊断:帮助运维人员快速发现和诊断问题,从而减少故障恢复时间。性能优化:可根据实际需求调整中间件的配置和资源分配,从而提高系统性能。容错和高可用性:确保关键业务系统在出现问题时能够自动切换和恢复,提高运维效率。数据可视化:提供可视化仪表盘,帮助运维团队更好地了解系统状况,制定优化策略。应用场景“AI+中间件智能运维管理平台”对内在江苏业务支撑系统规模化应用,已覆盖Redis组件节点数量400+。实现了集群资源的按需调度和内存优化调整,其硬件资源
97、的利用率由26%提升到36%,硬件投资节约400万元;同时性能预测优化和故障诊断能力,运维成本年度压降1500人日;2023年度中间件重大故障规避10起,同比去年Redis中间件的故障率降低51%。形成中间件运维治理的最佳实践。对外打造“产品化”能力产品样板间,形成行业类解决方案。产品化助力政企市场创收,2023年拓展对外客户4个。带动信息化收入超500万元。解决成效架构先进性实现指标采集-异常感知-故障诊断-根因分析-决策自愈的全链路解决方案。技术先进性实现AI算法与分析决策的深度融合,可快速完成资源伸缩调度、自愈操作,打造运维的无人值守。应用先进性实现组件化封装,易于接入和推广使用。方案特
98、点描述302024数字化业务安全生产应用案例汇编中国联通网络数字化系统可观测稳定性保障体系集约化运营监控管理平台创新应用与规模实践案例应用单位案例实施单位案例应用领域中国联合网络通信有限公司智网创新中心中国联合网络通信有限公司智网创新中心通信行业需求分析中国联通网络创新产品包括智慧云网、5G、智慧家庭创新产品、智慧网络运营平台、网络中台等,产品特点各异、业务多样、迭代更新快。如何准确评估用户体验,找到需要改进的方向和方法,不断提升用户满意度,最大限度发挥网络创新产品价值,助力生产经营,为网络创新产品运营提出了不小的挑战。中国联通网络IT支撑系统架构演进快,网络、应用、服务等交互关系复杂,为系统
99、运营带来了许多挑战,原本只需JAR包可以提供服务的系统,被解耦为成千上万个微服务,管理维护对象数量几何级增长,大大增加了运维的难度,同时,如何梳理这些微服务之间的调用关系也成为一个难题。故障处理过于依赖专家经验,系统服务之间的调用关系复杂,故障分析和定位困难。此外各个环节在监控、应急、巡检等方面的自动化和智能化能力还有待提高,缺少端到端、全层级和全链路可观测稳定性保障体系。我们还需要将故障处理从被动防御救火的状态转变为主动防火的状态,合理利用系统运营收集到的大量数据,提前发现和处理系统风险隐患。因此为了解决上述问题,结合各网络创新产品系统ICT融合、敏捷开发、业务各异特点,引入HEART产品模
100、型,搭建了网络IT系统可观测稳定性保障体系和集约化运营监控平台,形成基于业务、基础设施视角的全链路端到端可观测能力,拉通系统所有层级数据,形成全层级故障诊断及健康检查能力和系统架构自动拓扑,建立指标覆盖标准规范,全面覆盖系统潜在故障点,尽早发现系统潜在风险,提升系统精细感知及故障发现预警能力,减少MTTR,提升系统可用性,提升客户感知,全面保障系统稳定性和业务连续性。案例介绍中国联通网络创新产品差异大,迭代更新快,运营体制机制有待完善,运营生产流程不统一,执行不规范。网络IT支撑系统业务调用复杂,跨系统、跨层级故障根因联合定位难,处理问题过程中需切换多个平台,支撑系统割裂,影响问题处理效率。缺
101、少从应用系统视角服务、组件、主机资源配置管理能力,页面层、组件层、服务层、资源层数据没有串联,数据的碎片化,集约化运营体系需进一步深化。通过建设网络IT支撑系统可观测稳定性保障体系和集约化监控运营管理平台,实现网络创新产品数字化、规范化、智能化运营管理。平台围绕“拉通ICT,构建大生态”总体目标,以提升系统可观测能力为基础,以提升系统业务连续性为目标,构建面向网络系统的跨数据中心、跨层级的集约化监控运营管理平台,实现用户浏览器及APP端等前端触点问题风险及时感知。通过一键故障智能诊断和全链路端到端可观测能力,实现快速定位故障根因,缩短故障定位时长,提升故障定位效率。通过融合“平台+应用”网络创
102、新产品特点,打造全领域端到端、全流程集约化系统运营监控工具及能力,提升网络IT支撑系统运营效率及质量,全面保障系统稳定性和业务连续性。方案整体描述中国联通集约化运营监控管理平台结合前端触点层、SAAS服务层、PAAS中间件层、IAAS资源层监控能力,涵盖页面、服务、应用、业务、平台、中间件和基础设施等资源,实现全方位监控运营管理,一屏看清系统各层级问题。通过资源配置管理模型,实现各层级运维数据关联互通,推进全层级监控深度覆盖,实现全栈式性能监控和端到端全链路追踪诊断,降低故障定位门槛,提升故障定位效率。打造网络智慧化运营全面好用工具和系统可观测稳定性保障体系,实现监控方式从传统人工监控向自动化
103、、敏捷化和智能化演进,逐步实现网络创新产品运营全面数字化转型。主要功能31集约化运营监控管理平台承接中国联通数字化转型行动计划总体要求,遵循集团战略规划,基于联通云统一技术底座、“平台+应用”云化架构模式,构建统一技术架构,夯实集约化系统运营监控管理能力,提升系统运营效率及质量,全面保障系统安全稳定运行,保障网络创新系统可管、可视、可控。集约化运营监控管理平台系统通过“平台+应用”模式,强化全栈式、端到端、全流程工具支撑,基于资源配置管理基础能力,实现资源整合和服务梳理;通过全层级故障定位和智能诊断工具,一屏看清系统故障情况与影响范围,提升故障定位效率,实现传统运维向自动化生产、智慧化运营的转
104、变,支撑一体化生产运营体系落地,保障系统可视、可管、可控、可持续运营,提升系统稳定性,全面提升用户体验。集约化运营管理工具包括运营管理、监控告警、可观测、智能运维等能力。技术架构及设计思路IT架构业务架构方案特点描述实现运营集约化管理新模式。构建了应用系统线上全生命周期管理、一体化运营管理体系,实现运营服务数字化、全栈监控数字化、运维能力智能化。适配ITCT系统特点建立统一闭环监控体系。基于“自研+开源”、“平台+应用”模式,多租户管理,面向各级用户提供统一触点、多视角视图,实现统一管理,快速赋能一线。与各产品团队、省分高协作、同部署,为产品赋能,充分利用AI、大数据技术,埋点采集、加工分析,
105、实现端到端、云化架构下全层级集约运营工具支撑。构建一套基于HEART产品运营指标分析模型,构建前端用户体验感知指标的监控自动采集分析产品运营的方法及工具,通过RPA机器人自动采集前端用户行为数据和系统运行指标,通过智能埋点技术跟踪和还原用户业务轨迹,通过自动化的数据处理分析,实时掌握产品的整体运行状况,并提供详细的用户行为分析和优化建议,从而提升产品质量,保障业务连续性。大数据处理、多框架适配、兼容扩展性高,由于涉及大量的用户行为和性能数据,确保监控平台能够有效地处理和分析海量数据,同时保持高性能,支持业界多数前端框架,具备横向扩展能力,同时建立产品与系统映射关系,支持产品纵向维度向多系统深度
106、扩展。跨层关联技术:实现了跨三层SaaS/PaaS/IaaS数据间的关联,跨层之间关系实现了细粒度实例级的自动构建。可处理多来源产品运营指标,web端、APP端、微信小程序等,从不同渠道、维度收集数据,全面了解用户行为,洞察用户在不同渠道互动、偏好、习惯,支持数据驱动决策。123456中国联通智能运营监控管理平台面向集团总部、31省、地市各级运营团队提供高效便捷入口、运营管理及全栈监控运营工具和运营流程、分层可视化分析视图,覆盖智网创新中心全量5大类20+产品、省分O域系统等200+投产系统。应用场景32根因算法技术:实现了基于时间模式、事件历史关联、事件拓扑关系维度的特征来计算事件的因果关系
107、。根据时间因果、应用调用因果、历史因果证据和事务因果证据综合判断出根因问题。数据隐私保护:由于涉及用户行为和体验数据,保护用户隐私和敏感信息是关键,需确保收集、存储和传输数据的安全性,遵循隐私法规。平台涉及大量数据的收集、处理和存储,保护这些数据免受未经授权的访问、篡改和泄露。可扩展性:随着业务的增长,监控平台可能需要扩展以处理更多的数据和用户。保证系统的可扩展性,避免性能瓶颈。789本案例实现中国联通智网创新中心、省分O域系统等200+系统集中监控告警、全量系统生产作业100%电子化覆盖,纳管页面层、服务层、组件层、资源层全层级系统运行指标及产品运营指标5w+项,为网络创新系统安全运行提供端
108、到端、强有力工具手段,实现运行运营体系化、标准化、集中化运营高效支撑、系统风险秒级预警、分钟级定位、故障闭环管控、人事效透明化管理。解决成效中国联通智能运营监控管理平台应用架构图应用系统支撑平台中间件数据存储基础设施应用架构图上线交付问题管理账号管理问题聚类分析版本发布故障管理系统下线线上签到签退变更管理作业计划入网测试问题质检流程重保管理信息发布云资源变更沃运维PC门户嵌入联通网络APP统一运营门户API其他外部系统nginxkafkagrafnaPrometheusAlertmanagerRDSRedisClickhouseMongDB天宫云虚拟机COSTFS运营管控流程运营合作管理运营合
109、作商管理基本信息维护审批运营合作人员管理人员新增、变更项目管理工作查询工作量填报工作量稽核考核评价工作量审批告警中心(智能监控)应用配置库浏览器监控APP性能监控OTEL-APM(调用链)(trace)自动化巡检监控告警运营视图工作量画像流程分析报表工作分类画像人员查询人员画像报工记录查询项目信息查询工作量填报查询问题分析报表可观测性能力故障改进故障管理应急预案基础设施/业务全链路可观测系统架构自动拓扑展示预防健康检查事中障诊断产品运营指标332024数字化业务安全生产应用案例汇编重庆移动智慧监控指挥调度助力企业安全生产案例应用单位案例实施单位案例应用领域中国移动通信集团重庆有限公司北京神州泰
110、岳软件股份有限公司通信行业需求分析目前各网络支撑系统各自为战,数据信息未得到有效整合,网络风险研判能力较弱,基于故障前的风险预警基本为零。迫切需要整合资源、告警、舆情等各方数据,建立风险研判机制,引入智能化手段,对网络风险进行智能研判,自动拉起应急保障流程。针对故障信息未实现全面共享,仅依靠传统沟通手段进行信息交互,协同处置能力不足,应急响应不及时,上下沟通不顺畅,信息报送不快捷,资源调度不协调,急需针对故障调度,建立一套完整、便捷、实用的任务分发、及时沟通、作战指挥的任务、沟通体系。故障处置过程中,可视化、智能化支撑手段缺乏,包括故障进展不可见、保障过程不透明、抢修方案无推荐、保障复盘无手段
111、等对故障处理全流程进行管控,需建立一套应急调度流程,实现应急事件发生至结束全生命周期管理,为事件闭环、回溯提供数据支撑。案例介绍网络态势感知:提供一站式事件感知场景,实现故障信息统计、预警信息、机房资源、应急物资、应急预案、投诉数据、重要事件等网络态势感知数据和应急调度储备数据共享;重庆移动智慧监控调度系统,借鉴数字重庆V型理论,以“三张清单”为建设理念,构建重庆移动“规范化、自动化、敏捷化、智能化”数字化智慧调度管理体系。建设具有重庆辨识度的可视化、智能化智慧调度平台,实现智能研判、快速响应、协同处置能力,强化提升网络感知能力、应急指挥调度能力和应急通信保障能力。围绕以上目标,对以下内容进行
112、建设:方案整体描述事件调度处置:基于沙盘基础能力,建立应急事件全流程进展进行管理;事件复盘:建立应急事件归档机制,对应急事件处置流程、处置结果进行汇总,并提供相关应急事件回溯能力;123移动协同运维:建立移动端协同运维能力,面向一线代维提供应急事件处置功能。434平台采用目前主流的技术框架,数据层选用关系型加非关系型数据库组合的方式,使数据处理更加灵活便捷,统一的后台微服务架构,更强调服务化、模块化,轻量级的前台展现组件,实现快速交付和扩展。基于“应急保障全程可见”的建设思路,结合一线实际需求,主动融合中台能力,以信息一览俱全,沟通上通下达,调度高效敏捷为目标,实现事前、事中、事后全过程可视化
113、管理。具备应急事件/任务处置管理能力:通过应急事件/任务处置、全流程支持管理能力,实现对事件/任务识别建立、事件处置、事件复盘的全流程管理,并支持事件/任务流程的可视化配置;具备应急资料管理能力:通过对应急资料统一管理能力,包括应急物资、应急人员、应急方案的统一管理;具备应急调度沟通能力:通过短信通知、现场视频对接、应急会议等多种应急沟通能力,支撑应急事件调度处置;具备网络监控能力:通过对应急事件和网络故障事件的统一监控能力,可通过GIS沙盘、网络拓扑、事件列表能力对故障、应急事件进行监控、统计;具备应急流程管理能力:通过应急事件流程、任务流程统一编排管理能力,支撑不同应急场景的处置。技术架构
114、及设计思路面向监控中心和管理指挥人员大屏端:包括日常运维、应急调度两个场景,其中日常运维面向平时日常监控,提供网络态势、保障任务、运行指标等数据展示;应急调度面向具体保障任务,以任务为视角,关注任务的实时画面、故障沙盘、任务进展以及数据的实时统计。面向监控中心、地市管理者,提供中屏可视:中屏PC端作为管理入口,提供平台系统的日常管理以及具体事务处置,包含全局检测统计、舆情预警、物资跟踪管理、故障跟踪处置以及以及调度指挥。同时PC端还作为管理功能入口,平台提供应急物资管理、应急预案管理、调度指挥管理、资源管理、事件管理、任务管理、白名单管理、事件评估等功能,为平台提供基础功能。面向一线人员手机端
115、:APP端为一线运维人员提供数据、任务看板,包含消息推送、工单处置、信息沟通与反馈以及其他运维工具等。123平台通过融合网络运行关键数据要素,结合一线实际,借助中台能力,打造基于GIS平台的智慧指挥调度系统,实现网络可见、可管、可控,提升网络感知、应急通信保障、指挥调度能力,主要包含提升能力:融合全要素信息和能力;实现全网网络态势感知;基于GIS呈现机房等资源点的实时运行情况;基于事件场景智能研判,一键拉起应急调度流程;基于事件提供智能调度抢修方案推荐;基于GIS呈现应急事件执行情况并开展调度;对应急物资、应急预案进行线上管理;调用各工作台能力,提升应急指挥调度抢修效率;丰富应急指挥调度沟通手
116、段;实现多屏联动,提升调度机动性。系统实现以大、中、小三屏合一,以日常监控、应急调度两个维度为切入点,进行功能打造。应用场景35产品规划蓝图系统落地实践图基于智慧监控调度平台,汇聚各系统数据,以可视化技术对整合数据进行归类呈现,同时根据各方信息实现自动预警,实现一场景一流程的精准调度,从而提高故障及时发现、响应率,同时提升故障处置效率。在智慧监控调度平台部署后,重大故障发现及时率提升至100%,响应率提升至100%,故障处置效率提升10%。节约各项人力、物力成本约200万元/年。解决成效技术创新:平台系统深度集成了云计算技术,通过弹性伸缩和负载均衡,确保了在高并发场景下的系统稳定性和可靠性。引
117、入人工智能算法,平台系统能够智能抢修方案生成,并优化调度流程,提高运营效率。平台系统持续对系统进行技术优化和升级,如改进系统架构、优化算法、提高并发处理能力等,确保系统始终保持在行业技术前沿。通过自动化测试和持续集成,平台系统能够快速响应一线需求和用户反馈,实现快速迭代和更新。业务模式创新:平台引入流程编排引擎,通过对应急流程、任务流程的编排管理,结合重庆移动日常监控、应急指挥方面工作特点,制定出一批符合具有重庆移动特色的流程方案,能够有效支撑日常工作开展。用户体验创新:平台通过不同视角,按照人员角色进行权限、流程划分,并大数据分析和人工智能等技术,为用户提供更加简洁、直观的界面。同时平台系统
118、持续关注用户体验反馈,对界面设计、操作流程等方面进行优化和迭代,确保用户始终能够享受到最佳的使用体验。方案特点描述362024数字化业务安全生产应用案例汇编云南移动网管支撑高可用能力赋能企业安全生产案例应用单位案例实施单位案例应用领域中国移动通信集团云南有限公司北京神州泰岳软件股份有限公司通信行业需求分析为更好支撑各项生产运维及业务开展,网络管理中心对IT建设重视程度不断提高,相对应IT建设规模日益扩大,IT技术架构不断创新,对IT管理和服务的诉求体现尤为明显,其中,IT 敏捷交付与系统稳定性的冲突、IT运维体系尚未构建完成、人员的IT技能不能满足新型IT技术架构的运维要求,包括以下几点:网管
119、架构复杂带来的运维难度大问题01基础设施分散陈旧带来的稳定性问题02频繁的 IT 敏捷交付带来的系统稳定性的问题03IT 运维工具及手段不足04案例介绍随着网络和业务的不断发展,支撑各类网络和业务的应用系统不断丰富,O域面向网络和业务提供支撑,系统运行涉及的数据除了 外部输入或工单流转以外,更多的来自底层设备厂商的 OMC,设备 复杂、设备厂商多,网管系统支撑的业务场景既有监控、分析类,也有面向底层设备的自动巡检、业务开通的指令化操作,各个场景对系统运行的需求复杂度高。如何保证为 OMC、IT 技术底座、各类应用提供稳定的、高可用的网管系统端到端业务支撑能力是当下要解决的问题。通过搭建 IT
120、运维工具与平台、优化操作制度与流程、提高组织 与人员能力三方面的建设,不断丰富和优化 IT 运维支撑手段,建立体系化制度流程,深度融合运维能力,结合数字化转型,逐步构建标准化、自动化、数字化的全栈运维体系,为 O 域运维体系中 OMC、技术底座、各类综合网管提供稳定的、高可用的网管系统端到端业务支撑能力,保证各个业务系统的稳定运行。方案整体描述整个平台包含数据采集层、核心能力层、应用场景层展开,具体包括:技术架构及设计思路支持通过 IPMI、SNMP、syslog、ssh、telemetry 等多种数据采集方式支撑业务数据的接入。基于可扩展的采集插件,实现资源、性能、告警等数据的接入。将业务网
121、管所需核心能力抽象为微服务,包括 IT 监 控、资源管理、策略管理、根因分析、自动化编排设计、流程编排设计、运营分析、用户鉴权微服务。核心能力服务通过统一 API 接口对 外开放,支撑上层应用场景。基于业务实际需要共建不同应用场景,包括智能监 控、资源管理、自动化运维、变更管理、隐患分析场景。数据采集层核心能力层应用场景层37立体化全域监控面向基础设施和网管系统的运行维护提高支撑,打破烟囱式的运维,提供从硬件设施到上层业务的立体化监控覆盖能力,端到端的建立业务链条监控,通过黄金指标体系梳理,提升网管系统业务支撑高可用能力。故障智能定位通过结合告警时序分析、资源拓扑分析、业务调用点分析,故障日志
122、分析对业务系统各类故障进行综合分析定位。业务平稳运行保障业务健康度分析通过对各个业务系统的体量、架构、纳管量、用户使用感知、系统故障、系统安全、资源使用率等维度的指标进行量化分析,建立多维指业务健康度分析模型,支撑对业务系统整体健康度宏观评测,实现端到端全流程业务域维护质量自动化评估,并提供周期性的汇总分析报告,给出整体业务健康度评分、业务健康度隐患以及处理建议,为IT运维决策提供数据支撑。全息端到端可视化管理业务端到端可视以业务系统为维度,呈现各个业务系统下端口应用进程-虚拟机-宿主机-网络设备的端到端部署架构。通过对业务端到端可视能力,维护人员在了解各个系统部署架构到的基础上,还能协助分析
123、端到端资源及负荷,从而集市发现负载不均衡,单边运行、无容灾能力等隐患,帮助运维人员及时系统优化部署结构。一站式变更处置助力多部门运维水平提升变更管理基于 ITSM 规范,根据业务实际管理要求提供日常资源变更标准化流程,通过内置的变更流程对资源变更进行规范化管理,实现资源申请、资源变更、应用重启在线化一站式处理,拉齐业务支 撑人员运维水平,解决生产服务操作合规性问题。全过程深度巡检助力运维工作效率提升自动巡检基于平台自动化运维能力,通过可视化的指令编排、自动化流程编排实现业务系统巡检能力的设计,并通过定时调度任务,实现业务系统巡检的定时巡检。应用场景创新点1围绕三大业务方向创新性黄金指标提出:基
124、于业务系统历史运行特点,对多维业务健康度分析模型,调整模型中每个分析维度 的具体指标、权重和计算阈值,保证健康度分析能够真实体现业务系统运行状况。创新点2多维度隐患识别与故障定位能力:在智能故障分析场景中,系统通过结合合告警时序分析、资源拓扑分析、业务调用点分析,故障日志分析能力,提高了故障定位分析准确率,降低了运维人员的能力门槛。创新点3实现全业务端到端可观测:系统通过 lldp、arp、snmp、Telemetry、IPMI 等多种协议自动发现资源配置与资源接互联关系,并通过自动化业务路径呈现能力,实现网络端到端与业务端到端可视。方案特点描述三大业务系统故障显著下降:2023 年全年,故障
125、能力中心零项故障;从 2023 年 4 月后,电子运维系统,未发生重大系统故障;从 2023 年 9 月之后,资源能力中心,未发生重大系统故障。三大业务统一监控管理,识别潜在故障:通过对电子运维系统、故障能力中心、资源能力中心建立设备、应用、服务等统一的资源模型和黄金指标,通过统一监控,实 现潜在故障识别,并向集中故障平台传送告警,进行统一分析处理。规范资源管控流程,助力运维过程标准落地:规范资源申请、资源变更、服务启停业务流程,实现资源申请、变更实现在线化一站式处理,拉齐业务支撑人员运维水平,解 决生产服务操作合规性问题。运维管控过程可视,降低系统保障难度:增加在业务、网络、云资源之间的网络
126、可视;增加在业务、进程、数据库、主机时间的横向业务端到 端可视;针对不同网管厂商不同运维界面的入口统一。解决成效38云南移动网管支撑高可用能力赋能企业安全生产系统规划蓝图云南移动网管支撑高可用能力赋能企业安全生产业务系统一体化监控392024数字化业务安全生产应用案例汇编BSS系统容灾案例案例应用单位案例实施单位案例应用领域中国移动通信集团江苏有限公司浩鲸云计算科技股份有限公司通信行业需求分析随着数字化的不断发展,企业主要业务都需要信息化的支撑,在信息便捷化的同时,信息泄露、网络病毒、数据篡改、数据中心火灾瘫痪等人为攻击和无法预计的自然灾害从未停止,大多数受害企业缺的往往不是完美的防御系统,而
127、是数据安全的“最后一道防线”灾备。数据甚至整个IT系统的丢失,对各行各业的企业和组织影响如此之大,灾备系统建设的重要性不言而喻。案例介绍BSS业务支撑系统整体容灾方案,主要涉及CRM域系统容灾方案和计费域系统容灾方案两部分。(一)CRM域系统容灾:同城分担,跨城主备方案整体描述应用主备部署应用双机房对等部署,应用入口采用nginx做跨机房负载均衡,外部系统使用dns访问。数据层容灾物理库容灾:通过集数据同步服务组件执行数据实时同步,实现跨机房的物理库数据灾备。数据层访问:各站点CRM应用访问各自机房的数据节点。PAAS组件容灾CTGCache:生产与灾备两个节点各自独自部署一套CTGCache
128、,生产节点发生缓存刷新时通过鲸晰缓存管理组件对灾备节点缓存同步刷新;对于订单中心的产生的暂存单、销售品中心配置中的规格数据等在途数据不做主备节点的刷新。CTGMQ:生产与灾备两个节点各自独自部署,供各自业务应用使用ZK:生产与灾备两个节点各自独自部署,供各自业务应用使用容灾管理提供统一容灾管理能力,实现所有应用中心、PAAS、数据库的统一监测以及配置管理,提供统一监控大屏、统一管理切换策略及切换任务编排等能力。(二)计费域系统容灾:同城分担,主备双活接入层容灾省内SR:网关双活模式,按权重分发,由SC确定权重负载均衡器:NGINX:主备模式,外部采用域名访问,灾备切换通过域名切换实现。域名服务
129、器提供灾备入口IP切换。负载均衡F5:主备模式,由F5实现灾备切换。应用容灾充值中心:应用灾备。平时生产节点对外服务,灾难时灾备节点接管业务。账务中心:应用双活模式,数据灾备。平时灾备两套应用负载均衡对外服务,充分利用灾备应用主机资源,任意节点灾难时,另外节点接管全部业务流量。支付中心:应用双活模式,数据灾备。平时灾备两套应用负载均衡对外服务,充分利用灾备应用主机资源,任意节点灾难时,另外节点接管全部业务流量。策略中心:应用双活模式,数据灾备。平时灾备两套应用负载均衡对外服务,充分利用灾备应用主机资源,任意节点灾难时,另外节点接管全部业务流量。40数据容灾MDB核心数据(写库):主要是账务数据
130、、累积量、实时账单等数据,由MDB实现灾备实时同步,正常时,生产节点MDB持久化到生产节点udal+teledb的同时,也同步一份到灾备节点MDB集群。灾难时,灾备节点MDB集群切为在用,并开启灾备节点的持久化服务。MDB资料数据(读库):主要是资料数据,由MDB刷新应用从teledb同时刷新生产MDB和灾备MDB集群节点。物理数据库:通过IDC跨机房实时同步工具实现灾备节点数据的实时同步。PAAS组件容灾CTGMQ:生产与灾备两个节点各自独自部署一套CTGMQ,给各自业务应用使用。CTGCACHE:生产与灾备两个节点各自独自部署一套CTGCACHE,由参数刷新应用支持同步刷新两个节点的缓存,
131、业务应用各自使用自己的CTGCACHE。ZK:生产与灾备两个节点各自独自部署,供各自业务应用使用。容灾管理提供统一容灾管理能力,实现所有应用中心、PAAS、数据库的统一监测以及配置管理,提供统一监控大屏、统一管理切换策略及切换任务编排等能力。面向用户,需要确保前台web、营业受理、集团侧业务查询、充值、缴费复机、余额管理、费用管理等大类核心业务服务,能够应对区域性灾难,保证业务永不中断。同时以外部客户感知为主要驱动力,建立分级分类的IT容灾能力及可靠的灾备运营体系,提供电信级IT服务。技术架构及设计思路CRM域容灾技术架构计费域容灾技术架构41应用场景方案特点描述解决成效对关键业务运行要求最高
132、的通信业,每次计算机系统宕机导致高额资金损失,同时还会对公司声誉等带来严重的无形资产损失。主要场景涉及CRM域系统容灾和计费域系统容灾两类。(一)CRM域容灾方案特点丰富的业务应急预案交互请求暂存重送机制:对于营业受理异步的交互接口,提供业务应急消息队列,将集团上行交互请求加入消息队列,等待重送。业务开关机制:对于不产生业务中断且业务危害性较低的接口提供业务开关,临时关闭接口的调用。一键转预受理模式:对于产生中断业务受理相关据接口出现灾损故障时,提供一键转预受理单。应用缓存可视化同步刷新主备节点缓存统一管理:主备节点缓存统一管理,对主备节点同步刷新管理同时提供缓存对象可视化管控能力。主备节点一
133、点巡检:对主备节点数据缓存数据自动化巡检,对缓存对象不一致异常校验并实现异常修复。缓存变更轨迹管控:对主备节点缓存数据变更情况持久化,提供后续业务审计或业务稽核。(二)计费域容灾方案特点应用内存化核心功能内存化:面向终端用户的核心功能内存化,脱离对物理库的依赖。MDB灾备同步:实现MDB跨机房实时同步,同步冲突数据修复管理。应用读写分离应用读写分离:查询类与交易类应用代码解耦,单独镜像发布以支持双中心交叉热备。422024数字化业务安全生产应用案例汇编以场景驱动的数字化运维场景平台案例应用单位案例实施单位案例应用领域广发证券股份有限公司广发证券股份有限公司证券行业需求分析面对当前稳定性保障领域
134、越来复杂的挑战,我司深刻意识到需要利用数字化思维重塑运维工作场景,以打造一个全数字化的工作空间。为此我们启动数字化运维场景平台的项目,其重点解决以下4个痛点:依赖专家经验,无法建立平台化管理模式01工具以烟囱式建设为主,互联互通程度不够02稳定性保障的平台需求多,无法快速响应平台需求03过度依赖专家个人经验来构建稳定性保障机制,造成了知识壁垒,使得“感知、决策、执行”的闭环流程难以有效实施。这不仅阻碍了信息的流通与共享,还限制了团队间的协同效率。需引入数字化策略,将专家经验转化为可复用、可传承的知识资产,并嵌入到平台化管理模式中。通过建立平台化管理模式,实现知识的集中管理与智能推荐,打破信息孤
135、岛,提升团队的整体协作与决策能力。现有的运维工具多以解决单一问题为目标进行设计,形成了众多的信息孤岛。运维人员在实际操作中不得不频繁切换工具界面,不仅降低了工作效率,还浪费了宝贵的开发资源。应推动运维工具的整合与统一,构建一套低门槛、易扩展的运维平台。该平台应能够无缝集成多个工具的数据、执行与流程,实现运维操作的集中化与自动化。同时,通过提供标准化的API接口与数据交换机制,促进不同工具之间的互联互通与数据共享。稳定性保障工作对平台的即时响应能力提出了高要求。然而,现有的烟囱式工具往往无法快速适应平台需求的变化与迭代。这导致在面对生产故障、运行评估、风险挖掘等紧急情况时,无法迅速提供有效的解决
136、方案。应构建一个敏捷的运维前台与可共享的运维数据与业务中台体系。该体系应具备高度的灵活性与可扩展性,能够迅速响应平台需求的变化。稳定性保障琐事工作多,需打造人机协同的工作方式04稳定性保障工作涉及大量重复性、操作性强的琐事任务,这些任务不仅占据了员工的大量时间与精力,还影响了其计划性、工程性与主动持续优化性工作的开展。此外,频繁无序的被动工作还给员工带来了严重的情绪压力与职业倦怠感。需要引入AIOps、ChatOps、LLMOps等先进技术手段,将重复性、操作性强、协同性、管理督办等琐事任务交由智能机器人与自动化工具处理,打造一种高效、智能、人性化的运维工作方式。这样不仅可以减轻员工的工作负担
137、与情绪压力,还能提升运维工作的整体效率与质量。案例介绍数字化场景平台,在我司的数字化运维体系中承担数字化工作空间的位置,其融合了“组织、流程、平台”的能力。我司以数字化场景建设代替经验运维模式,梳理并映射运维工作的各类场景,形成运维工作场景全景图。通过将管理规范、人员技能、流程标准等关键要素深度融合至线上平台,推动运维工作的全面数字化、自动化与服务化转型。打造出一个高效、智能、可持续进化的数字化运维工作空间。在场景平台设计上,我司实现一个灵活、可快速响应的运维场景前台,其能够紧密对接一线运维需求,包括生产故障处理、运行状态评估、风险隐患挖掘、变更交付、自动化操作、周末测试等上百个工作场景,能实
138、现快速响应与有效处理。在技术实现上,在构建一个敏捷场景前台、可共享运维业务中台与数据中台以外,还引入ChatOps、LLMOps等能力,将线上化场景与机器人连接在一起,形成平台化管理模式。平台支持工具体系中各工具数据、流程、执行的整合,提供运维工作台、场景工具集、API统一管理、运维开发PAAS等手段,提高运维工具开发、运营工作的效率。方案整体描述43面对基础设施云化、应用架构微服务化、服务中台化、业务数智化及技术信创化等多重复杂挑战,我司秉持价值导向原则,深化“1234”战略框架,构建“组织协同、流程优化、平台赋能、场景创新”四位一体的运维数字化生态体系。通过平台化管理模式的创新,实现“安全
139、筑基、稳定护航、引领创新”的战略愿景,为公司数字化转型提供坚实支撑。对于整体的技术,我司总结为“1234”框架思想,其包括:技术架构及设计思路广发证券数字化运维体系图1张数字化运维全景场景地图在模型开始训练之前,各参与方需要共享加密后的用户id数据,同步给其他参与方进行id对齐。2项“人机协同”核心能力着眼技术赋能,我们推动“人(专家经验)+机(平台、机器人、数据等)”的工作模式,提升运维决策的智能化水平,减轻人工负担,加速问题解决速度。3条全链路数字化价值链流程其重点包括故障管理(包括前、中、后)的故障管理、IT资源(含系统、硬件、软件等)变更交付与退出管理、IT服务交付。4大“监管控析”技
140、术平台其包括:监管平台、IT服务平台、自动化操作平台、运维数据分析平台。123444本案例的IT运维场景平台着力于解决金融业内稳定性保障的安全生产问题,通过利用数字化手段重塑运维场景,融合了运维“监控、服务、操作、分析”平台能力,构建了一个数字化场景的工作空间,建立了平台化管理模式。项目适用于金融等对业务连续性和数据安全性要求极高的领域与行业。场景重塑:运用“流程标准化+工具集成化+数据驱动化+ChatOps即时化”的组合拳,彻底改造运维工作场景,提升工作效率与质量。机制保障:构建严谨规范的运维流程体系,确保场景执行的有序性与高效性。数据赋能:将运维规则与标准数字化,通过实时数据分析,精准评估
141、工作执行效果。风险感知与响应:建立智能预警系统,及时发现并在线推送风险信息,确保问题得到快速响应与处理。持续迭代优化:构建开放包容的反馈机制,鼓励一线专家与管理层积极参与,不断完善平台管理机制与规则。场景互联与协同:打破信息孤岛,实现场景间的无缝互联与资源共享,通过ChatOps强化人、事、场景之间的紧密联系,推动运维工作向更深层次、更广领域发展。数字化运维场景平台要素细化资源优化与功能整合构建了上百个在线运维场景,融合底层已有的平台能力,消除资源冗余与功能重复,大幅提升运维资源利用效率与成本效益。平台化管理模式升级融合多元能力,实现工作场景全面数字化,提升运维流程效率与灵活性,提升“感知、决
142、策、执行”闭环的平台化管理能力。人机协同深度融合超过700个ChatOps机器人与人紧密协作,提升工作效率,加速知识传播与积累。专家经验数字化传承场景化沉淀专家经验,数字化技术提升场景效能,确保运维决策精准高效。大模型与运维融合创新探索LLMOps等前沿技术,引领运维智能化转型,应对复杂运维挑战。自主可控与敏捷响应自研信创平台,保障系统安全可控,敏捷响应紧急需求,稳固业务运行基石。项目成效452024数字化业务安全生产应用案例汇编上海虹口区智能小虹案例应用单位案例实施单位案例应用领域浪潮云信息技术股份公司浪潮云信息技术股份公司政务行业需求分析在虹口区基层治理领域引入上海虹口区智能小虹之前,该领
143、域面临着一系列迫切的需求、痛点以,这些情况详细说明了实施该案例的必要性。相关需求01信息快速响应:随着信息化时代的到来,基层治理需要能够快速响应社会需求和问题,对政策、法规、数据等信息进行快速查询和反馈。智能化辅助决策:面对日益复杂的治理环境,政府需要借助智能化手段,对海量数据进行分析,为决策提供科学、准确的依据。提升公众满意度:通过提供更便捷、高效的服务,提高公众对基层治理工作的满意度和信任度。现存痛点02信息查询困难:传统的信息查询方式效率低下,且信息分散,难以快速找到所需内容。数据分析不足:缺乏先进的数据分析工具和方法,导致政府难以从海量数据中提取有价值的信息,支持决策。服务效率不高:政
144、府服务流程繁琐,办理时间长,导致公众满意度不高。案例介绍针对上面基层治理中的痛点,虹口区政府通过调研主流的技术及厂商,最终确定使用大模型来解决当前问题,并且通过组织业务和技术的研讨,为了使用大模型智能的能力以及知识的精准性,最终确定使用大模型知识库的方式,对基层治理相关的政策文件、办事指南、典型案例等文件进行训练,并最终形成智能问答和知识检索两类输出能力。虹口区政府深刻认识到当前基层治理面临的需求、挑战和痛点,因此提出以“智能治理、数据驱动、服务优化”为核心的总体应对思路。通过引入和应用先进的信息技术手段,如人工智能、大数据等,构建上海虹口区智能小虹,实现基层治理的智能化、精准化和高效化。方案
145、整体描述短期目标完成上海虹口区智能小虹的研发与部署工作,实现基本功能的稳定运行;对基层工作人员进行初步培训,提高他们的信息技术能力。中期目标优化和完善模型的功能和性能,拓展应用场景;加强数据分析和决策支持功能的建设;对基层工作人员进行深入培训,提高他们的模型使用能力和数据分析能力。长期目标持续推动智能治理的创新和发展;加强与其他城市或地区的合作与交流;探索新的技术应用和模式创新;不断提升基层治理的智能化水平和服务质量。12346整个上海虹口区智能小虹采用分层解耦的分层方式,整体分为五层:大模型开发平台(ModelOps)、海若大模型层、Agent组件层、Agent工厂、场景应用层,通过各层之间
146、的交互协同,为各种业务场景提供高效、稳定、安全可靠的模型推理服务,实现从基础算力、模型训练、推理服务到应用场景的完整闭环。上海虹口区智能小虹的设计思路是深度融合政府基层治理的业务需求、数据资源和技术能力,构建一个高效、智能、安全的政务服务模型。通过数据挖掘、自然语言处理、深度学习等技术手段,实现对政务数据的智能分析和处理,为政府决策提供科学依据,提升政府服务的效率和质量。模型的功能框架主要包括智能问答、智能问数、摘要生成以及数据可视化等功能模块。智能问答模块负责解答民众关于政策、服务等方面的疑问;智能问数模块则负责对海量数据进行深度分析,为政府决策提供数据支持;摘要生成模块能够自动梳理和生成政
147、务信息摘要,提高工作效率;数据可视化模块则将分析结果以直观的方式呈现,便于理解和决策。技术架构及设计思路本案例通过大模型技术解决基层治理中遇到的各种问题,有效的提升了工作效率以及老百姓的满意度,并且具有复制推广性。上海16个区推广复制智能小虹收录的知识库除部分区级特有的政策指南外,大部分适用于全上海市,其中的社区治理案例可适用于其他区,因此知识库稍做改动即可16区推广。知识内容拓展推广通过智能小虹构建的大模型政务知识框架,通过知识库内容的替换,可以快速应用到政务其他相关领域,如就业大模型、养老大模型等。其他省市推广智能小虹政务大模型的应用场景和应用模式可以在全国各省市进行推广,利用为基层减负增
148、能的理念,打响全国政务大模型减负增能战役。应用场景提高治理效率,降低行政成本上海虹口区智能小虹通过运用先进的大数据、云计算和人工智能技术,对基层治理的各项数据进行整合和分析,实现了对社区、街道等基层单位的高效管理。这不仅大大提高了治理效率,还降低了行政成本。例如,通过智能化的数据分析,模型可以预测并优化社区资源的配置,减少资源浪费;同时,模型还可以自动化处理一些常规性的行政事务,减轻基层工作人员的工作负担,降低人力成本。优化决策过程,提升政策效果上海虹口区智能小虹的应用,使得虹口区政府在决策过程中能够获取更加全面、准确的数据支持。模型通过对海量数据的深度挖掘和分析,可以揭示出数据背后的规律和趋
149、势,为政府决策提供科学依据。这有助于政府更加精准地把握问题实质,制定更加符合实际情况的政策措施,从而提升政策效果。(1)利用大模型技术解决基层治理日常工作中的时效性和精准度问题;(2)通过大模型技术实现基层治理案例的分享和经验知识的传播;(3)大模型私有化部署,建立客户专有的知识库,实现知识的精准问答和推荐。方案特点描述解决成效47促进产业升级,推动经济发展上海虹口区智能小虹在基层治理中的应用,也推动了相关产业的发展和升级。例如,随着模型在智慧城市、智慧社区等领域的广泛应用,这些领域对技术、人才和资金的需求不断增加,促进了相关产业的快速发展。同时,模型的应用还推动了政府与企业、高校等机构的深度
150、合作,促进了产学研一体化的发展,进一步推动了虹口区经济的繁荣。提升公共服务水平,增强民生福祉上海虹口区智能小虹的应用,使得虹口区政府能够提供更加高效、便捷的公共服务。例如,通过智能化的数据分析,模型可以预测并优化公共资源的配置,提高公共服务的覆盖率和质量;同时,模型还可以实现线上线下的融合服务,方便居民随时随地获取所需的服务信息。这有助于提升居民的满意度和幸福感,进一步增强民生福祉。上海虹口区智能小虹架构图482024数字化业务安全生产应用案例汇编金融行业信创安全运营中心解决方案案例应用单位案例实施单位案例应用领域北京优特捷信息技术有限公司北京优特捷信息技术有限公司金融行业需求分析信息技术应用
151、创新发展是目前的一项国家战略,也是当今形势下国家经济发展的新动能。发展信创是为了解决本质安全的问题,将底层技术、信息安全、数据保存方式掌握在自己手中,不再受制于人。随着金融科技数据分析难度大01自研成本高、存在技术风险 02存在安全漏洞和版权风险03目前的开源软件普遍存在入库延迟、搜索耗时长、进行大数据量查询时常崩溃、解析困难等诸多问题,低可用性的数据分析平台大大增加了运维人员进行数据分析的难度。自研平台需要开发和运维人员进行维护,企业内部成本很高;ES等很多开源软件都是国外厂商维护,没有中国本地化支持团队,售后能力差,而业内多数运维和开发人员经验不足,比较依赖厂家经验。很多开源软件安全漏洞频
152、发,其潜在风险要远远大于闭源软件;由于政治风险和不可抗力因素,开源软件随时可能被禁用。的不断发展,基金公司需要跟上数字化转型的步伐,进行信创改造可以使其更好地适应数字化时代的需求,提高业务效率和服务质量。为此行业内也做了许多革新与尝试,如:核心交易等系统采用基于Elasticsearch的日志检索集群。在开发迭代初期,机器数据价值挖掘需求得到了改善,但是随着业务的高速发展和数据规模的增长,现有的基于开源软件的数据分析方案暴露出了以下问题:在意识到基于开源软件的数据分析方案的缺陷后,在内部进一步探索的过程中暴露了以下问题:信创兼容能力不足导致信创改造难以推动01海量数据分散存储导致信息孤岛02数
153、据保护措施欠缺导致数据安全难以保障03数据分析能力不足导致业务监控分析需求难以满足04安全事件自动化响应缺乏导致安全威胁风险增加05内部异常行为风险普遍存在06案例介绍1.大数据平台计算性能大幅提升:本项目采用国产高性能计算服务器、操作系统+国产自研搜索引擎Beaver,从根本上实现信息技术创新应用,从核心计算能力上较开源软件(如:ELK)性能提升200%。2.大数据平台数据查询能力大幅提升:在新一代核心交易系统黄金指标实时分析使用场景上线后,亿级日志数据查询耗时从5分钟缩短至4秒。人工查询黄金指标数据的操作耗时从之前的30分钟缩短至1分钟,极大的节省人力,并且有效的提高分析效率和异常定位速度
154、,提升系统稳定性。3.运维与安全一体化:本方案的信创低代码大数据分析平台将公司内部所有安全数据、业务系统产生的机器大数据进行综合治理,统一数据口径,按照用户需要分配数据应用权限,所有数据分析工作在该平台上执行,既能满足法律法规要求,又能够节省多平台建设带来的成本。4.自动化封禁:判断攻击源封禁时间+定时将观察列表IP封禁,PA封禁阻断待分析补充剧本等个性化流程,大大解放人力,提升威胁处置效率。方案整体描述49本方案包括数据层、分析层、处置层、展示层,本方案各模块功能描述如下:数据层是数据处理的地基,将数据整合并展示给应用程序或其他系统使用。分析层使用机器学习算法进行数据挖掘和分析,以及形成基础
155、的关联分析模型和行为分析模型,检测到网络中的异常行为,通过不断更新威胁规则库和采用先进的网络安全技术,我们可以更好地应对不断演化的网络威胁,并确保网络的安全性和稳定性。处置层负责阻断攻击,在发现风险或威胁时及时采取各种措施,包括通过人工的方式操作或者通过自动化剧本进行自动化的处置,无需人工介入。遇到复杂场景时,还可以创建工单,在不同团队、不同人员之间进行流转。展示层负责将分析结果以可视化的方式展示给用户,提供直观的数据展示和交互体验。包括仪表盘、3D大屏和报表等多种可视化展示方式,用于展示关键指标和业务趋势并且支持用户自定义报表和数据可视化内容,以满足不同用户的需求。技术架构及设计思路本案例可
156、应用于各类金融行业用户的集团总部,通过接入现场各安全设备日志,以及业务系统访问量日志,综合关联分析,客户不再需要到各个安全设备去了解系统安全情况。通过安全运营中心的建设,可加强内部安全运营,防范网络攻击,确保基金公司的业务正常运行和资金安全。应用场景夯实信创高性能计算基座本项目采用海光X86计算服务器+国产自研搜索引擎Beaver,从根本上实现信息技术创新应用,从核心计算能力上较开源软件(如:ELK)性能提升200%。创新应用本项目中采用的数据分析建模工具(Search Processing Language)和数据治理工具(数据工厂)在数据分析建模与数据治理工作中真正实现了低代码作业,使其在
157、企业应用成为可能,将数据分析模式由纯手共开发编码到界面操作全自动化,减少重复劳动,提升分析效率的同时增强分析人员的分析能力。方案特点描述基金行业核心交易系统对性能和时延都有很高的要求,从日志数据进行分析,可在不影响系统性能的条件下实时获取关键业务指标,同时可对跨系统关联性的指标进行级联分析,全面洞察业务流中各项指标,及时发现异常环节,有效辅助业务运维提升业务安全保障能力。本方案有别于传统的探针采集数据方案,通过无侵入式的分析应用日志数据,快速、低成本的实现核心数据的分析需求,将指标数据分析的需求实现时间从原来的35天降低至23个小时,并且具有很高的安全性和可靠性,不会对交易系统本身产生任何影响
158、。该方案中的工具和技术也可以根据其他公司的具体需求进行调整和扩展,具有一定的灵活性和可定制性,具备向同业推广的价值。解决成效金融行业信创安全运营中心解决方案产品架构502024数字化业务安全生产应用案例汇编主题公园业务安全生产设备管理平台案例应用单位案例实施单位案例应用领域深圳华侨城花橙科技有限公司欢乐谷文化旅游有限公司软件行业需求分析01、规范业务流程,并助力标准化落地。设备安全运行、园区安全运营流程结合规范制度,优化系统功能、报表与作业流程,充分发挥公司化资源配置优势,实现成本、效益、安全整体绩效最优。02、加强安全管控,实现业务管理闭环。满足景区日常运营安全管理需要、系统标准化实施需求,
159、为园区安全管理提供必要的手段和工具,实时全面、准确把握园区安全运营的状况,实现预防为主、管控为辅的闭环管理。03、降低维护成本、提升维护精益管理。通过设备健康、安全的运行管控,实现减少设备停机时间,让设备使用效率、经营管理效率得到全面提升。成本实际发生时间与设备维修、保养记录实现信息同步,便于统计实际发生费用,降低维护、库存成本。04、完善交互体验,实现技术自主可控。实现更方便、快捷、高效的用户交互体验。采用更加开放的底层软件技术和数据库技术,实现敏捷迭代,提高系统的开发效率和软件生命力,为后续统一的高效信息化平台夯实基础。05、满足业务要求,助力创新应用场景。满足更多的业务需求与创新应用,诸
160、如AI安全巡检、数据互联、物联安全监控,促进数字化转型智能化发展。案例介绍方案整体描述花橙科技通过数字化转型赋能企业运营安全管理能力,满足国家要求、经营需求、规范安全体系、助力安全标准化落地、提升安全精益管理与用户体验,打造“共创、融合、自主、赋能、拓展”文旅行业模板,逐步实现盈利与创收。1精准定位、快速实施、由繁化简、系统联动、提升效率。系统主要围绕安全基础(设备运行安全与园区运营安全)运营支撑平台搭建与系统集成扩展,实现风险分级管控、安全隐患整改、事故事件管理、设备预防性维护管理、安全预警、应急管理等内容。2目标思路搭建主题公园运营及安全标准管理体系,将外部环境及内部运营、设备安全、品质服
161、务、绿色发展等各个维度的关键指标进行收集拆解。集合国内游乐设备类型全覆盖(动力和无动力)与海量设备相关数据的知识资源,规范化、标准化的定义统计方法和测算公式,利用平台实现数据管理、深度分析与AI算法,实现对设备安全运营情况的常态化监测与预警,精准务实地将运营数据资产转化为辅助安全生产的行动指引。3实现花橙科技重视软件顶层设计,以主流云为基础架构,快速、高效地搭建平台,支持SaaS多租户模式且满足彼此之间的数据和配置隔离,实现数据隔离、用户身份验证和权限管理,充分保障系统的可持续、安全、高可用性。支持 Java 版本,Java 的 JDK 1.8或更高,支持多种数据源配置方式、多种控制器类型、视
162、图、缓存、安全日志类型;业务综合信息查询功能,并支持全文检索及信息模糊查询功能,以方便用户查询和使用系统;批量导入现有的业务主数据并具有一定的排错、匹配功能,业务主数据经过整理可一次性直接导入该系统并保证其准确性技术架构及设计思路随着国家针对企业生产和运营安全的越发重视,通过软件研发升级(IoT、AI+、数据资产、低代码平台),打造设备运行安全和园区运营两个针对性的业务板块,满足欢乐谷公司在安全管理方面从传统的主题乐园管理模式走向数字化、智能化等多元化管理手段,以及落实文旅业务形态在企业安全运营方面的日新月异的业务要求和技术要求,创新运营解决方案,实现资产物联化、业务协同化和决策智能化,以规范
163、运营为前提、客户服务为导向、自主可控要求为依托,进一步落实信息系统安全防范要求,推动企业数字化转型,赋能企业资产全生命周期管理能力。应用场景51多业态融合可根据文旅业态进行系统规模切换,适用于商业综合体、景点景区、旅游小镇、度假村、文创园、开放式景区、主题乐园等多业态。通过预埋封装,能够支持各业态的设备、资产以及内控相关的基础功能,同时也支持定制化扩展功能,能够快捷,准确,安全的部署和上线,具备很高的经济价值。低代码平台针对文旅行业设备、资产以及内控各业务、数据、管理、痛点、需求等各个维度进行收集后,有针对性的分析和解析,通过核心团队在文旅行业设备、资产以及内控业务以及研发经验,依托最新的可控
164、开源技术打造出的一个高效率、高开放性、高迭代行、高易用性且具备商业价值的一个行业低代码平台。其特点有:IOT辅助平台本平台已具备与视频厂商、国内(包含台湾制)主流传感器等各类物联网前端通用接口(例如可通过工单时间戳与摄像头时间戳匹配后,直观查看工单当期工作的作业视频以及安全行为分析等功能),可即时高效、准确的对接。超级工作流以BPMN2.0做为基础进行自研,高自由度,高可控性、高追溯性、高效率的超级工作流。支持用户自己定制工作流、同时支持退回节点自由配置、发出节点自由配置、流程在途过程中无感修订,变更等各类特殊操作,系统来记录每一步操作环节,可以即时退回和记录流程在途时间和操作详细记录,保证用
165、户在内控方面工作流的各种各样的需求。自定义数据集通过平台预埋数据埋点,让用户实时获取业务数据,展示结果和方式由用户定义,以报表形式、KPI图标式等等输出结果,将数据的使用和获取能力完全赋能给用户。方案特点描述降低事故成本:通过数字化手段及时发现和处理安全隐患,减少事故发生的可能性,从而避免因事故导致的人员伤亡、财产损失和生产中断等直接和间接经济损失。提高生产效率:保障安全生产环境,使员工能够更高效地工作,减少因安全问题导致的停工、返工等情况,提升生产效率。优化资源配置:数字化安全管控能够更精准地掌握园区安全状况,合理分配资源,避免资源浪费。提升公司声誉:良好的安全记录有助于提升公司在市场上的声
166、誉和竞争力,吸引更多客户和合作伙伴,带来潜在的经济效益。促进风险管理:更好地进行风险评估和管理,提前采取措施,降低风险发生的概率和影响,为公司稳定发展提供保障。解决成效主题公园业务安全生产设备管理平台技术架构图地址:北京市海淀区花园北路52号邮编:100191邮箱:2024年9月Copyright 2022 企业数字化发展共建共享平台 保留一切权利免责声明:虽然企业数字化发展共建共享平台试图在本资料中提供准确的信息,但不保证资料的内容不含有技术性误差或印刷性错误,为此企业数字化发展共建共享平台对本资料中信息的不准确性不承担任何责任。企业数字化发展共建共享平台保留在没有任何通知或提示的情况下对本资料的内容进行修改的权利。C