《11-基于 Kubernetes 的电力行业虚拟化平台大规模应用与实践 - 王李明段祥.pdf》由会员分享,可在线阅读,更多相关《11-基于 Kubernetes 的电力行业虚拟化平台大规模应用与实践 - 王李明段祥.pdf(18页珍藏版)》请在三个皮匠报告上搜索。
1、基于Kubernetes的电力行业虚拟化平台大规模应用与实践目录背景&需求01未来&展望03技术&实践02Content背景&需求Part 01数据中心基础设施建设的新要求为加速“三商”转型与数字电网建设,为新型电力系统建设提供强大算力支撑,同时积极推动电力行业算力与电力深度融合,助力数字经济与低碳经济发展,南方电网制定了“3+1+X”数据中心规划。其中“X”主要是利用现有省级、地市级信息机房以及变电站等空闲土地资源,建设小微规模的分布式数据中心,满足边缘计算需求。一个海外数据中心(香港)三个区域中大型超强算力数据中心南网基地、棠下中心(同城双活)广州数据中心群落惠蓄近备数据中心贵州南方能源大
2、数据中心(贵州贵安新区)数据近线备份双中心互为异地灾备X个边缘计算节点广东电网公司分省公司、变电站小型数据中心深圳供电局分省公司、变电站小型数据中心云南电网公司分省公司、变电站小型数据中心贵州电网公司分省公司、变电站小型数据中心广西电网公司分省公司、变电站小型数据中心海南电网公司分省公司、变电站小型数据中心“3+1+X”数据中心总体布局满足新型电力系统需求的分布式云架构边缘集群边缘一体机变电站区域云裸机集群信创云超算平台GPU资源池多个区域1个中心全网统一服务个性化服务安全中心全网统一云平台管理区域区域云算力、超大裸机算力、信创云算力、超算算力、GPU资源池边缘变电站,N个边缘一体机边缘一体机
3、变电站边缘一体机边缘一体机电力省级云平台电力中心云平台地市边缘算力集群100+4W+100+地级市节点数云平台大规模边缘算力集群建设难点l 传统云平台IaaS和PaaS独立l 异构集群统一管理困难l 灵巧标准高效的算力硬件供给困难算力管理算力安全算力操作系统算力基础设施l 云平台功能合规要求不能满足电力标准l 智能化云资源跨平台弹性伸缩能力缺失l 大规模集群云边协同困难l 云-边-端完整防护技术缺失难点/痛点问题关键技术l 大规模硬件远程运维安全能力缺失l 小规模算力无法满足高性能应用要求关键技术:超融合架构的云数一体机关键技术:基于软硬协同的算力加速卸载技术关键技术:基于kubernetes
4、的轻量化云关键技术:全栈国产化和IPV6适配关键技术:大规模云边协同技术关键技术:基于CaaS的分布式云原生技术关键技术:深度学习的云原生弹性伸缩技术关键技术:云边安全协同技术l 自主灵活可控三者不能同时满足技术&实践Part 02关键技术1:基于kubernetes的轻量化云Kubernetes平台KubevirtKubeOVNCSI多租户云平台轻量化一键安装部署云边端协同信创软硬融合IaaS+PaaS融合多集群融合管理高性能存储算力卸载RDMA网络硬件流表转发NUMA调度裸金属虚拟化云原生虚机HA多存储支持芯片数据校验可信计算保证存储多副本存储多活虚拟机容器组件市场DevOps微服务统一日
5、志云监控运维联邦集群国产化硬件基于Kubernetes底座实现技术统一的IaaS和PaaS融合平台,既保留了Kubernetes云原生带来的强大扩容、调度、扩展和微服务治理能力,也从底层架构上保证了平台的可靠性和技术先进性,同时依托Kuberntes灵活的扩展能力和强大的技术生态可实现对云平台的快速赋能。关键技术2:全栈国产化和IPV6适配1.适配泰山、烽火、曙光、浪潮等多款国产服务器1.个别型号网卡识别不到:驱动升级2.个别型号网卡丢包严重:驱动升级3.个别型号硬盘识别不到:硬盘故障4.个别型号硬盘直通设置失败:BMC升级2.适配麒麟v10sp1/sp2/sp3、统信、欧拉、龙蜥等多款国产操
6、作系统1.操作哦系统自带的runc和容器运行时的runc冲突导致容器启动异常,升级runc2.KylinV10Sp2上启动的虚拟机IOError,内核版本不兼容,升级内核3.NetworkManager在某些场景下聚合网卡失败,使用network接管网络3.适配华为、华三、Xsky等多款存储服务1.个别厂家的CSI驱动偶尔会导致虚拟机无法热迁移2.多路径服务异常导致虚拟机故障4.国产化改造多套软件/组件1.累计改造ARM镜像超过100个2.累计改造组件超过20个,比如redis、harbor、kubevirt、multus、minio等5.全栈适配IPV61.操作系统、Kubernetes、C