《时奎亮-oc维稳之道.pdf》由会员分享,可在线阅读,更多相关《时奎亮-oc维稳之道.pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、OpenCloudOSOpenCloudOS社区社区 时奎亮,邢万里时奎亮,邢万里2024-3-302024-3-30OpenCloudOSOpenCloudOS 维稳之道维稳之道-如何打造系统可用率如何打造系统可用率6 6个个9 9的自主操作系统的自主操作系统时奎亮:腾讯内核专家 OpenCloud Kernel 维护者 Linux 内核峰会,LPC 邀请讲师 前Linaro Stable Kernel,Linux Kernel Performance 维护者OpenCloud OS 简介简介LinuxLinux行业现状行业现状发行版玩家L1L2L4L3开源软件社区社区稳定版(经企业大规模验
2、证):基于L2的重编译或定制优化上游发行版:Linux内核+GNU组件+其他开源组件企业版:L1版本加固+技术支持/服务社区衍生版:基于L3优化改造的发行版RedHat体系SUSE体系Debian体系红帽不再维护CentOS8;国产OS对其强依赖,影响较大;开源软件供应链存在安全风险行业问题:开源供应链安全风险L1上游发行版需聚焦多方协同开发,投入大,社区版本未经过大规模生产环境验证,非稳定版本,无法直接用于生产环境L1国产发行版不足L3/L4社区聚焦版本的稳定和生产价值,但需要依赖可靠上游版本(商业版本);L3/L4国产发行版不足OSV商业版L2国产商业版本稀缺。主要原因是上游社区维护能力与
3、投入不足L2国产商业版不足OpenCloudOS体系CentOS CentOS 官方停服时间:官方停服时间:CentOSCentOS 8 8:20212021年年1212月月3131日日;CentOSCentOS 7 7:20242024年年6 6月月3030日日OpenCloudOSOpenCloudOS的社区定位的社区定位社区愿景社区愿景由操作系统、软硬件厂商与个人共同倡议发起的操作系统社区项目,提供自主可控、绿色节能、安全可靠、高性能的下一代云原生操作系统,与生态伙伴一起打造中立的操作系统开源生态。社区定位社区定位从自主可控源社区(L1)、商业版(L2)、到社区稳定版(L3)的全链路覆盖
4、,输出经海量业务验证的企业级稳定操作系统版本。避免断供风险,为行业提供可控的操作系统的上下游供应,做中国操作系统全链路供应标杆。社区定位下一代云原生操作系统,与社区定位下一代云原生操作系统,与合作伙伴一起,全力支持合作伙伴一起,全力支持OpenCloudOS社区的建设。因为社区中立的属社区的建设。因为社区中立的属性,以每月发展性,以每月发展20+伙伴的速度,吸引到伙伴的速度,吸引到500+企业积极投入并且共同推动社区的繁荣发展,企业积极投入并且共同推动社区的繁荣发展,通过建立开源生通过建立开源生态来巩固开源项目的行业地位。态来巩固开源项目的行业地位。操作系统可用率操作系统可用率系统可用率定义(
5、系统可用率定义(Availability)操作系统可用率操作系统可用率系统可用率定义(系统可用率定义(Availability)操作系统可用率操作系统可用率操作系统可用率的行业要求操作系统可用率的行业要求可用率 AX 个 9每年停机时间(分钟)适用产品0.9993 个 9500电脑或服务器0.99994 个 950企业级设备0.999995 个 95一般电信,金融设备0.9999996 个 90.5更高要求电信级设备OpenCloudOpenCloud OS OS 如何到达系统可用率如何到达系统可用率6个个9全面强化内核质量减少内核宕机针对具体系统故障分别应对加快内核恢复时间如何全面强化内核质
6、量如何全面强化内核质量内核代码构成具体内容5.4/6.6 LTS5.4.32/6.6.20,5.4.79/6.6.xx,5.4.203,5.4.241 社区特性回合Io_uring,BPF,Perlrulock,Damon,MGLRU 供应商驱动CPU,GPU,网卡,存储卡,RDMA 专有特性如意,悟净,悟能,各种业务优化 内核代码构成内核代码构成内核内核CICI系统系统Intel 0day 测试测试内核代码构成内核代码构成 供应商驱动供应商驱动供应商驱动管理供应商驱动管理供应商驱动问题多的原因:最新驱动没有针对OC内核做适配,导致 bug多,供应商解决