1、1演讲嘉宾:刘向阳美的集团首席信息安全官(CISO)兼软件工程院院长欧洲科学院院士、IEEE Fellow、IET Fellow、ACM杰出科学家赋能AI与AI赋能的多云统一数据平台2美的简介美的集团:3000+亿ToC(智能家居),1000+亿ToB(楼宇科技、工业技术、机器人与自动化,美的医疗、安得物流)。根据美国商业专利数据库(IFI Claims),美的在中国排行第三,世界排行第八。世界最大家电公司。2024年,美的集团位列财富世界500强第277位,Brand Finance全球最有价值科技品牌100强第36位。3CIO的围城:云下的想上云,云上的想下云云下的苦:自搭难搞好 技术旧:
2、停留在诞生于90年代的虚拟化,而不是公有云技术体系(计算资源虚拟化 vs.全部应用所需能力)产品杂:八国联军,商用,开源 稳定差:能力低、体系差则稳定必然差。大故障全是架构和体系问题!自搭出大故障只是时间问题!效率低:每个业务软件团队需要自己搭建和运维中间件、数据库等 安全弱:安全是体系问题,系统能力低则安全差,网络能力低则安全差。成本低?表面上自搭比用公有云低6-10倍,但是总成本TCO真低么?云上的苦:多云难驾驭 多云原因:横向部门原因,纵向历史原因,业务出海原因,财务降本需求(单云绑定难议价),业务稳定需求 适配难:公有云不兼容,业务软件对公有云的适配改造量大、人力成本高、时间周期长、业
3、务响应慢 运维难:不同云不同配置不同参数,参数越来越多,性能调优难 联动难:云孤岛问题难解决,业务孤岛无联动,无法实现多云多活(接入层、中间件层、数据层等底层能力)4State-of-the-art Does Not Work UC-Berkeley Prof.Ion Stoica 对公有云不兼容问题提出了Sky Computing方案 https:/sky.cs.berkeley.edu/publications/Inter-cloud broker matches app demands&user preferences to clouds不work的原因:太理想,大多数应用软件无法mod
4、el成任务。https:/pages.cs.wisc.edu/yxy/cs839-f23/slides/L19-1-sky.pdf类似云计算的淘宝拼多多,做买家和买家的撮合平台。5CIO围城解决方案:云下云上多云统一数字化底座-中立云架构:从第一性原理思考 云下云上难道不能一样么?此云彼云难道不能一样么?技术 云下云上统一:本地IDC从旧虚拟化技术升级成公有云技术,中间件数据库服务化,运维白屏化自动化智能化 此云彼云统一:公有云=硬件+软件,在多个公有云上用统一的软件,云计算的软硬件解耦(下一代云计算)资源统一调度:全球一张网,全球一朵云,全部云上云下资源统一调度,业务迁移零改造,彻底消除云孤
5、岛,操作系统级别纳管多朵公有云资源+多个数据中心资源,屏蔽公有云差异,与CMP有本质不同价值 降本:1.底层公有云可以招标,2.公有云硬件+中立云软件,3.业务迁移零改造,4.灵活业务部署FinOps 增效:业务迁移零改造,节省半年业务应用改造时间,业务开展加快半年;运维白屏化自动化智能化 能力:博采众长,享受公有云能力总和 稳定:在自己数据中心享受到和公有云一样的服务,云上可以多云多活,业务应用更加稳定 安全:系统和网络能力大大增强,例如VPC隔离,使得整体安全性大幅提升 联动:中立云自身平台之间大量联动,部署在不同公有云上的业务软件可以任意联动,告别云孤岛中立云公有云1公有云2公有云3客户
6、A数据中心1客户A数据中心2客户A数据中心36中立云-多云统一数字化底座VMwareRedHatSAN存储DataBricksSplunkCloudera CDPDynatraceFortinet VPNForescoutMcAfee DLPXXXXXXXXXXXXF5联软桌管7AI算力平台8AI算力平台:资源利用率问题白天 GPU190晚上 GPU10GPU11有些AI开发测试和推理服务需要GPU资源少,但仍占用整块GPU卡推理和训练的资源使用模式存在潮汐现象,大部分时间GPU资源闲置无AI算力虚拟化,GPU资源无法细粒度分配无动态分配策略,GPU资源无法随负载动态分配无统一调度策略,GPU