1、1数字化底座for AIAI for 数字化底座2美的集团简介美的集团业务:1个ToC(智能家居),5个ToB(楼宇科技、工业技术、机器人与自动化,美的医疗、安得物流)。根据美国商业专利数据库(IFI Claims),美的在中国排行第三,世界排行第八。世界最大家电公司。2024年,美的集团位列财富世界500强第277位,Brand Finance全球最有价值科技品牌100强第36位。3中立云数字化底座架构中立云数字化底座跨云物理资源数字化业务应用研发云服务器生产供应链营销售后大数据业务金融实机例中立云基础底座通用计算操作系统实机例中立云大数据平台大数据研发平台实机例中立云运维平台自动化运维平台
2、全栈监控平台大数据引擎平台实机例中立云数据库平台数据库管理平台数据库引擎平台实机例中立云安全平台机密管理平台攻击模拟平台终端安全平台自有IDC 1自有IDC 2研发效能平台应用管理平台API网关服务治理流量防护任务调度容器平台配置中心敏捷项目管理平台研发管理平台自动化测试平台度量平台基于AI全流程研发效能平台对象存储存储块存储私有网络VPC网络(虚拟)负载均衡LBGPU虚池化AI算力平台云下云上统一调度零信任DLP准入桌管统一认证平台账号认证授权审计VMwareRedHatSAN存储F5DataBricksSplunkCloudera CDPDynatraceFortinet VPNFores
3、coutMcAfee DLP联软桌管XXXXXXXXXXXX4AI算力平台5AI算力平台:资源利用率问题白天 GPU190晚上 GPU10GPU11 有些AI开发测试和推理服务需要GPU资源少,但仍占用整块GPU卡 推理和训练的资源使用模式存在潮汐现象,大部分时间GPU资源闲置 无AI算力虚拟化,GPU资源无法细粒度分配 无动态分配策略,GPU资源无法随负载动态分配 无统一调度策略,GPU资源无法随要求调度到合适的服务器问题根因6产品架构AI算力平台 提供跨云多集群管理、GPU算力调度、作业任务部署、队列资源分配、持续发布、统一资源管理、AI中间件、自动智能化运维、运营能力等,助力企业AIGC
4、的大模型与知识问答算法训练推理,通过AIGC为企业赋能和降本增效。硬件基础设施(本地IDC)AI算力平台基础设施虚拟化引擎Nvidia GPU虚拟化计算(异构CPU/异构GPU)存储网络多集群统一API公有云研发生产供应链销售售后金融场景算力池化算力调度层级队列节点均衡弹性调度GPU指定优先级调度资源预留算力切分显存切分资源混部异构支持虚拟显存动态调整AI加速镜像加速数据加速数据编排计算加速白屏化运维运营能力统一资源管理队列管理多租体系集群管理资源管理模型与数据计量计费故障发现故障管理故障恢复AI中间件能力调度增强掉卡重训拓扑感知负载感知设备均衡节点均衡成本分析费率优化用量推荐AI网关mode
5、lmesh调用链追踪零信任安全插件管理OpenAPI资源可视化华为GPU虚拟化7自动化运维平台OpSpace8自动化运维OPSpace产品架构 基础设施物理机运维公有云运维网络运维存储运维开发人员安全管理员用户产品能力AWSAzureOrange阿里云自建IDC物理机机管理网络管理备份管理脚本管理开机维修报障重装系统关机防火墙复制负载均衡变更备份主机管理备份恢复备份任务域名解析申请脚本可见配置删除脚本创建脚本作业管理失败日志作业共享备份配额手动托管自定义参数超时配置作业步骤作业执行记录自定义参数作业超时配置CMDB一键带外托管防火墙申请备份自动化脚本共享作业编排配置建模管理数据采集数据拓扑消费
6、管理数据连接器数据订阅操作日志设备状态设备详情重启获取带外密码防火墙续期防火墙回收域名解析变更域名解析回收负载均衡申请负载均衡回收负载均衡详情域名解析详情资产管理资产检索资产交接数据审计数据治理权限管理脚本上下架脚本详情共享脚本执行脚本定时执行脚本执行记录设备日志9产品功能举例:网络管理-防火墙解决方案:提供防火墙自动化管理能力1.防火墙申请:按白名单进行按防火墙申开通2.自动化下发:支持自动生成策略并一键自动下发,降低对运维人员要求3.在线化管理:支持防火墙工单管理,策略下发记录可查,便于审计和追溯手工管理防火墙痛点:1.防火墙规则庞大且复杂,手工管理容易出错,引发冲突或遗漏2.防火墙运维需