1、基于容器服务的云原生实践Cloud Native Practices Based on Alibaba Cloud Container Services孙文杰流利说 Cloud Infra Tech Lead徐征阿里云高级产品解决方案架构师从无状态应用,到企业核心应用,到数据智能应用到2023年,70%AI任务会通过容器、Serverless等计算模型构建,并需要DevOps文化。-GartnerKubernetes is becoming the Infrastructure of the Cloud Native AgeKubernetes逐渐成为云原生时代的基础设施AI任务生命周期管理A
2、I工程效率提升50%PrestoFlinkTensorflowKubeflow/Arena异构算力调度分布式缓存加速GPU/NPU共享利用率提升200%400%AI训练加速20%GPU/NPU共享调度分布式缓存服务Scheduling Framework+PluginsKubernetes原生调度AI任务Gang/Capacity批作业调度器GPU/vGPU,NPUENI/RDMA异构资源统一管理NAS/OSS/CPFS异构算力支持云原生AI/计算应用ACK Cloud Native AI Umbrella-Efficient,Open and ScalableACK云原生AI套件 高效 开放
3、 可扩展公共云国内首家获得可信云大规模容器集群性能测试“卓越级”,单集群万节点,百万容器ECS节点千节点3分钟弹性扩容;弹性容器实例60秒1000 Pod应用层资源层PodPodPodPodECS虚拟机PodPodPodPod神龙裸金属PodPodPodPodGPU 实例PodPodPodPod50%90%成本节省竞价实例PodPodPodPod虚拟节点PodPodPodPodPodHPA 水平伸缩PodPodPodPodPodPod定时伸缩KubernetesPodPodVPA 垂直伸缩Strong and Flexible Elastic capacity强大、灵活的弹性能力流利说-基于容
4、器服务的云原生实践Cloud-native and Elastic Computing Practices-LAIX孙文杰流利说 Cloud Infra Tech Lead纽交所上市公司 LAIX卓越的科技驱动教育公司AI+教育赋能每个人实现最大潜力公司介绍Introduction计算流利说英语流利说雅思PIE流利说阅读存储网络安全算法SpeechASRTTSBOTLQNLP中台内容运营支付登陆订单通用基础微服务AI训练在线推理All On K8sOverall business structure流利说整体业务结构微服务声明式API容器跨平台/多云Cloud Native(可弹性、可管理、可
5、观测、自动化、容错)IaC12因子DevOps天生适合运行在云上的应用,并让应用可以运行在任意云上Born in the cloud,Grow in the cloud,Natural cloud native architecture流利说,生于云、长于云,天然的云原生架构HPAGPUECSVPAECISpot弹性When need it,turn the faucet and the water comes,I just have to worry about paying the bill当需要的时候,扭开水龙头,水就来了,我只需要操心交水电费就是了!弹性策略利用率工程效率成本优化可用性
6、、AZ风险多集群高可用部署架构应对随时伸缩API网关ServiceMesh业务架构Three keys to problem solving解决问题的三大关键工作流轻巧、弹性、高效屏蔽所有底层资源配置管理数据收集数据校验特征提取流程管理工具分析、可视化工具计算资源管理在线服务基础设置监控日志机器学习代码AI system engineering is inefficientAI系统工程效率低解放数据科学家,专注于核心代码#submit a distributed training jobarena submit mpijob-name=tf-dist-data-workers=6-gpus=2