1、Rokid:在 AI+AR 场景下 Serverless 容器化技术探索与实践李鹏(阿里云)朱炜栋(Rokid)目录Knative 介绍01基于 Knative 部署 DeepSeek-R103Rokid 基于 Knative 最佳实践02ContentKnative 介绍Part 01Kubernetes 正成为数字化、智能化应用的云原生基础设施Public CloudEdge ComputingPrivate CloudKubernetes(容器服务 ACK/ACS)Web/mobile applications-Stateless-Idempotent-Horizontal scalab
2、leMySQLSparkFlinkElastic-searchKafkaTensor-FlowPyTorchRedisZoo-Keeper异构算力ECS,GPU,FPGA,ECI高性能网络VPC,ENI,RDMA,SLB,DNS高性能存储EBS,NAS,CPFS,OSSGartner预测,“到2027年,中国的全部AI推理工作负载中,基于云的工作负载占比将从前的20%上升至80%”Knative 发展轨迹及阿里云对Knative的支持历程20192018201220142006Zimki 首次提出“pay as you go”模型Iron.io 首次提出Serverless 概念AWS 第一个
3、发布FaaS 平台 Lambda开启Serverless时代Google 开源 Kubernetes Google 开源 Knative阿里云 Knative产品化上线20222025Knative 成为 CNCF 孵化项目阿里云 Knative1.14支持Knative最受欢迎:功能丰富:云产商共识:跟据 2020 CNCF 云原生调查报告,Knative 已成为开源自建 Serverless 平台首选。Knative 是基于 Kubernetes 之上提供的一款开源 Serverless 应用框架,目标打造企业级 Serverless 应用平台。支持或者集成 Knative,如阿里云、谷歌
4、云、IBM、Red Hat等,并且大部分都提供了生产级别能力。版本管理 请求自动弹性 缩容到0 流量灰度发布 事件驱动Knative应用模型 ServiceServerless 应用的抽象,通过 Service 管理应用的生命周期 Configuration当前期望状态的配置。每次更新 Service 就会更新 Configuration RevisionService 的每次更新都会创建一个快照,一个快照就是一个 Revision Route将请求路由到 Revision,并可以向不同的Revision 转发不同比例的流量ServiceRevision 1Revision 2Revision
5、 3RouteConfiguration70%30%TesterTag版本管理特性apiVersion:serving.knative.dev/v1kind:Servicemetadata:name:example-servicenamespace:defaultspec:.traffic:-percent:0revisionName:example-service-2tag:staging-percent:100revisionName:example-service-1金丝雀验证Knative 中提供了tag机制可以做到。也就是对某个版本打上tag,然后 Knative 会自动生成改tag
6、的访问地址。版本自动 GCKnative如果每次修改就会创建新的版本,而随着迭代的加速,必然会导致很多历史版本,Knative 中提供了版本自动清理能力。可以通过 config-gc 配置版本 GC 策略apiVersion:v1kind:ConfigMapmetadata:name:config-gcnamespace:knative-servingdata:_example:|#-#Garbage Collector Settings#-#Duration since creation before considering a revision for GC or disabled.ret