当前位置:首页 > 报告详情

15-Automated Model Serving in HP Cloud-John Zheng.pdf

上传人: 张** 编号:620948 2025-03-31 37页 1.36MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了惠普(HP)云的模型服务自动化实践,重点是构建一个基于KServe、Istio和Envoy的统一模型推理平台。该平台支持多种推理模型,包括生成式AI、传统机器学习和深度学习模型,并允许项目组自主部署环境。平台具备自动化部署、模型存储支持、权限管理、动态扩展、可观测性、限流等功能。 关键数据包括: 1. 平台基于Amazon Kubernetes(EKS)、Istio、Harbor、Azure Pipeline等构建,实现基础设施即代码。 2. 支持多种模型存储,如Hugging Face、S3、PVC、EFS等。 3. 集成Helm和Flux2实现自动化部署。 4. 模型访问权限控制、HPA动态扩展、可观测性、API限流等功能均通过Istio实现。 5. 利用Prometheus Adaptor支持基于自定义指标的HPA。 6. 通过Envoy实现模型服务的限流和统计。 7. 金丝雀发布通过Istio虚拟服务实现,注重模型版本的流量分配。 综上所述,惠普云模型推理平台通过整合KServe、Istio、Envoy和Prometheus Adaptor等工具,实现了一站式的模型服务自动化,具备高灵活性和可定制性,同时简化模型部署和运维工作。
"如何实现模型的自动权限控制?" "如何使用HPA实现模型的动态扩展?" "如何在模型推理平台中实现可观测性?"
客服
商务合作
小程序
服务号
折叠