张连壮-Luban 青云智算平台HAMi实践.pdf

编号:612361 PDF 32页 2.37MB 下载积分:VIP专享
下载报告请您先登录!

张连壮-Luban 青云智算平台HAMi实践.pdf

1、云原生+AI Meetup12/28 广东省广州市海珠区鼎新路 88 号 广州阿里中心13:30-17:30广州站主办方合作伙伴云原生+AI Meetup 广州站Luban 青云智算平台HAMi实践张连壮青云科技 高级研发工程师云原生+AI Meetup 广州站HAMi 介绍HAMi 是一个面向 Kubernetes 的异构设备管理中间件。它可以管理不同类型的异构设备(如 GPU、NPU、MLU、DCU 等),实现异构设备在 Pod 之间的共享,并基于设备拓扑和调度策略做出更优的调度决策。云原生+AI Meetup 广州站HAMi 示例云原生+AI Meetup 广州站HAMi 用户平安证券平

2、安银行新网银行中国移动H3C华为东南大学/东华大学/中国矿业大学科大讯飞云原生+AI Meetup 广州站HAMi 核心解读云原生+AI Meetup 广州站HAMi 架构云原生+AI Meetup 广州站HAMi 架构cuda driver api 的劫持nvidia open kernel云原生+AI Meetup 广州站cuda劫持的核心原理CUresult cuDeviceGet(CUdevice*device,int ordinal)LOG_DEBUG(into cuDeviceGet ordinal=%dn,ordinal);CUresult res=CUDA_OVERRIDE_C

3、ALL(cuda_library_entry,cuDeviceGet,device,ordinal);return res;ld_preload云原生+AI Meetup 广州站运行架构应用层:使用gpu资源的应用,机器学习,深度学习,各种框架,训练,推理等K8S处理层:该层复制处理k8s的内部资源调度K8S资源层:资源层负责GPU的申请,POD的创建云原生+AI Meetup 广州站GPU 虚拟化技术-昇腾云原生+AI Meetup 广州站GPU 虚拟化技术-海光mask 配置文件cu_mask:xxx计算单元mem:yyy 显存云原生+AI Meetup 广州站调度器云原生+AI Meet

4、up 广州站HAMi exportershared mem 的方式提供数据云原生+AI Meetup 广州站远程调用rcuda:是“西班牙瓦伦西亚理工大学”提供的一个项目,该项目提供二进制免费使用,但是不开源。Bitfusion:vmware 的产品,该产品有详细的文档描述,基本上呢就是 远程调用+显存切分。趋动科技:国内最早期提供远程调用的厂商。云原生+AI Meetup 广州站HAMi 开发部署的实践云原生+AI Meetup 广州站HAMi 安装1.kubectl label nodes nodeid gpu=on2.helm repo add hami-charts https:/pr

5、oject-hami.github.io/HAMi/3.helm install hami hami-charts/hami -n kube-system 云原生+AI Meetup 广州站HAMi pod 使用resources:limits: 1 个虚拟 GPU GPU 包含 3000M 显存云原生+AI Meetup 广州站HAMi pod调度策略nodeSchedulerPolicy:binpack尽量往一个node上调度。gpuSchedulerPolicy:spread 尽量往同一个node不同的卡上调度。云原生+AI Meetup 广州站HAMi 显存如何计算int add_ch

6、unk(CUdeviceptr*address,size_t size)add_gpu_device_memory_usage(getpid(),dev,allocsize,2);return 0;云原生+AI Meetup 广州站HAMi 提高显存计算的准确度pod:宿主机:云原生+AI Meetup 广州站HAMi 显存不准确的规避方法devicePlugin.deviceMemoryScaling=0.8预留部分显存修改libvgpu代码,将计算模式更改成获取模式。云原生+AI Meetup 广州站HAMi

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(张连壮-Luban 青云智算平台HAMi实践.pdf)为本站 (小小) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠