当前位置:首页 > 报告详情

张雄-KVM直通式虚拟PMU _052005.pdf

上传人: 张** 编号:159326 2024-04-05 8页 427.93KB

1、Intel Restricted SecretKVM直通式虚拟PMU1张雄张雄 2摘要 perf 和 CPU PMU KVM 模拟式虚拟PMU KVM直通式虚拟PMUIntel Restricted Secret3Perf和CPU PMU perf工具创建感兴趣的事件,并分析事件的发生情况 内核perf子系统,调度perf事件到cpu PMU计数器上进程上下文切换perf 事件数 PMU计数器数 CPU PMU提供有限的计数器 cycles,instructions,cache-hit/miss,branch-hit/miss,.虚拟PMU给cloud用户提供硬件级perf调优能力 系统级事件

2、给虚拟化带来挑战Intel Restricted SecretLinux Userspace Perf UtilityLinux Kernel Perf SubsystemRun:perf record-e branch-misses./test_programsyscalltest_programThreadPMUPerf EventMSR read/writeCPU4模拟式vPMUKVM 展示虚拟PMU给guest,通过虚拟CPUID和虚拟MSRKVM vPMU是host perf系统的一个客户,kvm创建perf事件,参与host perf 调度,拿到cpu pmu计数器当pmu 计数器

3、溢出时,KVM vPMU注入虚拟PMI到guest缺点性能开销太大,特别是guest perf 有多路复用时不可接受当kvm没有取得或者丢失cpu pmu计数器时,guest没有感知而认为底层依旧完好非常难增加新的guest PMU特性,需要在perf 子系统中增加新的接口Intel Restricted Secret5直通式vPMU 在vm-exit/entry进行PMU上下文切换VM-exit:保存guest PMU,重启host perfVM-entry:停止host perf,恢复guest PMU 在VM运行中,guest直接访问PMU MSRs不会引起vm-exit 当PMU计数器

4、溢出时,KVM注入vPMI到guest 优点:perf 开销小,数据准确,容易在guest里使能新PMU特性 缺点:host perf不能监控guest VMIntel Restricted SecretvPMUKVM vCPUMSR read/writevPMIHost Linux Kernel Perf SubsystemvCPU ThreadPerf EventPMUCPUPMILinux Userspace Perf UtilityLinux Kernel Perf SubsystemRun:perf record-e branch-misses./test_programtest_p

5、rogramThreadPerf EventGuest Linux6vPMU性能对比:模拟式 Vs 直通式 负载:SpecInt-2017 硬件:Sapphire Rapids,1 socket,56 cores,no-SMT Perf 命令基础采样:perf record-F 1000-e 6-instructions -a overwrite多路复用采样:perf record-F 1000-e 10-instructions-a-overwriteIntel Restricted SecretVMperfperformanceoverhead模拟式模拟式vPMU直通式直通式vPMU基础采样33.62%4.24%多路复用采样79.32%7.34%7直通式vPMU状态RFC code:https:/lore.kernel.org/lkml/20240126085444.324918-1- Restricted SecretIntel Confidential Do Not Forward

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了KVM虚拟PMU(Performance Monitoring Unit)的两种实现方式:模拟式和直通式,并对比了它们的性能。 1. 模拟式vPMU:KVM通过虚拟CPUID和虚拟MSR向guest展示虚拟PMU,参与host perf调度,并拿到CPU PMU计数器。但其性能开销大,尤其在guest perf有多路复用时不可接受。同时,当KVM没有取得或丢失CPU PMU计数器时,guest无法感知,且难以增加新的PMU特性。 2. 直通式vPMU:在vm-exit/entry进行PMU上下文切换,减少了perf开销,数据更准确,且容易在guest里启用新PMU特性。当PMU计数器溢出时,KVM注入vPMI到guest。 对比数据显示,在负载为SpecInt-2017,硬件为Sapphire Rapids,1 socket, 56 cores, no-SMT的条件下,直通式vPMU的基础采样和多路复用采样性能均优于模拟式vPMU,分别降低了33.62%和79.32%的开销。 直通式vPMU的RFC代码已提交至Linux内核,得到了Google和Intel的支持。
KVM直通式虚拟PMU优势何在? 模拟式vPMU与直通式vPMU性能对比如何? 如何解决KVM没有取得或丢失CPU PMU计数器的问题?
客服
商务合作
小程序
服务号
折叠