《002-李杨.pdf》由会员分享,可在线阅读,更多相关《002-李杨.pdf(14页珍藏版)》请在三个皮匠报告上搜索。
1、基于 RISC-V 的Chromium性能优化实践李 扬阿里巴巴达摩院 技术专家Contents目录性能优化背景01性能优化实践02性能优化成果01性能优化背景云桌面优化背景随着端云一体应用的不断发展,越来越多的PC端、移动端、云端应用基于开源浏览器内核而构建。Chromium内核EChromium内核现状2018年开始有RISC-V提交,但未正式支持性能问题 网页响应慢 云应用卡顿 用户交互速度慢 小程序响应速度慢 视频播放卡顿 2018年开始有RISC-V提交,但未正式支持 版本构建尚有困难 性能难以满足产品化要求版本现状02性能优化实践V8 引擎合成器Blink渲染模块解码器JS编译器网
2、页响应速度浏览器Electron小程序ChromeOSCIGTestClang 编译器Webview/Chromium安全沙箱显示链路视频播放性能网页渲染性能综合性能代码行数:3000万+三方库数量:100+涉及开发语言:C+/JavaScript/HTML/CSS/Python/Java/Rust优化地图工具链LLVM应用扩展指令集指令扩充性能增强典型应用场景中Profiling分析结果RV社区标准指令集优化1 工具链迭代优化优化方法优化效果Benchmark优化提升9.814.1优化2 V8 JS引擎优化播放器用户交互存储动画编译器指令选择器指令生成器汇编器静态编译JIT编译解释执行JIT
3、执行V8引擎解释器是否热点?优化后JIT代码静态内置函数01111001001101JS代码可执行程序指令选择器根据RV64的指令集特点,优化了指令选择和指令融合逻辑,使得在RV64架构上可以生成更简洁的中间代码表达指令生成器/汇编器丰富RV后端指令集,在宏汇编器、汇编器中加入玄铁扩展指令集支持,使得生成的二进制指令更加紧凑高效静态内置函数通过中间表达优化、手动汇编优化、跳板机制优化进一步优化内置函数,缩短翻译执行时间优化2 V8 JS引擎优化优化方法优化效果Benchmark优化提升14.117.6视频流降低GPU占用率2040%流畅送显4K60fps视频图像GPU合成桌面图层视频图层DPU
4、显示桌面高GPU占用显示链路Delay较大VDA解码 全链路零拷贝 支持更丰富的硬件解码后端 平滑解码 4K60fpsVDA解码优化GPU合成DPU直显视频直显优化3 显示链路优化03性能优化成果屏幕尺寸播放视频源优化后优化前1080p1080p60fps流畅流畅4K60fps流畅卡顿4K1080p60fps流畅非常卡顿4K60fps流畅非常卡顿视频播放云桌面平板电脑产品50%100%150%200%SpeedometerSunspiderKrakenV8 Benchmark对比优化前优化后产品应用百度微博B站优酷启动时间优化后优化前性能优化成果Thank you玄铁公众号玄铁中文站玄铁海外站