当前位置:首页 > 报告详情

017-舒卓.pdf

上传人: 山哈 编号:725355 2025-07-04 13页 932.38KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Nuclei Technology针对嵌入式AI框架的优化,特别是使用RISC-V V扩展对AI关键算子进行性能优化。关键点如下: 1. **嵌入式AI框架**:为资源受限的嵌入式设备设计,采用训练-推理分离的方法。 2. **Nuclei RISC-V V扩展**:支持RVV 1.0,可配置VLEN长度,支持多种运算,并提供自定义Vector指令的接口。 3. **优化AI关键算子**:卷积层和全连接层是推理性能的关键点。使用RVV优化GEMM算子,通过macc指令提升效率。 4. **激活函数优化**:使用RVV对Exp等激活函数进行优化,减少vfdiv指令使用,提高lmul取值。 5. **性能提升数据**:在Nuclei nx900fdv上,GEMM算子的RVV优化提升倍数显著;Exp算子的优化在VLEN=1024时,速度提升最高。 - GEMM优化:具体倍数未给出。 - Exp优化:无优化时为基准,VPU(VLEN=128)、VPU(VLEN=512)、VPU(VLEN=1024)的速度提升分别为未给出、未给出、最高。 综上,Nuclei Technology通过V扩展显著提升了嵌入式AI算子的性能。
"RVV如何提速AI运算?" "Nuclei Evalsoc实测性能翻倍?" "AI算子优化有哪些技巧?"
客服
商务合作
小程序
服务号
折叠