012-仇径.pdf

当前位置:首页 > 报告详情
012-仇径.pdf

上传人: 山哈 编号:725309 2025-07-04 23页 1.34MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了阿里巴巴达摩院玄铁团队针对AI应用扩展的RISC-V指令集,包括向量AI扩展和矩阵AI扩展两部分。 关键点: 1. 向量AI扩展:通过SFU扩展指令集,优化了BERT-Large等模型的运行时间,实现了如Softmax、Gelu等特殊函数的快速计算。 - 核心数据:Softmax硬件/软件协同设计,EXP、TANH等函数的计算速度提升90%。 2. 矩阵AI扩展:引入Attached Matrix扩展指令集,提升矩阵运算性能,支持多种数据类型和动态shape。 - 核心数据:矩阵乘累加(GEMM)在fp16和int8上的性能提升分别达到1.78和3.91倍。 3. 指令集更新:包括结构化稀疏、新数据类型支持、混合精度计算等,增强了运算能力和指令性能。 4. 生态建设:玄铁团队积极参与RISC-V+AI算力生态,推动Matrix开源指令集的发展。 综上,玄铁扩展指令集为AI应用提供了高效的计算支持,显著提升了相关算法的执行性能。
"玄铁SFU扩展有多快?" "矩阵AI扩展将如何变革计算?" "哪些新指令提升AI算力?"
客服
商务合作
小程序
服务号
折叠