当前位置:首页 > 报告详情

018-Fan-Fujie.pdf

上传人: 山哈 编号:725298 2025-07-04 14页 2.44MB

1、Experiences with Extending The RISC-V ISA for Matrix/AIFan Fujie(范福杰范福杰)R&D Director,Stream ComputingCONTENTS Architecture Implementation Eco-system Open-source PlanArchitectureTile-based Matrix Multiplication.RISC-style Instructions&GPR Architecture.Configurable Parameters for Implementations.Separ

2、ate Tile Registers&Accumulation Registers.8 architectural tile registers,tr0 tr7 8 architectural accumulation registers,acc0 acc7Unprivileged CSRs for Type&Size Settings.ArchitectureType system with optional standard extensions.ExtensionType SupportTypical ApplicationsZmi44-bit integerEdge-side AI i

3、nference;LLM InferenceZmi88-bit integerEdge-side AI inference;LLM InferenceZmi1616-bit integerScientific computingZmi3232-bit integerScientific computingZmi6464-bit integerScientific computingZmf8e4m3FP8(E4M3)AI inference&training(forward)Zmf8e5m2FP8(E5M2)AI inference&training(backward)Zmf16e5m10FP1

4、6Cloud-side AI inference&training Zmf16e8m7BF16Cloud-side AI training(or inference)Zmf32e8m23FP32Scientific computingZmf19e8m10TF32Cloud-side AI inference&training Zmf64e11m52FP64Scientific computingArchitectureConfig-setting Instructionsmsettypemsettilemmsettilenmsettilekmsettypeimsettilemimsettile

5、nimsettileki.Load/Store Instructionsmlae*.mmlbe*.mmlce*.mmltre*.mmsae*.mmsbe*.mmsce*.mmstre*.m.Data Move Instructionsmmve*.a.tmmve*.t.ammve*.x.ammve*.x.tmfmve*.f.tmbcar.mmbcaee*.mmtae*.m.Matrix Multiply Instructionsmma.mmmsma.mmmwma.mmmqma.mmmoma.mmmfma.mmmfwma.mmmfqma.mm.https:/ Instructionsmadd.mm

6、msub.mmmmin.mmmmax.mmmfadd.mmmfsub.mmmfmin.mmmfmax.mm.Type-convert Instructionsmcvt.x.xu.mmcvt.xu.x.mmwcvt.xw.x.mmncvt.x.xw.mmfwcvt.fw.f.mmfncvt.f.fw.mmfcvt.x.f.mmfcvt.f.x.m.ArchitectureInstruction Encoding(32-bit)FieldDesc.OP-M32The major opcode(1110111)funct6FunctionimmImmediatelsLoad or storetrTr

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了RISC-V架构的扩展——RISC-VISA,用于矩阵和AI运算。关键点如下: 1. 架构:基于瓦片(tile)的矩阵乘法,采用RISC风格的指令和通用寄存器架构,具有可配置的实现参数,独立的瓦片寄存器和累加寄存器。 2. 扩展类型:支持不同位宽的整数和浮点数运算,如Zmi4(4-bit)、Zmf8e4m3(FP8)等,适用于边缘AI推理、科学计算等。 3. 指令集:包含配置设置、数据移动、矩阵乘法、元素运算和类型转换等指令。 4. 实现:STCP920人工智能计算芯片采用扩展的RISC-V架构,具备标量、向量、矩阵处理能力,数据类型为FP16/INT8,性能分别为128 TFLOPS@FP16和256 TOPS@INT8。 5. 生态系统:包括规范、编译器、调试工具、仿真器、验证工具等,以及专用的异构编程环境、AI编译器等。 6. 开源计划:包括矩阵扩展提案、LLVM工具链、GDB调试工具、Spike仿真器、PVP验证、DNN库和Chipyard项目等。 文章强调了RISC-VISA在AI和矩阵运算领域的应用潜力,以及相应的开源生态系统支持。
"RISC-VISA矩阵扩展有哪些创新?" "如何使用STCP920芯片进行AI计算?" "开源矩阵扩展项目有哪些亮点?"
客服
商务合作
小程序
服务号
折叠