当前位置:首页 > 报告详情

12-马鸣远.pdf

上传人: 山哈 编号:725379 2025-07-04 27页 4.10MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《清华大学集成电路学院开源通用GPU“乘影”v2.1.0基于Chisel HDL的硬件开发进展》的内容,全文主要概括如下: 1. **微架构更新**:包括内存管理单元(MMU)、张量计算单元(Tensor Core)、数据异步拷贝机制(DMA engine)等,支持多线程束调度和向量处理器。 2. **寄存器堆设计**:采用4-bank SRAM,支持256个vGPR和64个sGPR。 3. **缓存设计**:实现连贯性指导的缓存一致性(RCC),降低带宽开销和硬件复杂度。 4. **虚拟内存**:支持RISC-V Sv32/Sv39多级页表体系,设计L1和L2 TLB。 5. **Tensor Core**:支持FP16、INT8和混合精度计算,提高神经网络计算速度。 6. **DMA engine**:设计在SM中,支持异步数据拷贝。 7. **CTA Scheduler**:优化设计,提升性能和资源利用率。 8. **构建和仿真框架**:升级Chisel版本,支持多线程并行仿真。
"Tensor Core如何加速神经网络?" "异步数据拷贝机制有何优势?" "开源GPU“乘影”v2.1.0有哪些新特性?"
客服
商务合作
小程序
服务号
折叠