当前位置:首页 > 报告详情

HotChips_Boqueria_Presentation_v15.pdf

上传人: 2*** 编号:136912 2023-08-03 19页 2.18MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Boqueria公司的一款AI推理加速器,该加速器采用at-memory计算架构,以能量效率和大规模并行处理为特色。关键数据包括:Boqueria加速器提供2 PetaFLOPs的计算能力,30 TFLOPs/W的能效,以及1,458个RISC-V核心。它支持多种数据类型,如FP8和BF16,以实现精确度和能效的平衡。该加速器还具备灵活的计算架构,可在不同的神经网络架构下扩展和调整。此外,Boqueria加速器通过优化数据移动和处理,实现了高效的能量消耗和计算吞吐量。与传统的GPU相比,Boqueria加速器在性能和能效方面具有显著优势,例如,在某些模型上,其性能提高了5倍,能效提高了7倍。
"Boqueria如何实现高效的AI推理加速?" "FP8数据类型在AI推理中的优势是什么?" "imAIgine SDK如何优化AI模型推理性能?"
客服
商务合作
小程序
服务号
折叠