当前位置:首页 > 报告详情

具有分层结构和奇偶数据映射的高并行内存 NTT 引擎.pdf

上传人: 芦苇 编号:651796 2025-05-01 27页 1.26MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
全文主要介绍了一种基于分层SRAM架构和偶数-奇数数据映射策略的高并行性内联NTT引擎,以实现大尺度NTT操作的高效计算。该引擎由16个PE组成,每个PE包含256个SubArray,每个SubArray包含64个存储单元。此外,还包含2个PE的MOD模块,每个PE包含8个SubArray,每个SubArray包含8个存储单元。该设计在不同的NTT参数设置下,与现有的NTT加速器相比,实现了高达3.08倍的加速和4.96倍的能量节省。在32K个点,log2q为32的情况下,该引擎的执行时间仅为150微秒,能量消耗为500微焦耳。
"数字环形阵列如何提升NTT性能?" "偶数-奇数数据映射如何优化内存使用?" "在CIM中集成模运算带来了哪些优势?"
客服
商务合作
小程序
服务号
折叠