当前位置:首页 > 报告详情

SESSION 37 Design-Technology Optimization and Digital Accelerators.pdf

上传人: 张** 编号:620872 2025-03-31 411页 22.28MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了基于扩散模型的多任务内容生成加速器。主要内容包括: 1. 背景:扩散模型是当前最先进的概率生成模型之一,可以高效生成高质量的内容,如文本、图像、视频等。 2. 关键挑战:扩散模型在不同的层中存在带宽多样性,导致计算和存储资源利用不均衡;计算内存储器(CIM)的权重复用率有限,导致系统效率降低;多任务内容生成需要保证帧间和帧内的一致性。 3. 解决方案:提出了带宽感知内存分区、基于块的CIM计算内存储器以及多帧一致性管理三种方法。带宽感知内存分区可以提高存储带宽的利用率;基于块的CIM计算内存储器通过块级别的权重重排提高了权重复用率;多帧一致性管理保证了多任务内容生成的一致性。 4. 测量结果:与现有方法相比,该加速器在图像生成任务上达到了60.81 TFLOPS/W的能效比,在多任务内容生成中实现了高效的资源利用和一致性保证。 本文通过提出带宽感知内存分区、基于块的CIM计算内存储器以及多帧一致性管理三种方法,有效解决了扩散模型在多任务内容生成中的关键挑战,为高效、一致的多模态内容生成提供了有效的解决方案。
如何在设计中实现设计-技术协同优化? 如何通过内存分区提高扩散加速器的效率? 如何利用计算内存储器实现高效的多任务内容生成?
客服
商务合作
小程序
服务号
折叠