当前位置:首页 > 报告详情

晶圆级人工智能:实现前所未有的人工智能计算性能.pdf

上传人: c** 编号:465038 2025-01-12 71页 4.99MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Cerebras Systems公司的Wafer-Scale Engine(WSE)芯片,这是一种用于人工智能计算的芯片。以下是文章的主要内容: 1. Cerebras Systems成立于2016年,总部位于硅谷,拥有400名员工。 2. WSE芯片是迄今为止生产的最大芯片,面积为46,225平方毫米,包含4万亿个晶体管,90万个AI核心,125个Petaflops的AI计算能力,44吉字节的片上内存,21PByte/s的内存带宽和214Pbit/s的片上网络带宽。 3. WSE芯片与NVIDIA的H100 GPU相比,具有显著的优势,例如57倍的芯片面积,52倍的AI核心数量,880倍的内存带宽等。 4. WSE芯片通过在芯片上实现计算和内存的紧密耦合,提供了高性能的AI计算能力,例如高吞吐量的张量操作,快速的稀疏加速等。 5. WSE芯片通过在芯片上实现流水线执行,可以实现超快的令牌生成,每个芯片区域处理一个令牌,足够大的内存带宽可以运行局部批处理大小为1。 6. WSE芯片可以自然扩展到多个芯片,例如对于需要更多内存的模型,可以将其映射到多个芯片上,几乎所有的通信都在芯片内部的高带宽网络上进行。 7. Cerebras Inference Service已经推出,提供在线推理服务。
什么是Wafer-Scale AI:GPU不可能的性能? Cerebras系统如何实现比GPU快20倍的推理速度? Cerebras系统如何支持大规模语言模型推理?
客服
商务合作
小程序
服务号
折叠