当前位置:首页 > 报告详情

HotChips34 - Groq - Abts - final.pdf

上传人: 2*** 编号:136953 2023-08-03 69页 6.62MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Groq公司的软件定义硬件架构,包括Tensor Streaming Processor (TSP) 的背景、软件定义硬件和确定性执行、TSP微架构、系统封装、拓扑、路由和流量控制等内容。 关键点包括: 1. TSP采用软件定义硬件的方法,通过静态-动态接口和硬件-软件接口,实现编译时和运行时的协同设计。 2. TSP微架构采用功能切片方法,将芯片划分为多个功能单元,如矩阵乘法单元、向量处理单元等,数据在芯片上以流的形式水平流动,指令则垂直执行。 3. 系统采用软件调度网络,通过软件来控制数据在网络中的流动,实现确定性负载均衡。 4. TSP具有高带宽的片上内存,可支持大规模并行计算,同时通过软件定义的硬件接口,允许编译器精确控制数据流动。 5. TSP支持多种数据类型,包括整数、浮点等,可广泛应用于机器学习、高性能计算等领域。 6. TSP通过冗余设计、错误检测和校正等方法,确保系统的可靠性和可扩展性。 7. TSP可扩展到大规模系统,通过软件调度网络,实现多TSP之间的确定性通信。
软件定义硬件如何实现? TSP微架构如何工作? 如何确保大规模系统中的确定性?
客服
商务合作
小程序
服务号
折叠