当前位置:首页 > 报告详情

HC2022_Cerebras_Final_v02.pdf

上传人: 2*** 编号:136689 2023-08-03 34页 3.32MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了 Cerebras 公司如何应对机器学习领域的巨大计算需求挑战。文章指出,传统的 GPU 集群在扩展性和效率方面面临限制,而 Cerebras 采用了一种全新的 wafer-scale engine (WSE-2) 架构,以实现核心架构、规模化和扩展性的飞跃。WSE-2 拥有 850,000 个核心,2.6 万亿个晶体管,40GB 的内存 bandwidth,以及 7nm 的工艺技术。这种架构能够实现高达 7x 的正常化内存 bandwidth 和 66x 的正常化计算性能提升,相比于 GPU 有着显著的优势。Cerebras 的 CS-2 系统能够支持从 BERT 到 GPT-3 这样的大型模型,且能够在不分区的情况下处理整个 wafer 上的计算任务。此外,Cerebras 采用了一种称为 SwarmX 的专用互连技术,通过这种技术,数据并行处理可以在多个 CS-2 系统之间高效地进行。文章最后强调,Cerebras 的架构不仅能够满足当前的需求,而且随着模型规模的持续增长,其价值将更加凸显。
"如何实现大规模神经网络的训练?" "如何解决传统GPU训练大规模神经网络的挑战?" "Cerebras架构如何推动神经网络模型训练的极限?"
客服
商务合作
小程序
服务号
折叠