当前位置:首页 > 报告详情

FuriosaAI RNGD:用于可持续人工智能计算的张量收缩处理.pdf

上传人: c** 编号:465009 2025-01-12 33页 2.85MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
RNGD是一种面向可持续AI计算的Tensor Contraction Processor,由FuriosaAI的创始人兼CEO June Paik介绍。该处理器旨在实现高效的AI计算,降低能耗,使强大的AI技术普及。RNGD具有512 TFLOPS的计算能力,支持多种精度(如FP8、BF16、INT4等),并通过PCIe P2P支持高速通信。其硬件设计专注于提高效率,软件栈则全面优化,支持PyTorch 2.0、模型量化工具、张量/管道/数据并行等。RNGD还能通过直接P2P降低多卡之间的延迟,支持虚拟化,并提供安全的启动和模型加密。文章还讨论了Tensor Contraction的硬件架构和芯片设计,以及如何通过低级einsum优化 tensor contraction。此外,文章还提到了信号和电源完整性在HBM集成中的挑战,以及Furiosa RNGD软件栈的详细信息,包括模型编译和优化、自动量化等。最后,文章强调了RNGD在数据中心AI加速中的重要性,特别是在LLM和其他生成式AI模型时代。
"RNGD芯片如何实现可持续AI计算?" "FuriosaAI如何通过软件优化硬件性能?" "RNGD处理器在数据中心中的应用前景如何?"
客服
商务合作
小程序
服务号
折叠