当前位置:首页 > 报告详情

超越硬件:实现高效AI推理的全栈优化.pdf

上传人: c** 编号:464947 2025-01-12 34页 1.24MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
Furiosa AI致力于通过其数据中心的AI加速器RNGD,实现高效的AI推理。RNGD针对大型语言模型(LLM)和其他生成式AI模型设计,具有512 TFLOPS的性能,48GB的内存容量,以及150W的TDP。其特点包括:1)比现有推理解决方案节能60%;2)支持多种低精度推理,提高效率;3)适用于空气冷却的数据中心;4)支持虚拟化和安全启动。RNGD可分页关注消除计算和I/O浪费,块状KV缓存减少内存浪费,实现高吞吐量。此外,Furiosa Quantizer提供自动量化工具,支持自定义LLM模型。RNGD通过空间分割,适用于容器和VM环境,提高NPU利用率。总之,Furiosa AI的RNGD硬件、编译器和量化器共同提供高效、低功耗的AI推理,通过软件堆栈优化,实现资源的最大化利用。
如何实现高效AI推理?" 如何推动AI发展?" 如何让AI计算更可持续?"
客服
商务合作
小程序
服务号
折叠