当前位置:首页 > 报告详情

HC2022.NTT.kenji_tanaka.v1.pdf

上传人: 2*** 编号:136963 2023-08-03 16页 1,010.52KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了一种新型的网络接口卡(VTA-NIC),它集成了深度学习推理服务(DLIS)功能,旨在消除CPU的干扰,提高深度学习模型的推理效率。VTA-NIC将硬件数据路径、REST API解析器/生成器以及多个VTA(通用张量加速器)集成在NIC中。其核心频率为213MHz,每个核心拥有169个MAC,内存吞吐量为19.2GB/s。与NVIDIA V100 GPU相比,VTA-NIC在DLIS的功率效率上提高了6.1倍,且在高负载下,预测性尾延迟显著优于传统系统。此外,VTA-NIC通过集成TVM-VTA和桥接VTA指令与Web API的电路,实现了对更通用模型的推理以及对其他服务的简单连接。研究表明,这种架构在未来的芯片设计中有着巨大的性能提升空间。
如何实现深度学习推理服务? VTA-NIC如何提高推理性能? 如何解决异构系统中的尾延迟问题?
客服
商务合作
小程序
服务号
折叠