《013-陈俭东.pdf》由会员分享,可在线阅读,更多相关《013-陈俭东.pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、RISC-V融合AI技术的芯片实践和应用进迭时空 K1 AI-CPU的产品化 一、RISC-V融合AI技术二、进迭时空K1 AI-CPU三、支持模型及实践四、落地应用23RISC-V融合AI技术ARM架构中心控制模式RISC-V架构创新模式以CPU形式提供AI算力融入主流的CPU推理生态ARM核NPU核GPU核.DRAMPCIEI/O.GPU核.DRAMPCIEI/O.RISC-V AI CPU核4X60:原生AI算力的智算核 全球首款支持256bit RVV1.0的RISC-V处理器 双发射8级按序 双发射的Vector load/store RVA22 Profile+Vector 1.0
2、+IME(Integrated Matrix Extension)Cache+TCM的双缓存架构 复用RVV寄存器,扩展16条IME指令双发射 vector load/storeRVA22 Profile256bitRVV 1.0IntegratedMatrixExtensionTCM PoolCache提高访问带宽提高访问带宽降低访问延时Tensor Unit5X60 扩展 16 条 AI 指令MobileNetv1ResNet50 v2Inception v3YoloLcnet 05020.48%22.58%16.62%21.65%18.55%Matrix Sliding02CONVIns
3、t:VMADOT-1 4 VMADOT-2 4 VMADOT-3 4Matrix02GEMMInst:VMADOT-0 4相同AI算法X60 指令仅为Arm Neon的20%使用RVV1.0加速的软件库和SpacemitT IME指令6SpacemiT Key Stone K1 自研RISC-V智算核X60,RVA22 Profile 8核同构X60,频率最高2.0GHz CPU算力50 KDMIPS,AI算力 2.0 TOPSINT8 单核算力是ARM Cortex-A55的1.3倍 接入全球主流的CPU推理生态,支持所有AI模型部署 最大16GB LPDDR4X 典型功耗3.5W7X60智
4、算核性能指标存储性能运算性能浮点性能能耗指标8存储性能对比Relative Performance(Higher is Better)LMbench ReadLMbench WriteLMbench CopyLMbench RandMem1.071.191.250.89(Lower is Better)1.01.051.161.21Stream CopyStream ScaleStream AddStream Triad使用SpacemiT LLVM Compiler9运算性能对比Relative Performance(Higher is Better)存储性能(dbench T/P)网络性
5、能(iperf-pps)压缩性能(zlib-adler32)图像性能-1(libjpeg-rgb2ycbcr)图像性能-2(libpng-rgb2ycbcr)绘制性能-3(libpng-rgb2ycbcr)1.7 1.0 1.2 1.53 2.14 1.19使用SpacemiT LLVM Compiler和RVV 1.0加速的软件库10ResizebilinearResizeNNWarpAffinemedianBlurcvtColorRGB2.6202000400060008000100001200002004006008001000RISC-V X60ARM A55Eigen-SGEMM性能
6、OpenCV性能1.671.921.981.56向量计算性能对比Relative Performance(Higher is Better)使用SpacemiT LLVM Compiler和RVV 1.0加速的软件库OpenCV(K1 X60 vs 某款主流ARM A55芯片):基于RVV 1.0加速的OpenCV,如预处理、颜色空间转换、图形学等优化图像处理场景的性能111.181.220.982.820.971.201.192.441.451.151.761.000.860.950.710.890.920.98Relative Performance