《020--费晓龙.pdf》由会员分享,可在线阅读,更多相关《020--费晓龙.pdf(17页珍藏版)》请在三个皮匠报告上搜索。
1、RISC-V服务器级CPU关键技术实践公司机密 请勿转发RISC-V高性能核X100功能特性RISC-V服务器级CPU功能特性关键技术实践生态产品2SpacemiT X100TMCore 智算核3国内首款完整支持虚国内首款完整支持虚拟化的全扩展高性能拟化的全扩展高性能RISC-V处理器处理器完全兼容RVA23特性的RISC-V处理器支持RISC-V标准虚拟化,支持处理器虚拟化、内存虚拟化、中断虚拟化以及外设虚拟化完整实现Hypervisor扩展,支持2级地址转译,即内存虚拟支持AIA中断虚拟化支持核外搭配 IOMMU 组成完整虚拟化系统面向面向AI应用的通用算力应用的通用算力支持RVV1.0标
2、准Vector扩展的高性能处理引擎面向AI应用定制INT4通用算力,单核可达1TOPS面向未来的多核多芯互面向未来的多核多芯互联联支持多核多cluster配置,覆盖不同性能与功耗需求的场景支持CHI总线接口,实现多芯互联!基于open c910研发SpacemiT X100TMCore 智算核4兼容RVA23 Profile RISC-V最新特性支持RV64GCVBH标准扩展支持Vector Crypto.支持Sv48内存翻译模式,提供更大虚拟地址范围高安全性支持RISC-V PMP,ePMP实现核内安全隔离提供IOPMP达成系统级安全解决方案提供等效于ARM V9 CCA的安全计算能力能够抗
3、幽灵、熔断攻击等攻击手段支持 RV 官方 RERI 标准的 RAS 事件上报灵活可配且易用支持CACHE大小,核心数量,AI扩展,虚拟化等可配置支持RISC-V标准Debug协议,兼容开源调试软件和Probe支持指令Trace,高效追踪程序轨迹基于open c910研发X100配置选项5配置配置可可选项选项备注备注L1 CACHE32KB/64KBL1 CACHE可配置ECC/parityShared L2 CACHE256KB-4MBL2 CACHE可配置ECCMMUSv39/48可支持至多1TB物理内存AI Extension有/无单核可额外配置1TOPSINT4算力多核/多Cluster
4、1-4核/cluster支持核心数及cluster数可配置总线接口ACE/CHI.D128/256bits除此之外,还配置有专用外设接口PP及CACHE一致性接口CCP虚拟化有/无可配置虚拟化以支持更多OS和应用AIA中断源数量至多1023个外部直连中断源及2047个MSI中断源X100完整虚拟化支持6虚拟中断AIA虚拟设备IOMMUM mode S mode OSHS 管理程序U mode应用程序S mode OSU mode应用程序S mode OSU mode应用程序 CPU虚拟化+内存虚拟化 支持 Hypervisor 1.0扩展 支持 SV48x4,SV39x4 guest 地址管理
5、 支持最大 16384 个虚拟 CPU 中断虚拟化 支持标准 AIA中断控制器 支持最大 2047个 MSI 输入 支持最大 1023个外部直连中断 支持 MSI 与直连中断可配 支持 256 个 中部中断优先级 设备虚拟化 IOMMUX100矢量及AI引擎7 Vector关键特点 支 完全兼容RISC-V Vector 1.0版本 支持VLEN=256;ELEN=64(支持INT8INT64,FP1664)DPLEN=128(datapath width)并行宽度:2xDPLEN矢量存储,2xDPLEN矢量运算 VPR按BANK访问,降低访问冲突 可双核共享的矢量运算单元 AI(matrix
6、)算力特点 支持深度定制的AI扩展指令,包括若干矩阵乘和滑窗指令 支持复用VPR寄存器,算力灵活 单条AI指令支持128 MAC(INT8)4核可提供4 TOPS算力2.5GHzX100的AI部署8 X100的AI部署和优化 轻量化插件方式,接入onnxruntime,复用其开原生态 支持onnx算子全集,快速实现onnx模型部署 可编程性高,实现量化计算的精细化、多样化,实现离线优化 运行时通过简单的线程调度,即可灵活调整所使用的AI算力资源,实现在线优化X100 PPA9工艺TSMC 12nm频率TT/1.0V/85C2.4GHz面积(mm2)1.5