《006-GAO-Peng.pdf》由会员分享,可在线阅读,更多相关《006-GAO-Peng.pdf(40页珍藏版)》请在三个皮匠报告上搜索。
1、开启算力新纪元基于RISC-V的开放算力探索和展望算能 高级副总裁 高鹏算力需求机遇It Starts WithRISC-VIntelligence Everywhere 探 索算能技术路线TPU More comprehensive support for Intelligent models Higher performance-cost ratio Higher performance-power ratio图片分类目标检测实例分割语义分割行为分析文字识别TPU1.0自研指令集 操作数为四维张量 大粒度指令:CONV、FC 支持 INT8、FP32 精度自研架构 单一指令核心、多个计算核
2、心 基于 SRAM 的近存计算自研总线 简单高效 支持广播语言处理语音识别语音合成搜索推荐更多新增支持FP16、BF16、INT32、INT16新增支持可编程重量化、反量化新增支持DeformConv、ROI Pooling新增适配Transformer的矩阵乘法指令新增支持Scatter、Gather、Mask select新增支持多种前后处理算法:全库 TopK、分库 TopK、Embedding、NMS更强卷积和矩阵乘峰值算力达到100%Transformer 类模型性能比前代提升50倍TopK、NMS 性能比前代提升10倍+TPU2.0面向智能计算的寄存器操作数据为四维张量超大长度,最
3、大可达 256KB灵活的物理存储布局支持面向智能计算的指令定义图像、语言、语音模型全支持完备、正交、高效支持多核心协作TPU3.0+RISC-VTensor扩展指令ProcessorEmbracing RISC-VFocusing on High PerformanceRRISC-V CoreL2 1MBSLC 4MBRISC-V CoreRISC-V CoreRISC-V CoreL1I-Cache 64KBD-Cache 64KBProcessor1.0RISC-V Core RV64GC Vector 0.7 SV39Cache 64 KB L1 I$&D$1 MB L2$64 MB S
4、LCProcessor2.0RISC-VCoreL2 2MBSLC&OCM 16MBRISC-VCoreRISC-VCoreRISC-VCoreRISC-VCoreRISC-VCoreRISC-VCoreRISC-VCoreRTPUL2 2MBRISC-V CoreVector 1.0SV48Cache2 MB L2$100%128 MB SLC 100%Support ECCSystemMSI-X Open OCD64-bit RISC-V 指令集Hypervisor 扩展MSI 中断处理器Vector 扩展2x 128b 向量计算单元16 核一致性子系统一致性总线支持多子系统一致性12+S
5、PECInt2k6/GHzRVA22完备的 跟踪和调试 能力先进的安全功能加密加速指令扩展Processor3.0NOC Support heterogeneous fusion computing Higher performanceRRRRRRRRRRRRRRRRSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCS
6、LC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCSLC 4MBClusterCRRouterCCHI RISC-V ClusterSLCNOC1.0Support 16 clustersSupport2 site system256bit 1GHzNOC2.0Support DVMSupport IO Coherence1024bit 2GHzSupport configurable DDR InterleaveISP+CVEnable Machines to See More ClearlyISP+CV1.0High Dy