1、 1 AI 芯片产业研究报告一、AI 芯片分类AI 芯片,作为一种专门为人工智能应用设计的高性能微处理器,其主要目的是满足深度学习、机器学习等复杂计算任务的需求。这类芯片能够在有限的时间内处理大量数据,并高效地执行大量并行计算。通过提供强大的计算能力,AI芯片为神经网络的训练和推理提供了基础支持。按照不同技术架构 AI 芯片可分为 GPU、FPGA、ASIC。GPU最初是专门用于游戏图形加速,但它们可以用于加速深度学习和神经网络的训练和推理。FPGA 是可重新配置的硬件,可以专门定制用于特定的 AI 任务。ASIC 是专用 AI 芯片,能够提供比通用处理器更高的效率和性能。不同技术架构的 AI
2、 芯片技术特性对比如下:图 1-不同技术架构 AI 芯片对比图 1-不同技术架构 AI 芯片对比 2 二、AI 芯片微架构AI 芯片是由硬件实现的一组图形函数的集合,这些函数主要用于绘制各种图形所需要的运算。这些和像素、光影处理、3D 坐标变换等相关的运算由 GPU 硬件加速来实现。图形运算的特点是大量同类型数据的密集运算如图形数据的矩阵运算,GPU 的微架构就是面向适合于矩阵类型的数值计算而设计的,大量重复设计的计算单元,这类计算可以分成众多独立的数值计算大量数值运算的线程,而且数据之间没有像程序执行的那种逻辑关联性。图 2-Nvidia 芯片 Ampere 架构图 2-Nvidia 芯片
3、Ampere 架构AI 芯片微架构的设计研发是非常重要的,先进优秀的微架构对实际性能的提升是至关重要的。目前市面上有非常丰富的 AI 芯片微架构,比如 Pascal、Volta、Turing(图灵)、Ampere(安培)、Hopper,分别发布于 2016 年、2017 年、2018 年、2020 年、2022 年,代表着英伟达 GPU 的最高工艺 3 水平。GPU 微架构的运算部份由流处理器(Stream Processor,SP)、纹理单元(Texture mapping unit,TMU)、张量单元(Tensor Core)、光线追踪单元(RT Cores)、光栅化处理单元(ROPs)组
4、成。这些运算单元中、张量单元、光线追踪单元由 NVIDIA 在伏特/图灵微架构引入。Nvidia 不同架构 AI 芯片性能对比如下:图 3-Nvidia 不同架构 GPU 性能对比图 3-Nvidia 不同架构 GPU 性能对比三、IT 行业 AI 芯片应用(一)“云-边-端”协同应用框架(一)“云-边-端”协同应用框架 4 图 4-AI 云-边-端协同应用框架图 4-AI 云-边-端协同应用框架如图 4 所示,AI 芯片应用已形成规范的“云-边-端”协同应用场景框架,可分为云计算层、边缘层、终端层 3 个层面。云计算层主要承载云端训练和云端推理任务,包括智能数据分析、模型训练任务等。边缘计算
5、层负责范围内的数据计算和存储工作;同时负责将连续数据汇总至计算层,最终由云计算层完成分析挖掘、数据共享工作,下发结果或模型至边缘和终端层。终端层主要承担推理任务,包括数据收集、环境感知、人机交互以及部分推理决策控制任务等。(二)不同场景 AI 芯片需求(二)不同场景 AI 芯片需求按照“云-边-端”应用场景框架,不同层面芯片性能需求、特性需求差异显著。云端芯片具有高吞吐率、高处理能力、高精度、低时延、可扩展、高内存高带宽的特性。边缘端芯片性能、稳定性、扩展性均在云端芯片和终端芯片之间。终端芯片具有体积小、低时延、低能耗、低成本、高安全性的特性。具体情况如下图所示:5 图 5-不同场景 AI 芯
6、片需求图 5-不同场景 AI 芯片需求四、IT 行业 AI 芯片玩家(一)国外玩家(一)国外玩家国外玩家主要为 Intel、Nvidia 和 AMD 三家。云端芯片主要厂商为英伟达(Nvidia)、超威(AMD),其主要产品分别为 Tesla、Instinct;终端芯片包括集成芯片和独立芯片两大类别,主要厂商为英特尔(Intel)、英伟达(Nvidia)、超威(AMD),主要产品分别为 Intel HD 系列、Nvidia Geforce系列、AMD Radeon 系列。当前,NVIDIA 的 AI 芯片在国际市场处于垄断地位。全球AI 芯片市场份额如下图 6 所示,6 图 6-全球 GPU