《电子行业AI系列之NPU:专为端侧AI而生的神经网络加速器-250420(60页).pdf》由会员分享,可在线阅读,更多相关《电子行业AI系列之NPU:专为端侧AI而生的神经网络加速器-250420(60页).pdf(60页珍藏版)》请在三个皮匠报告上搜索。
1、分析师:分析师:王芳 S0740521120002,杨旭 S0740521120001,李雪峰 S0740522080004,丁贝渝 S0740524090001证券研究报告证券研究报告日期:日期:2025年年4月月20日日【中泰电子中泰电子】AI系列之系列之NPU:专为端侧专为端侧AI而生的神经网络加速器而生的神经网络加速器1目目 录录一、一、专为端侧专为端侧AI而生的神经网络加速器而生的神经网络加速器1.1、与、与GPU定位云端定位云端AI不同,不同,NPU是端侧是端侧AI时代新需求时代新需求1.2、NPU是专用加速芯片,适用于乘法累加运算是专用加速芯片,适用于乘法累加运算1.3、NPU显
2、著提升显著提升AI模型运行效率模型运行效率二、卡位端侧下游,迎需求爆发二、卡位端侧下游,迎需求爆发三、产业趋势:近存计算大趋势,三、产业趋势:近存计算大趋势,3D DRAM+NPU方案有望受益方案有望受益四、海外大厂持续迭代推动端侧四、海外大厂持续迭代推动端侧AI布局,国产厂商加速布局布局,国产厂商加速布局五、投资建议及风险提示五、投资建议及风险提示2xVyWlYkZpMsPpNrQ9PaOaQsQoOnPsPlOnNqMfQpNmObRrRuNuOsQnRxNoNuN3来源:AI芯片:前沿技术与创新未来,中泰证券研究所人工智能的发展主要依赖两个领域的创新和演进:一是模仿人脑建立起来的数学模型
3、和算法人工智能的发展主要依赖两个领域的创新和演进:一是模仿人脑建立起来的数学模型和算法,其次是半导体集成电路其次是半导体集成电路AI芯芯片片。AI的发展一直伴随着半导体芯片的演进,1989年贝尔实验室的杨立昆(Yann LeCun)等人一起开发了可以通过训练来识别手写邮政编码的神经网络,但那个时期训练一个深度学习卷积神经网络(Convolutional Neural Network,CNN)需要长达3天,因此无法实际使用。硬件计算能力的不足,导致了当时AI科技泡沫的破灭。更高效的架构有利于推动更高效的架构有利于推动AI加速成熟加速成熟。英伟达早在1999年就发明了GPU,但直到2009年斯坦福
4、大学才发表论文介绍了如何利用现代GPU实现远超过多核CPU的计算能力(超过70倍),把AI训练时间从几周缩短到了几小时。算力算力、模型一直是模型一直是AI发展的要素发展的要素,而芯片所代表的算力则是人工智能的底层基石而芯片所代表的算力则是人工智能的底层基石。图表:图表:AI人工智能与半导体计算芯片发展历程人工智能与半导体计算芯片发展历程19401960198020002020突破模型突破模型“学习”的心理学习”的心理研究研究视觉皮层视觉皮层海马位置细胞海马位置细胞的时间编码的时间编码第一个晶体管感知器第一块芯片第一块CPU(MCU)Hopfield网络第一块FPGA神经网络芯片第一块GPU新的
5、DNN算法基于深度学习的AI芯片类脑芯片1.1、与、与GPU定位云端定位云端AI不同,不同,NPU是端侧是端侧AI时代新需求时代新需求4来源:Competition and innovation in the microprocessor industry:Does AMD spur Intel to innovate more,JPR,Gartner,IDC,中泰证券研究所时间时间1970s-1980s1990s2000s2010s2020s阶段阶段性能提升初期性能提升初期竞争加剧,应用拓展至个人竞争加剧,应用拓展至个人/家用家用进入多核时代,云服务兴起进入多核时代,云服务兴起异构兴起,数据
6、中心需求增长异构兴起,数据中心需求增长架构创新,架构创新,ARM进军进军PC和服务器和服务器技术技术/供供给端给端CPU由由4位发展至位发展至32位,位,晶体管数量发展至晶体管数量发展至120万,传统处理器架构基万,传统处理器架构基本完善。本完善。1971-Intel4004-CPU诞生;1978-Intel8086-奠定X86指令集架构;1989-Intel80486实现了5级标量流水线-CPU初步成熟。增至增至64位,晶体管数量发展至千万级;位,晶体管数量发展至千万级;高速缓存技术取得突破。高速缓存技术取得突破。1993年Intel 推出Pentium系列采用了超标量架构,能够同时执行多条