《半导体行业深度:AI加速器协同高速通信技术加速AI创新发展-240328(22页).pdf》由会员分享,可在线阅读,更多相关《半导体行业深度:AI加速器协同高速通信技术加速AI创新发展-240328(22页).pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、 AI 加速器加速器协同协同高速通信技术高速通信技术,加速加速 AI 创新发展创新发展 相关研究:相关研究:1.AI成长可期,需求复苏可望2023.12.24 行业评级:增持行业评级:增持 近十二个月行业表现近十二个月行业表现%1 个月 3 个月 12 个月 相对收益-1.67-16.3-14.8 绝对收益-0.2-11.0-27.8 注:相对收益与沪深 300 相比 分析师:王文瑞分析师:王文瑞 证书编号:证书编号:S0500523010001 TelTel:(8621)50293694 EmailEmail: 地址:地址:上海市浦东新区银城路88号中国人寿金融中心10楼湘财证券研究所 核心
2、要点:核心要点:训练端计算集群渗透率稳步提升,训练端计算集群渗透率稳步提升,AIAI 计算加速器需求上行计算加速器需求上行 业界通常根据 AI 模型发展的关键节点,将人工大智能分为训练端(Training)和推理端(Inference)。训练端的核心目标是训练出能够完成目标任务的人工智能大模型产品。训练端 AI 大模型的参数持续增多,AI 算力平台从过去依赖单一计算机的算力逐渐演变为依赖计算集群,研究显示大模型的参数、样本数与训练大模型所需 GPU 卡数呈正相关关系;大模型参数的增加会持续拉动 AI 计算加速器的需求。随着 AI 大模型训练需求及模型参数的提升,AMD 预计 2023 年至 2
3、027 年全球用于数据中心的 AI 计算加速芯片市场规模的年均复合增速约为 72.7%。网络优化提升计算集群性能,网络优化提升计算集群性能,InfinibandInfiniband 与与 RoCERoCE 方案方案市场渗透率提升市场渗透率提升 中国移动披露的数据显示大模型训练需要在不同的 GPU 网卡之间传递大量参数和梯度信息,GPU 通信时间占比达到 50%以上,提升同一机器内 GPU 与各硬件的传输效率、不同服务期间信息的传输效率对于大模型训练效率的提升至关重要。GPU 集群的跨服务器通信解决方案领域,业界多采用 InifiniBand 和 RoCE 解决方案。其中 RoCE 网络方案的普
4、及,或带动 DPU 崛起,赛迪顾问统计数据预计 2020 年至 2025 年我国 DPU市场规模年均复合增速约为 170%。RoCE 以太网正在向 400GbE/800GbE 升级演进;IDC 发布的报告显示,2023 年全球数据中心领域 200/400 GbE 交换机的收入同比增长 68.9%,DellOro 预测 2024 年将是 800GbE 以太网部署的重要一年,预计到 2027年,400 Gbps/800 Gbps 的端口数量渗透率将达到 40%以上;带动高性能以太网交换机设备及以太网交换芯片需求增长。存储设备领域,NVMe-oF+NVMe SSD 方案具有更高的性能、更低的延迟、更
5、高的可扩展性;Markets And Markets 预计受人工智能技术、物联网、数据安全等多种需求推动,2022 年至 2025 年,NVMe 市场规模年均复合增速达29.7%。投资建议投资建议 AI 大模型领域竞争的加剧叠加 AI 大模型参数的持续增长,推动大模型训练端的算力平台从依赖单一计算机的算力逐渐演变为依赖计算集群,催生了优化算力集群间跨服务器信息传输效率的需求。计算集群数量的提升,持续提振 AI 加速器(GPU、FPGA、ASIC)的市场需求。算力集群间跨服务器传输效率的优化会推升 Infiniband 及 RoCE 网络方案的市场渗透率,高性能 IB 交换机、以太网交换机,IB
6、 网卡、以太网智能网卡、DPU,NVMe SSD 等多种半导体硬件需求有望中长期受益。建议持续关注半导体行业,维持行业“增持”评级。风险提示风险提示 下游需求不及预期;企业新产品研发落地进展不及预期;政策支持力度不及预期。证券研究报告证券研究报告 2024 年年 03 月月 28 日日 湘财证券研究所湘财证券研究所 行业研究行业研究 半导体半导体行业深度行业深度 正文目录 1 AI 基础设施建设加速,奠定 AI 发展的基础.3 2 AI 大模型发展:训练至推理的全链条解析.4 2.1 训练端计算集群渗透率稳步提升,AI 计算加速器需求上行.5 2.2 网络优化提升计算集群性能,Infiniba