《电子行业专题研究:AI的进击时刻18-存储是Tokens的积分推理驱动AI存储快速增长-250919(13页).pdf》由会员分享,可在线阅读,更多相关《电子行业专题研究:AI的进击时刻18-存储是Tokens的积分推理驱动AI存储快速增长-250919(13页).pdf(13页珍藏版)》请在三个皮匠报告上搜索。
1、 识别风险,发现价值 请务必阅读末页的免责声明 1 1/1313 Table_Page 行业专题研究|电子 2025 年 9 月 19 日 证券研究报告 本报告联系人:刘倚天 19164966221 AI 的进击时刻的进击时刻 18 存储是存储是 Tokens 的积分,推理驱动的积分,推理驱动 AI 存储快速增长存储快速增长 分析师:分析师:王亮 分析师:分析师:耿正 分析师:分析师:张大伟 SAC 执证号:S0260519060001 SFC CE.no:BFS478 SAC 执证号:S0260520090002 SAC 执证号:S0260523050001 021-38003658 021
2、-38003660 021-38003657 请注意,耿正,张大伟并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管活动。核心观点核心观点:AI 服务器中的存储服务器中的存储主要包括主要包括 HBM、DRAM、SSD 等等。AI 服务器中的存储主要包括 HBM、DRAM、SSD 等,呈现性能逐级下降、容量逐级增加、成本逐级降低特征。访问频繁或者随时变更的数据会保留在较高的存储层,例如性能高的层次如 CPU/GPU 缓存、高带宽内存(HBM)和动态 RAMS;而鲜少访问或需要长期保存的数据将移动到较低的存储层,例如 SSD 和硬盘驱动器。AI 推理中的分级存储协同支撑高效计算推理
3、中的分级存储协同支撑高效计算。HBM 集成于 GPU 内部,为权重和激活值提供高带宽临时缓冲,支撑并行计算和低延迟推理。DRAM 作为系统内存,存储中间数据、批处理队列及模型输入输出,实现 CPU 与 GPU间高效数据传递。本地 SSD 用于实时加载模型参数和数据,满足高频读写需求,并存储短期检查点与临时生成内容,支撑快速迭代。HDD 提供经济大容量,用于保存原始数据、历史检查点及生成内容,保障系统长期运行与数据安全。整体来看,HBM 与 DRAM 提供即时高性能支撑,SSD 保证快速可用数据,HDD 则保障容量与可靠性,构建从高速临时访问到长期存储的完整 AI 推理生态。推理驱动推理驱动 A
4、I 存储快速增长存储快速增长。(一)内存受益于超长上下文和多模态推理需求,处理大量序列数据或多模态信息时,高带宽与大容量内存可降低访问延迟、提升并行效率。例如月之暗面 Mooncake 通过存储资源重构实现计算效率跃迁,Vera Rubin CPX NVL144 机柜新增 GDDR7,AMD MI400 升级为 MRDIMM 模组,华为 UCM 推理记忆数据管理器实现智能调度,共同支撑复杂模型在长序列和多模态场景下的高性能推理。(二)SSD 和 HDD是 Tokens 的积分。我们对推理所需 SSD、HDD 需求进行测算,基于以下关键假设:假设一、参考谷歌 2025.06单月处理超 980 万
5、亿 tokens,假设中短期内全球谷歌级推理应用数量达到 10 个;假设二、假设推理端数据均存储为 FP16 格式;假设三、除模型输入输出文本数据以外,在长上下文场景下,存储数据也包含额外调试/分析信息,比如 top-k log logprobs、时间戳、JSON 元数据等。由此测算,2026 年 10 个谷歌级推理应用所需存储容量为 49EB,投资投资建议建议。随着 AI 推理应用快速增长,对高性能内存和分层存储的依赖愈发显著,HBM、DRAM、SSD 及 HDD在超长上下文和多模态推理场景中发挥关键作用,高带宽内存保障模型权重和激活值的高速访问,SSD 满足高频读写与短期存储需求,HDD
6、提供海量长期存储支持。随着 AI 推理需求快速增长,轻量化模型部署推动存储容量需求快速攀升,预计未来整体需求将激增至数百 EB 级别。建议关注产业链核心受益标的。风险提示风险提示。AI 产业发展以及需求不及预期;AI 服务器出货量不及预期,国产厂商技术和产品进展不及预期。相关研究相关研究:电子行业:谷歌引领 AI 互联新选择,OCS 全光互联交换机前景广阔 2025-09-17 AI 的进击时刻 16:Scale up 成为 AI 时代算力扩展的核心趋势 2025-08-13 识别风险,发现价值 请务必阅读末页的免责声明 2 2/1313 Table_PageText 行业专题研究|电子 重点