《2024液冷技术需求市场、技术优势、产业框架与相关标的分析报告(23页).pdf》由会员分享,可在线阅读,更多相关《2024液冷技术需求市场、技术优势、产业框架与相关标的分析报告(23页).pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、2 0 2 3 年深度行业分析研究报告9W8XbZaY8XbUfVaYbRaO9PoMnNsQqMlOqQsMfQmMsP7NoOuNxNsOoPMYnQtQ主要内容主要内容1.液冷:技术奇点,算力同行2.需求:成本测算,爆发在即3.例证:冷热耦合,系统壁垒4.产业框架与相关标的1.1 1.1 历史上,散热与算力同步演进历史上,散热与算力同步演进芯片技术的演进是散热需求的最核心驱动。从技术角度看,散热技术大致经历了风冷到液冷再到风冷的阶段,当前进一步向液冷演进,驱动力在于半导体技术变化和功率密度提升。阶段一:双极型晶体管主导,第一轮风冷到液冷的演进。上世纪80年代前芯片发热量增长较平缓,风冷可
2、以满足绝大多数场景的散热需求;此后发热量指数级增长,液冷发展深入到芯片级。阶段二:CMOS技术迭代下风冷重回主流。90年代后仙童实验室CMOS流行,芯片功耗与发热量下跌,散热技术重新回到了风冷阶段,液冷技术被搁置。阶段三:当前的算力与AIDC。异构、HPC、AI等需求,散热需求复杂化,液冷重回舞台。散热技术演化的背后,是芯片技术的不断迭代资料来源:液冷革命,申万宏源研究1.2 1.2 算力网络的产业框架,液冷不可或缺算力网络的产业框架,液冷不可或缺随着半导体制程接近物理极限,先进封装是延续摩尔定律的重要路径。除通过制程工艺缩小器件尺寸、研发新材料和电路结构来提升单位面积的晶体管数量外,改变封装
3、方式提升集成电路容纳性是重要方向。多芯片的2.5D、3D封装等在提升系统性能同时,架构堆叠+系统功率与热源密度提升的背景下,高效的散热方案是刚需。AMD 3D Chiplet提升集成度和性能资料来源:AMD,申万宏源研究台积电3D Fabric路线图,芯片热源密度提升资料来源:台积电 Hot chips会议资料,申万宏源研究1.2 1.2 算力网络的产业框架,液冷不可或缺算力网络的产业框架,液冷不可或缺AI训推重构算网架构,大模型参数量的增速显著大于GPU内存增速,华为与英伟达的方案演进均表明:高集成度+大内存+多GPU的系统更适配大模型训推。因此,为应对AIDC机柜的芯片密度显著提升,传统散
4、热向高效液冷演进是必然。资料来源:Nvidia,申万宏源研究GB200 NVL72的单机柜功率 120kW,如此高的功率密度,液冷几乎是必选。左侧英伟达H100集群热负载在350kW以上,而右侧1个GB200 NVL72机柜功率就可达120kWDGX H100的Scalable Unit功耗为358kW,算力密度是彼时最高,而传统风冷的散热能力已达瓶颈;若仅以降低机柜密度的方式加强风冷效率(下图),又显著增加占地、通信成本1.3 1.3 液冷应用的场景、技术均已成熟,路径明确液冷应用的场景、技术均已成熟,路径明确芯片层面,芯片的典型功耗超过300W时,需要使用液冷才能保证算力性能释放;整机层面
5、,AI服务器单柜功率10kW级增至数十kW以上,密度激增迫切需要液冷渗透;机房层面,IDC PUE从1.5以上降至1.2只能选择液冷(测算见第二部分)。资料来源:Vertiv,申万宏源研究机柜功率密度达到数十kW时,风冷系统会失去有效性,此时可采用液冷方法1.3 1.3 液冷应用的场景、技术均已成熟,路径明确液冷应用的场景、技术均已成熟,路径明确国内主流液冷方案,包括冷板式、浸没式、喷淋式三大类,冷板式较多应用。冷板式相变浸没单相浸没喷淋式示意图原理冷板贴近热源(xPU),利用冷板中的冷却液带走热量服务器完全浸没在冷却液中,冷却液蒸发冷凝相变带走热量服务器完全浸没在冷却液中,冷却液循环流动带走
6、热量冷却液从服务器顶部喷淋,对流换热降温特点硬件系统改造小,维护简单;(单相+相变)接头、密封件多,可靠性要求高散热能力强、功率密度高,静音;服务器刀片式,专用机柜,管理控制复杂散热能力强、功率密度高,静音;清理拆装难,较少运维经验静音,节省液体;运维复杂,排液补液复杂,密封结构生态IT、冷媒、管路、供配电等不统一;服务器多与机柜深度耦合定制化,光模块兼容待验证定制化,光模块兼容待验证冷媒国产化较少资料来源:电信运营商液冷技术白皮书,申万宏源研究华为Atlas 900 A2 PoD为例,机房采用二次换热Intel与浪潮信息等设计的全液冷服务器节点资料来源:华为技术文档,申万宏源研究资料来源:I