《光通信产业系列报告之一新技术巡礼:深度拆解Google OCS及其产业链演进的投资机遇-240125(35页).pdf》由会员分享,可在线阅读,更多相关《光通信产业系列报告之一新技术巡礼:深度拆解Google OCS及其产业链演进的投资机遇-240125(35页).pdf(35页珍藏版)》请在三个皮匠报告上搜索。
1、 证 券 研 究 报证 券 研 究 报 告告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载未经许可,禁止转载 行业研究行业研究 通信通信 2024 年年 01 月月 25 日日 光通信产业系列报告之一 推荐推荐(维持)(维持)新技术巡礼:深度新技术巡礼:深度拆解拆解 Google OCS 及其产及其产业链演进的投资机遇业链演进的投资机遇 Google 位居位居 AI 行业第一梯队,有望进一步加强行业第一梯队,有望进一步加强 AI 领域投资领域投资。Google 深耕 AI技术多年,为大模型领域奠基者,最新发布 Gemini 多模态模型,彰显其在
2、 AI领域的深厚底蕴。为满足内外部业务需求,Google 持续加强算力建设,特别是采取自研 TPU(张量处理器)的方式,满足自身如大模型训练/推理等相关的算力需求,同时也对外提供算力支持。TPU 为 Google 推出的用于机器学习的专用处理器,采用脉动阵列可加速大矩阵计算,更适合 AI 应用场景。TPU 历经多代的持续更迭,已成为 Google 大模型训练的主力军。AI 赋能下 Google 利润率及营收增速迎来拐点,其中 Google Cloud 业务占比提升迅速,有望成为公司第二成长曲线。AI 计算需求大幅增长下服务器及数据中心投资快速增长,推动 Google 资本开支进入向上通道,有望
3、进一步加强 AI 领域投资。自研基于自研基于 OCS 的光连接新方案,进一步提升的光连接新方案,进一步提升 TPU 集群性能。集群性能。Google 在建设自己的数据中心过程中,由于在部署规模、灵活可用、模块化部署、安全性、功耗和性能等方面有更高要求,传统电交换不满足相关的互联需求,因此引入了 OCS 形成新的解决方案。在搭建 TPUv4 的集群时,与传统 Infiniband 交换机方案相比,OCS 方案成本更低,功耗更低,部署更快,其中 OCS 和其他光学组件的成本在系统总成本的占比低于 5%,功耗占比低于 3%。目前 OCS 在Google 基础设施中主要有 Jupiter 数据中心和
4、TPU 数据中心两大应用场景,其中后者为专注于 AI 算力的数据中心。深度剖析深度剖析 Google OCS 解决方案:器件高度定制化。解决方案:器件高度定制化。基于 MEMS 的光交换方案在对数据速率及波长不敏感、低功耗、低延迟等方面都具备优势,Google 选择自研 OCS、光模块和光环形器三大主要器件,以构成一个低成本高效益的大规模光交换系统。其中:1)MEMS 反射镜是 OCS 的核心组成器件,OCS 的创新性应用,有助于 MEMS 代工业务的拓展。全球 MEMS 代工厂排名近几年的排名相对稳定,其中赛微电子的全资控股子公司 silex 已连续数年保持排名第一;2)光模块为适配 OCS
5、 需求,被重新定制化设计为使用环形器+CWDM4/8的最新一代 Bidi OSFP 封装。光模块国内企业具有较强竞争力,未来应用技术难度更高,客户粘性有望持续提升;3)环形器被创新性引入光模块内,传输效率进一步提升。环形器供应链较为成熟,核心器件法拉第旋转片国产化程度较低,偏振分束器近年国内厂商如腾景科技等已具备量产能力;4)光芯片与电芯片因更高链路预算需求而配套升级,EML 及 DSP 芯片均以海外供应商为主,国产化程度较低;5)铜缆与光纤受益 Rack 内外连接,带来较大需求。AI 浪潮加速浪潮加速算力算力基础设施的演进,重点关注产业演变趋势带来的机遇。基础设施的演进,重点关注产业演变趋势
6、带来的机遇。AI 浪潮将带来算力基础设施建设的加速,同时也催生如 Google OCS 等新型技术的成熟和落地部署,有望推动产业的演进趋势:1)自研低成本算力部署方案或成为新选择,有助于算力基础设施的快速建设;2)AI 巨头的算力需求景气度高,进一步推动高度定制化成为新商业模式;3)网络架构升级将催生如 OCS等新型设备的落地应用,带来产业格局变化。投资建议:投资建议:随着 AI 行业成熟度逐步提升,海量算力需求将持续释放,给光模块光器件光芯片的整条光互联产业链都将带来长期而有力的拉动。以 Google OCS 为代表的新型算力光互联解决方案有望得到更多应用,产业格局因此而出现新的变化,更多的
7、产业机遇将逐步明晰。建议关注算力释放带来的全产业链机遇,并重点关注新技术新方案从 0 到 1 演进带来的产业预期差。建议核心关注中际旭创中际旭创、天孚通信天孚通信、腾景科技腾景科技、源杰科技源杰科技。风险提示风险提示:全球宏观经济发展不及预期,国际贸易局势进一步紧张,AI 产业发展不及预期,产业供应格局出现较大变化 证券分析师:欧子兴证券分析师:欧子兴 邮箱: 执业编号:S0360523080007 行业基本数据行业基本数据 占比%股票家数(只)126 0.02 总市值(亿元)36,584.08 4.56 流通市值(亿元)11,530.53 1.86 相对指数表现相对指数表现%1M 6M 12
8、M 绝对表现-6.3%-17.3%3.8%相对表现-3.2%-1.9%26.5%相关研究报相关研究报告告 空天信息产业系列报告之一:奇点将至:论我国低轨卫星通信产业化落地 2024-01-10 通信行业周报(20231211-20231217):AI 领域光通信需求向上趋势明显,星链“直连小区”卫星发射在即 2023-12-17 通信行业 2024 年度投资策略:紧抓卫星通信+光模块双主线投资机会 2023-12-14 -23%-2%19%40%23/0123/0423/0623/0823/1124/012023-01-302024-01-23通信沪深300华创证券研究华创证券研究所所 通信行
9、业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载未经许可,禁止转载 投资投资主题主题 报告亮点报告亮点 本报告针对 Google 的 OCS 光互联解决方案进行深度剖析,对其中的技术原理、设备结构、元器件产业链格局进行深入分析,并对由此可能带来的算力基础设施演进做出趋势判断,前瞻性提出应重点关注新技术新方案从 0 到 1演进带来的投资机会。报告主体部分主要分成四个章节。第一章节先是介绍Google 在 AI 领域的领导地位,对其大模型和算力设施布局进行梳理,重点对其自研 AI 芯片 TPU 进行介绍,并结合业绩表
10、现和资本开支预判其在 AI 领域的投资有望进一步加强;第二章节则对 OCS 解决方案的两大应用场景,Jupiter 数据中心和 TPUv4 数据中心进行介绍;第三章则对 OCS 解决方案的系统构成和产业格局进行分析,深入拆解 OCS 的各部分组成元器件,并对各元器件产业链进行梳理;第四章则是根据以 OCS 为代表的新型光互联解决方案的发展模式,归纳出三点行业发展的趋势判断,指引投资选择。投资逻辑投资逻辑 随着 AI 行业成熟度逐步提升,海量算力需求将持续释放,给光模块光器件光芯片的整条光互联产业链都将带来长期而有力的拉动。以 Google OCS 为代表的新型算力互联解决方案有望得到更多应用,
11、产业格局因此而出现新的变化,更多的产业机遇将逐步明晰。建议关注算力释放带来的全产业链机遇,并重点关注新技术新方案从 0 到 1 演进带来的产业预期差。建议核心关注以下标的:中际旭创(中际旭创(300308):全球知名的光模块头部供应商。):全球知名的光模块头部供应商。公司凭借行业领先的技术研发能力、低成本产品制造能力和全面可靠的交付能力等优势,赢得了海内外客户的广泛认可,并保持在数通光模块细分市场的领先优势和份额。天孚通天孚通信(信(300394):业界领先的光器件整体解决方案提供商。):业界领先的光器件整体解决方案提供商。公司通过自主研发和外延并购,在精密陶瓷、工程塑料、复合金属、光学玻璃等
12、基础材料领域积累沉淀了多项全球领先的核心工艺技术,为全球客户提供多种垂直整合一站式产品解决方案。腾景科技(腾景科技(688195):深耕定制化精密光学元件。):深耕定制化精密光学元件。公司基于核心技术,为客户提供定制化的光电子元器件产品,已与全球主要的光模块/设备厂商和光纤激光器厂商建立了合作关系,同时优势产品在细分领域具有较高的市场影响力。源杰科技(源杰科技(600498):稀缺的高端光芯片国产代表企业。):稀缺的高端光芯片国产代表企业。公司目前产品包括2.5G、10G、25G、50G、100G 光芯片产品、CW 光源、车载激光雷达光源等产品,在境内外市场开拓了众多的直接或间接优质客户。dV
13、xUMAhXnUaUpW7NdN6MnPpPnPnRiNpPpOlOnPrPaQqQyRMYnPnRuOpMxO 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 3 目目 录录 一、一、Google 位居位居 AI 行业第一梯队,有望进一步加强行业第一梯队,有望进一步加强 AI 领域投资领域投资.6(一)Google 为大模型领域奠基者,最新发布的 Gemini 彰显深厚底蕴.6 1、超前提出 AI First 战略,长期深耕大模型和算力设施.6 2、自研的 AI 芯片 TPU,支撑 Google AI 技术及业务发展的重要
14、利器.8(二)Google Cloud 支撑公司业绩向好,AI 领域投资有望进一步加强.11 二、二、自研基于自研基于 OCS 的光连接新方案,进一步提升的光连接新方案,进一步提升 TPU 集群性能集群性能.14(一)OCS 的应用场景 1:Jupiter 数据中心.14(二)OCS 的应用场景 2:TPUv4 计算中心.17 三、三、深度剖析深度剖析 Google OCS 解决方案:器件高度定制化解决方案:器件高度定制化.20(一)基于 MEMS 器件的 OCS 成为新的光交换方案.20(二)适配 OCS 需求,定制化设计光模块.22(三)光模块内创新性引入环形器,传输效率进一步提升.24(
15、四)更高链路预算需求带来的光芯片与电芯片配套升级.26(五)两层连接释放大量铜缆与光纤需求.28 四、四、AI 浪潮加速算力基础设施的演进,重点关注产业演变趋势带来的机遇浪潮加速算力基础设施的演进,重点关注产业演变趋势带来的机遇.29(一)趋势 1:自研低成本算力部署方案或成为新选择,有助于算力基础设施的快速建设.29(二)趋势 2:AI 巨头的算力需求景气度高,进一步推动高度定制化成为新商业模式.30(三)趋势 3:网络架构升级将催生如 OCS 等新型设备的落地应用,带来产业格局变化.31 五、五、投资建议投资建议.33 六、六、风险提示风险提示.33 通信行业深度研究报告通信行业深度研究报
16、告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 4 图表目录图表目录 图表 1 2017 年以来,Google 在 AI 大模型方向的重要里程碑.6 图表 2 Gemini Ultra 与 GPT-4 的性能对比.7 图表 3 Gemini 专为多模态用例而设计.7 图表 4 SGE 应用 AI 提升用户搜索体验.8 图表 5 Google Engine 提供可挂载 GPU 的虚拟机服务.8 图表 6 TPUv4 芯片的逻辑架构.8 图表 7 CPU、GPU、TPU 工作原理对比.9 图表 8 TPU 采用脉动阵列以提升计算吞吐量.9 图表 9 TPU 性能逐步
17、提升.10 图表 10 Google 的 TPU 训练负载分配情况.11 图表 11 Google 分季度营业收入及利润率.11 图表 12 Google 分季度各业务收入占比.12 图表 13 Google Cloud 业务季度收入持续增长.12 图表 14 海外主要云厂商近年各季度资本开支情况.13 图表 15 Google 历代数据中心网络的演进.14 图表 16 Google 第五代网络架构 Jupiter 的内部结构.15 图表 17 传统 CLOS 架构与引入 OCS 网络架构的对比.16 图表 18 在 OCS 基础上引入 WDM、环形器等技术的 Jupiter 网络.16 图表
18、 19 TPUv4 单芯片封装(左)和 Tray(右).17 图表 20 单个 TPUv4 Rack 由 16 个 TPUv4 Tray 组成.17 图表 21 8 8 Rack 构成整个 TPUv4 计算机系统.18 图表 22 一个 cube(rack)由 64 个 TPU 节点组成.19 图表 23 每个 cube 都需要和三个方向的 OCS 连接,组成 3D Torus 拓扑.19 图表 24 64 个 TPUv4 rack 与 48 个 OCS 之间需要 6144 条光纤连接.19 图表 25 OCS 的内部构造及实际布局.20 图表 26 MEMS 反射镜结构和核心组成.21 图表
19、 27 OCS 的整体架构.21 图表 28 MEMS 在电信领域的市场增长较快.22 图表 29 2012-2021 年度全球 MEMS 代工厂排名.22 图表 30 数据中心网络中 WDM 光模块的演进.22 图表 31 CWDM4(上)和 CWDM8(下)的光模块.22 图表 32 中国企业已占据全球光模块 Top10 榜单最多数量.23 图表 33 部分光模块企业在 800G/1.6T 产品布局.23 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 5 图表 34 环形器可实现单光纤的双工通信.25 图表 35 环形
20、器基于光偏振的实现原理.25 图表 36 腾景科技可提供光模块中的环形器.26 图表 37 OCS 配套光模块需改动的光芯片与电芯片设计.27 图表 38 Credo 面向 800G 的单向 PAM4 DSP.27 图表 39 TPUv4 板间通过 4 个 OSFP 连接器实现互联.28 图表 40 TPUv4 超级计算机中使用了大量的光缆连接.28 图表 41 TPUv4 与 A100 在 MLPerf 测试的表现对比.29 图表 42 TPUv4 与 A100 在 MLPerf 测试的功耗对比.29 图表 43 Omdia 测算 2023Q3 A100 和 H100 出货量约为 500K.
21、30 图表 44 Google 推出的零样本视频生成应用 Video Poet.30 图表 45 技术能力和客户关系奠定供应链企业的受益确定性.31 图表 46 数据中心拓扑架构演进.32 图表 47 在 Dragonfly 拓扑中应用 OCS.32 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 6 一、一、Google 位居位居 AI 行业第一梯队行业第一梯队,有望进一步加强有望进一步加强 AI 领域投资领域投资(一)(一)Google 为大模型领域奠基者,为大模型领域奠基者,最新发布最新发布的的 Gemini 彰显深厚
22、底蕴彰显深厚底蕴 1、超前提出超前提出 AI First 战略,长期深耕战略,长期深耕大模型大模型和算力设施和算力设施 Google 深耕深耕 AI 技术多年,技术多年,为大模型领域奠基者。为大模型领域奠基者。早在 2017 年,Google 就已经把发展战略从 Mobile First 转变为 AI First。同年 Google 发布 NLP 模型 Transformer,该模型通过引入 Self-Attention 机制,利用注意力机制来提高模型训练速度,使得模型可以并行化训练,这也为后续大语言模型的升级迭代奠定了基础。2018 年,Google 发布大规模预训练模型 BERT,可以进行
23、双向预测,该模型进一步提升了自然语言理解及处理的精度。2022年,Google 推出模型 PaLM,该模型在语言理解、逻辑推理、代码生成等方面均实现了出色表现。2023 年以来,Google 先后推出 PaLM2 及 Gemini,模型能力进一步提升。图表图表 1 2017 年以来,年以来,Google 在在 AI 大模型大模型方向的重要里程碑方向的重要里程碑 资料来源:飞哥说AI公众号OpenAI 何以掀翻 Google 布局多年的AI大棋?,华创证券 最新发布最新发布 Gemini 多模态模型,多模态模型,Google 彰显彰显 AI 深厚底蕴深厚底蕴。美国时间 2023 年 12 月 6
24、日,Google 正式发布该公司“规模最大、功能最强”的多模态大模型 Gemini,引发市场高度关注。根据 Google 披露,Gemini 是基于 Transformer decoder 构建的原生多模态模型,其性能较原有的单一模型更为全面,支持 32K 的 contex 长度。在大型语言模型(LLM)研发中使用的 32 个广泛使用的学术基准中,Gemini Ultra 性能有 30 个都超过了当前最先进的结果,其中 Gemini Ultra 的 MMLU(大规模多任务语言理解)得分为 90.0%,是第一个优于人类专家的模型,多个任务性能表现也都超过 GPT-4。Google 未来会将 Ge
25、mini 融入到自身业务中,例如搜索、广告、Chrome 和 Duet AI等。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 7 图表图表 2 Gemini Ultra 与与 GPT-4 的的性能对比性能对比 图表图表 3 Gemini 专为多模态用例而设计专为多模态用例而设计 资料来源:Google官网,华创证券 资料来源:Gemini Team,GoogleGemini:A Family of Highly Capable Multimodal Models,华创证券 为满足为满足内外部内外部业务业务需求,需求,Goo
26、gle持续持续加强加强算力算力建设建设。除了在大模型领域引领行业发展外,Google 在算力设施方面也有持续的布局,以满足企业内外部的业务需求。对内,Google将 AI 技术深度赋能公司各项业务,包括搜索、地图、广告等公司传统的优势业务,例如公司推出了 SGE(Search Generative Experience)搜索引擎,利用 AI 改进用户搜索体验;对外,Google 通过 Google Cloud 可以提供从 IaaS 到 PaaS 到 SaaS 的 AI 相关一系列服务,其中Compute Engine是Google Cloud的计算托管服务,提供可添加到虚拟机实例的GPU,实现
27、智算算力的对外供应。为了满足以上对内对外的算力需求,Google 一方面通过部署成熟的 GPU 资源提供算力服务,如最新发布的 A3 超级计算机即可提供 Nvdia H100 GPU算力;另一方面采取自研 TPU 的方式,满足自身如大模型训练/推理等相关的算力需求,同时也可对外提供算力支持。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 8 图表图表 4 SGE 应用应用 AI 提升用户搜索体验提升用户搜索体验 图表图表 5 Google Engine 提供可挂载提供可挂载 GPU 的虚拟机服务的虚拟机服务 资料来源:blo
28、g.google,华创证券 资料来源:科技云报道,华创证券 2、自研自研的的 AI 芯片芯片 TPU,支撑支撑 Google AI 技术技术及业务及业务发展的发展的重要重要利器利器 TPU(张(张量量处理器)为处理器)为 Google 推出推出的用于的用于机器学习机器学习的的专用专用处理器。处理器。为提升处理器训练和学习神经网络的计算能力,Google 用 15 个月的时间成功设计第一款张量处理器 TPU,并于 2016 年正式发布。该处理器专用于机器学习,擅长大型矩阵运算,可以更高效地训练模型,芯片内集成的 HBM 也有助于更大规模的模型训练,此外多个 TPU 可以组成 Pod集群,极大地提
29、升了神经网络工作负载的效率。TPU 芯片在不同的版本中会包含一个或多个 TensorCore,每个 TensorCore 都由一个或多个矩阵乘法单元(MXU)、一个向量处理单元(VPU)和一个向量存储器(VMEM)。其中 MXU 由收缩阵列中的 128128 乘法累加器组成,是供应算力的主要引擎,在每个周期能够执行 16K 乘法累加运算。图表图表 6 TPUv4 芯片的逻辑架构芯片的逻辑架构 资料来源:GoogleA Machine Learning Supercomputer With An Optically Reconfigurable Interconnect and Embeddin
30、gs Support,华创证券 TPU 采用脉动阵列采用脉动阵列可加速可加速大矩阵大矩阵计算,更适合计算,更适合 AI 应用应用场景。场景。TPU 为专用于神经网络工 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 9 作负载的矩阵处理器,相较于 CPU 和 GPU,TPU 的功率更低、物理占用空间更小。TPU采用了脉动阵列的方式以规避冯诺依曼瓶颈。在传统的计算架构下由于需要对存储器进行高频访问,系统的处理能力会极大地受限于其访存能力。而脉动阵列的本质就是在访问存储器之前将更多的工作留存在处理单元内完成。在脉动阵列实现矩阵运
31、算的过程中(Y=WX+b),权重 W/像素 X 分别从上向下/从左至右地流入数组,每次执行乘法时各个单元的乘数结果将被直接传递累加至此前的计算结果中,直至数据不再流入。在脉动计算和数据传递的过程中 TPU 无需再访问内存。TPU 虽然牺牲了通用性,但基于对脉动阵列的应用大幅提升了其计算吞吐量,显著优化了矩阵与卷积运算过程,而大模型的训练和推理过程中,主要涉及的就是矩阵及卷积计算,因此 TPU 作为专用型芯片特别适用于 AI 的应用场景中。图表图表 7 CPU、GPU、TPU 工作原理对比工作原理对比 图表图表 8 TPU 采用脉动阵列以提升计算吞吐量采用脉动阵列以提升计算吞吐量 资料来源:EI
32、TC,华创证券 资料来源:Norman P.Jouppi,Cliff Young,Nishant Patil,et al.In-Datacenter Performance Analysis of a Tensor Processing Unit,矽说,华创证券 历经历经多代的多代的持续持续更迭更迭,最新发布的最新发布的 TPUv5p 性能性能尤为强大尤为强大。2016 年 Google 推出的 TPUv1定位为推理芯片,为 AlphaGo 提供过重要的算力支撑,此后 Google 持续优化并迭代 TPU芯片的整体性能。2017 年发布的 TPUv2 兼顾了推理和训练的功能,相较于 TPUv1
33、,TPUv2不再固定功能单元之间的缓冲区和激活管道,而是采用了向量存储器和向量单元的方式实现功能。TPUv3 的改动较为温和,整体与 TPUv2 采用相同技术,但将 MXU 和 HBM容量增加了两倍。2021 年发布的 TPUv4 则首次引入光交换机(OCS)以解决规模和可靠性的障碍。2023 年 Google 先后推出 TPUv5e 及 TPUv5p 两款芯片。其中 TPU v5e,可在 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 10 同样成本情况下,为大语言模型和生成式 AI 模型提供相较于 TPUv4 高达 2
34、倍的训练性能和 2.5 倍的推理性能;TPUv5p 则是 Google 有史以来功能最强大、可扩展性最强、灵活性最高的 AI 芯片,其训练大型 LLM 模型的速度为 TPUv4 的 2.8 倍,较 TPUv5e 有近50%的提升。图表图表 9 TPU 性能逐步提升性能逐步提升 TPUv1 TPUv2 TPUv3 TPUv4 TPUv5e TPUv5p 发布时间 2016 2017 2018 2020 2023 2023 制程 28 nm 16 nm 16 nm 7 nm 未公布 未公布 HBM 内存(GB)N/A 16 32 32 16 95 HBM 内存带宽(GB/s)34 600 900
35、1200 820 2765 峰值算力(Bf16,TFLOPs)N/A 46 123 275 197 459 峰值算力(Int8,TOPs)92 N/A N/A N/A 393 918 单芯片 ICI 带宽(Gb/s)N/A 1984 2624 2400 1600 4800 集群 Pod 芯片数 N/A 256 1024 4096 256 8960 资料来源:IT之家 Norman P.Jouppi,Doe Hyun Yoon,et al.Ten Lessons From ThreeGenerations Shaped Googles TPUv4i,华创证券整理 TPU 已成已成为为 Googl
36、e 大模型训练的主力军。大模型训练的主力军。从 TPU 的使用情况来看,目前 Google 90%以上的模型训练均在 TPU 上进行。根据 Norman P.Jouppi 等人的TPU v4:An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings数据,Google 已经部署了数十台 TPUv4 超级计算机,其中有 8 台会通过 Google Cloud 供外部使用。其中最新发布的多模态大模型 Gemini 主要就是通过 TPUv4 以及 TPUv5e
37、训练的,而此前发布的 5400 亿参数语言模型 PaLM 则是用两个 TPUv4 pods 训练的。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 11 图表图表 10 Google 的的 TPU 训练负载训练负载分配情况分配情况 资料来源:Norman P.Jouppi,George Kurian,et al.TPU v4:An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings,华
38、创证券 (二)(二)Google Cloud 支撑公司业绩向好,支撑公司业绩向好,AI 领域投资领域投资有望有望进一步加强进一步加强 AI 赋能下赋能下 Google 利润率及营收增速迎来拐点利润率及营收增速迎来拐点。根据 Google 公司公告数据,2022 年公司收入为 2828 亿美元,同比+9.8%,对应 2019-2022 年 CAGR 达 20.4%。2023Q1-3 公司收入为 2211 亿美元,同比+6.9%。2022Q4 以来公司营收加速增长的趋势主要系 AI 赋能下公司服务类业务及云业务快速增长所致。同期公司利润率有所改善则主要因为:1)AI 的应用降低了员工人数的增幅;2
39、)AI 优化了工作流程,加强了运营效率;3)良好的费用管控成效及其他原因。图表图表 11 Google 分季度营业收入及利润率分季度营业收入及利润率 资料来源:Google公司公告,华创证券-10%0%10%20%30%40%50%60%70%01002003004005006007008009002019Q12019Q32020Q12020Q32021Q12021Q32022Q12022Q32023Q12023Q3营业收入(亿美元)营业总收入同比(右轴)毛利率(右轴)净利率(右轴)通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210
40、 号 12 Google Cloud 业务占比提升迅速,业务占比提升迅速,有望成为公司第二成长曲线有望成为公司第二成长曲线。从收入结构来看,主要包括广告业务、云业务及其他业务。其中广告业务主要包括搜索、网络及 You Tube 广告业务,云业务则主要包括云平台、工作区及其他企业服务。近年来云业务受益云平台和工作区业务的增长,收入占比呈快速上涨趋势,2022/2023Q1-3 公司云业务收入占比分别为 9.3%/10.8%,同比分别+1.8/1.6pcts。其中云平台实现高增主要系客户人均营收有所增加及基础设施和平台服务有所增长所致。根据公司 IR 公告,目前全球最大的 1000 家公司中超过
41、60%的企业均为 Google Cloud 的客户。公司认为目前其在 AI 解决方案 Vertex AI、Duet 及 GCP、Workspace 的客户参与度上都具有较高的潜力,未来公司将继续积极地保持对相关业务的投资,云业务有望成为公司的第二成长曲线。图表图表 12 Google 分季度分季度各各业务收入占比业务收入占比 图表图表 13 Google Cloud 业务业务季度季度收入收入持续增长持续增长 资料来源:Google公司公告,华创证券 资料来源:Google公司公告,华创证券 Google 资本开支进入向上通道,有望进一步加强资本开支进入向上通道,有望进一步加强 AI 领域投资领
42、域投资。2022 年,微软、Google、亚马逊、苹果、Meta 资本开支同比分别+3%/28%/5%/13%/67%,Google 资本开支增速居于行业前列。具体来看,Google 资本开支主要由服务器及网络设备投资组成,其中包括AI、数据中心及配套建筑等项目的建设。2022/2023Q1-3 Google 资本开支分别为 315/212亿美元,同比分别+27.8%/-11.1%。公司单 Q3 资本开支为 80.6 亿美元,同比/环比分别+10.7%/+16.9%。Q3 资本开支环比显著回暖主要系 AI 计算需求大幅增长下服务器及数据中心投资快速增长所致。根据公司 IR 公告,2023Q4
43、及 2024 公司资本开支将持续增长,但整体增速将低于公司营收增速。在资本开支投向方面,公告显示 Google 将着力加强在AI 领域的相关投资,未来公司资本开支有望实现高质量增长,预计到 2025 年,Google在 AI 领域的总投入将达到 1000 亿美元。5%5%6%6%7%8%7%7%7%7%8%7%9%9%10%10%11%11%11%0%10%20%30%40%50%60%70%80%90%100%2019Q12019Q42020Q32021Q22022Q12022Q42023Q3Google广告业务Google云业务Google其他业务其他业务0%10%20%30%40%50%
44、60%01020304050607080902019Q12019Q42020Q32021Q22022Q12022Q42023Q3Google云业务Google云业务收入同比(右轴)通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 13 图表图表 14 海外主要云厂商近年各季度资本开支情况海外主要云厂商近年各季度资本开支情况 资料来源:公司公告,华创证券 -50%0%50%100%150%200%250%0501001502002503003504004502019Q1 2019Q3 2020Q1 2020Q3 2021Q1 2
45、021Q3 2022Q1 2022Q3 2023Q1 2023Q3META苹果亚马逊微软谷歌YoY-谷歌(右轴)YoY-微软(右轴)YoY-亚马逊(右轴)YoY-苹果(右轴)通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 14 二、二、自研自研基于基于 OCS 的光连接新方案的光连接新方案,进一步提升,进一步提升 TPU 集群性能集群性能 需求推动需求推动 OCS 技术落地,深度赋能两大应用场景。技术落地,深度赋能两大应用场景。OCS(Optical circuit switches),即光电路交换机,是在光层动态地配置互连
46、拓扑,类似于传统的交换机在电层交换的作用。Google 在建设自己的数据中心过程中,由于在部署规模、灵活可用、模块化部署、安全性、功耗和性能等方面有更高要求,传统电交换不满足相关的互联需求,因此引入了 OCS形成新的解决方案。根据 Google 论文的数据,在搭建 TPUv4 的集群时,与传统 Infiniband交换机方案相比,OCS 方案成本更低,功耗更低,部署更快,其中 OCS 和其他光学组件的成本在系统总成本的占比低于 5%,功耗占比低于 3%。目前 OCS 在 Google 基础设施中主要有 Jupiter 数据中心和 TPU 数据中心两大应用场景,其中后者为专注于 AI 算力的数据
47、中心。(一)(一)OCS 的应用场景的应用场景 1:Jupiter 数据中心数据中心 Jupiter:Google 自研的自研的第五代第五代网络网络架构。架构。早期 Google 的数据中心里使用的是一种非常简易的网络集群架构,由 4 个商用路由器串联成环构成,512 台 ToR 交换机与每个商用路由器都连接,每台 ToR 交换机与 40 台服务器相连,从而形成了一个 51240,约 2 万台服务器的集群。这种架构缺点很明显,可扩展性差,同时也不适用于大带宽应用场景。由于其业务对带宽需求和数据中心分布式计算基础设施的规模要求较高,从 2005 年开始,Google 即推出第一代自研网络架构 F
48、irehose,通过定制数据中心网络硬件和软件去实现所需规模大小的集群构建。随后历经了五代架构的演进后,逐步形成目前的 Jupiter架构。图表图表 15 Google 历代数据中心网络的演进历代数据中心网络的演进 数据网络架数据网络架构构 发布发布时间时间 商用交换芯片商用交换芯片 ToR 交换机配交换机配置置 汇聚层汇聚层交换机交换机配置配置 Spine 层层交换机交换机配配置置 网络速率网络速率 服务器端口速服务器端口速率率 网络网络带宽带宽 Four-Post CRs 2004 vendor 48x1G -10G 1G 2T Firehose 1.0 2005 8x10G 4x10G(
49、ToR)2x10G 上行 24x1G 下行 2x32x10G(有阻塞)32x10G(非阻塞)10G 1G 10T Firehose 1.1 2006 8x10G 4x10G 上行 48x1G 下行 64x10G(有阻塞)32x10G(非阻塞)10G 1G 10T Watchtower 2008 16x10G 4x10G 上行 48x1G 下行 4x128x10G(非阻塞)128x10G(非阻塞)10G nx1G 82T Saturn 2009 24x10G 24x10G 4x288x10G(非阻塞)288x10G(非阻塞)10G nx10G 207T Jupiter 2012 16x40G 1
50、6x40G 8x128x40G(有阻塞)128x40G(非阻塞)10/40G nx10G/nx40G 1.3P 资料来源:Arjun Singh,Joon Ong,Amit Agarwal,et al.Jupiter Rising:A Decade of Clos Topologies and Centralized Control in Googles Datacenter Network,华创证券 初代初代 Jupiter 一鸣惊人,最大可支持超过一鸣惊人,最大可支持超过 3 万台服务器组网万台服务器组网。在 2015 年论文Jupiter Rising:A Decade of Clos
51、Topologies and Centralized Control in Google s Datacenter Network中,可以看到 Jupiter 主要应用 CLOS 架构,由 ToR、Spine 块和 Aggregation 块三大部分组成,其中最基础的交换单元都是商用交换芯片,单芯片可提供 16x40G 或者 64x10G 的端口连接。4 个交换芯片是通过一台 Centauri 交换机来提供。Spine 块:内部由 6 台 Centauri 交换机组成。逻辑上会再分成两层,上层由 4 台Centauri 交换机的一半交换芯片组成,向下可提供 32x40G 端口;下层由 2 台完
52、整的 Centauri 交换机以及 4 台 Centauri 交换机剩下一半的交换芯片所组成,可向 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 15 上行的上层 Spine 交换机和下行的 Aggregation 交换机分别提供 128x40G 端口;Aggregation 块:内部由 8 个中间(Middle)块组成,每个中间块由 4 台 Centauri交换机组成,每个中间块可向上行的上层 Spine 交换机提供 64x40G 端口和下行的 ToR 交换机分别提供 256x10G 端口;ToR 交换机:即 Centa
53、uri 交换机,由两组共 4 个交换芯片所组成,单个交换芯片被配置为 48x10G 的下行与服务器连接和 8x2x10G 的上行与 8 个中间块交换机连接。在最大的配置环境中,Jupiter 可为服务器提供总共 1.3 Pbps 的网络带宽,即可支持超过3 万台端口速率为 40Gbps 的服务器接入。图表图表 16 Google 第五代网络架构第五代网络架构 Jupiter 的内部结构的内部结构 资料来源:Arjun Singh,Joon Ong,Amit Agarwal,et al.Jupiter Rising:A Decade of Clos Topologies and Centrali
54、zed Control in Googles Datacenter Network,华创证券 Jupiter 网络架构持续升级,网络架构持续升级,引入引入 OCS 实现能力实现能力的的跃升跃升。在初代 Jupiter 的基础上,Google对网络架构进行持续升级,通过引入 OCS(Optical Circuit Switches,光交换机)取代 Spine层传统电交换机,将网络逻辑拓扑由 CLOS 架构演进到 Aggregation 块的直接光互联。由于 OCS 采用光交换,对传输的速率无感,通过进一步引入 WDM(波分复用)和环形器等技术可以实现在单根光纤上传输通道数的增加以及 Tx/RX
55、双路信号,提升单光纤的数据传输速率,实现整个 Jupiter 网络互联带宽的数倍增长。基于以上的技术革新,Jupiter已实现超过 6 Pbps 带宽容量,即相对于初代实现约 5 倍带宽提升的同时,电力消耗减少了 41%,成本降低 30%。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 16 图表图表 17 传统传统 CLOS 架构与引入架构与引入 OCS 网络架构的对比网络架构的对比 传统传统 CLOS 架构架构 引入引入 OCS 的网络架构的网络架构 拓扑图 技术原理 Spine 层为电交换机,在交换 Aggregati
56、on 块传输过来的数据时,需要对数据进行电层的接收、拆包、解析、计算确认路径、封包、发送等一系列操作,才能最终完成数据的交换传输。用 OCS 取代 Spine 层电交换机,OCS 内部由 Mems 反射镜组成,通过提前路径规划和配置,实现各端口在光层的互联,因此可直接进行光交换,无需进行电层的处理,可看成是 Aggregation 块之间直接实现互联。交换方式 电交换 光交换 交换处理时延 长 短 是否支持异速率接入 否,电交换需交换机匹配传输速率 是,光交换对传输速率无感 网络带宽升级难度 高,需要采购安装更高端口速率的电交换机 低,无需更换 OCS 设备 功耗 高 低 资料来源:Ryohe
57、i Urata,Hong Liu,Kevin Yasumura,et al.Mission Apollo:Landing Optical Circuit Switching at Datacenter Scale,华创证券整理 图表图表 18 在在 OCS 基础上引入基础上引入 WDM、环形器等技术的、环形器等技术的 Jupiter 网络网络 资料来源:Leon Poutievski,Omid Mashayekhi,Joon Ong,et al.Jupiter Evolving:Transforming Googles DatacenterNetwork via Optical Circuit
58、 Switches andSoftware-Defined Networking,华创证券 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 17 (二)(二)OCS 的应用场景的应用场景 2:TPUv4 计算中心计算中心 Google 自研的低成本高性能自研的低成本高性能 TPUv4 超级计算机集群超级计算机集群。TPUv4 的超级计算机自 2020 年开始在 Google 得到大规模应用,系统由 4096 个 TPUv4 芯片组成,共享 256 TiB 的 HBM内存,总算力超过 1 ExaFLOP。网络架构中引入了 OC
59、S 等 Jupiter 的核心技术。目前 Google已经部署了数十台 TPU v4 超级计算机,供内部使用和外部通过 Google Cloud 使用。在TPUv4 超级计算机中,最基础的物理算力单元是 TPU 芯片,系统的设备组成路径如下:TPUv4 Package:即单芯片,主要由 1 个 ASIC+4 个 HBM 堆栈封装 TPUv4 Tray:即单板卡,由 4 个 TPUv4 芯片组成,每个 TPUv4 芯片会出 6 条链路,其中两条用于板内连接,四条用于板间连接。TPUv4 芯片在板卡内以 mesh方式连接,在板卡间则以 3D Torus 连接。板块前面板分布有 4 个 PCIE 连
60、接器和16 个用于在板卡间核间互联(ICI,Inter-Core Interconnect)连接的 OSFP 接口,即每个 TPUv4 芯片对应 1 个 PCIE 3x16 接口和 4 个支持 400G 双工的 OSFP 接口。板卡采用液冷散热方式。TPUv4 Rack:即单机柜,由 16 个 TPUv4 Tray 组成,共计 64 颗 TPUv4 芯片,因此也称为 444 Cube。机柜内的两个 TPUv4 Tray 之间通过无源电缆(铜缆)进行连接,形成 444 的 3D mesh 结构。每个 Rack 都需要和每个 OCS 交换机连接,光模块用于 Rack 与 OCS 之间的连接,主要为
61、单模光模块。TPUv4 Supercomputer:也称为 Pod,由 64 个 TPUv4 Rack 组成,共计 6464=4096颗 TPUv4 芯片。每个 Rack 都需要和每个 OCS 交换机一一连接。图表图表 19 TPUv4 单芯片封装(左)和单芯片封装(左)和 Tray(右)(右)图表图表 20 单个单个 TPUv4 Rack 由由 16 个个 TPUv4 Tray 组成组成 资料来源:Norman P.Jouppi,George Kurian,Sheng Li,et al.TPU v4:An Optically Reconfigurable Supercomputer for
62、Machine Learning with Hardware Support for Embeddings,华创证券 资料来源:GoogleA Machine Learning Supercomputer With An Optically Reconfigurable Interconnect and Embeddings Support,华创证券 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 18 图表图表 21 88 Rack 构成整个构成整个 TPUv4 计算机系统计算机系统 资料来源:GoogleA Machin
63、e Learning Supercomputer With An Optically Reconfigurable Interconnect and Embeddings Support,华创证券 系统使用的系统使用的光模块数量为光模块数量为 TPU 数量的数量的 1.5 倍。倍。一个 Rack 即为一个 444 的 Cube 立方体,由 64 个 TPUv4 芯片组成。立方体内部的连接较为简单,节点主要通过铜缆进行连接,组成 3D mesh 拓扑。立方体外部连接较复杂,共有三个维度 6 个面,每个面 16 个节点,每个节点都需与 OCS 交换机连接,即每个面都会与一组 16 台 OCS 交换
64、机连接。同一个维度相对的两面(上下、左右、前后)都需要连接到同一组的 OCS 交换机连接,形成 3D Torus 拓扑。光路系统的成本控制得很低,在整个 TPU v4 超级计算机成本中占 5%以下。可以算出每台 TPUv4 超级计算机中,相关器件的用量:TPU 芯片数量:4096 个;OCS 交换机数量:XYZ 三个维度,每个维度 16 台,共 48 台;光通路数量:每个 cube 需要 6(面)16(节点)=96 个对外的光通路连接,因此 64 个 cube 对应 6496=6144 个光通路;光模块数量:每个光通路需要 1 个光模块实现 Cube 侧的电光/光电转换,因此整个系统需要 61
65、44 个光模块。即光模块数量为 TPU 数量的 1.5 倍。内部铜缆连接数量:Rack 内部的板卡间是通过铜缆连接,因此每个 Rack 内部 16块 TPUv4 板卡之间需要 80 条铜缆连接,64 个 Cube 对应 6480=5120 条铜缆。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 19 图表图表 22 一个一个 cube(rack)由)由 64 个个 TPU 节点组成节点组成 图表图表 23 每个每个 cube 都需要和三个方向的都需要和三个方向的 OCS 连接,连接,组成组成 3D Torus 拓扑拓扑 资料
66、来源:Norman P.Jouppi,George Kurian,Sheng Li,et al.TPU v4:An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings,华创证券 资料来源:Norman P.Jouppi,George Kurian,Sheng Li,et al.TPU v4:An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Suppor
67、t for Embeddings,华创证券 图表图表 24 64 个个 TPUv4 rack 与与 48 个个 OCS 之间需要之间需要 6144 条光纤连接条光纤连接 资料来源:GoogleA Machine Learning Supercomputer With An Optically Reconfigurable Interconnect and Embeddings Support,华创证券 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 20 三、三、深度剖析深度剖析 Google OCS 解决方案解决方案:器件
68、高度定制化:器件高度定制化(一)(一)基于基于 MEMS 器件的器件的 OCS 成为新的光交换方案成为新的光交换方案 OCS 是是简单高效的光交换解决方案。简单高效的光交换解决方案。业界对于光交换的技术研究比较早,此前包括压电光开关、机械式光开关和 MEMS 系统等都有过一定的商业应用。Google 认为相对于电交换,基于 MEMS 的光交换方案在对数据速率及波长不敏感、低功耗、低延迟等方面都具备优势,因此选择了自研 OCS、光模块和光环形器三大主要器件,以构成一个低成本高效益的大规模光交换系统。OCS 的结构较为简单,大体上可以分成两套子系统:子系统 1:主要用于检测控制。由 2 个 850
69、nm 激光发射模组、3 个 850nm 激光可穿透的二向色镜、2 个 MEMS 反射镜阵列、2 个摄像模组所组成,主要的功能是通过检测 850nm 激光在光交互通道中的传输状态,调整 MEMS 反射镜的相关参数,从而实现路径上光信号损耗最小;子系统 2:光交换的实际链路。由 2 个 136 通道的光纤准直器阵列、3 个二向色镜、2 个 MEMS 反射镜阵列所组成,通过 MEMS 反射镜的调整控制,实现经过两个光纤准直器所接入的光通路之间的互联互通。图表图表 25 OCS 的内部构造及实际布局的内部构造及实际布局 资料来源:GoogleA Machine Learning Supercomput
70、er With An Optically Reconfigurable Interconnect and Embeddings Support,华创证券 MEMS 反射镜是反射镜是 OCS 的核心组成器件。的核心组成器件。每个 MEMS 反射镜模组采用陶瓷封装,内部在一块 MEMS 芯片上制作了 176 个微镜,每个镜子都可以单独可控,镜子表面镀金以最大程度减少光路上的损耗,在最终完全校准后的系统中将有 136 个微镜用于实际光开关中。每个微镜可通过四个梳状驱动进行调整,在 X 轴和 Y 轴两个自由度上旋转从而实现所需的角度形成光通路。在这个 MEMS 的光交换核心之外,还有配置 272 个
71、LC/APC 连接器的前面板、12 块高压驱动板、CPU 控制板、电源及风扇等,共同组成了一个完整的具备136136 双工端口的 OCS。据论文Mission Apollo:Landing Optical Circuit Switching at Datacenter Scale数据,已有数万个 OCS 已经制造并被部署。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 21 图表图表 26 MEMS 反射镜结构和核心组成反射镜结构和核心组成 图表图表 27 OCS 的整体架构的整体架构 资料来源:Ryohei Urata,H
72、ong Liu,et al.Mission Apollo:Landing Optical Circuit Switching at Datacenter Scale,华创证券 资料来源:Ryohei Urata,Hong Liu,et al.Mission Apollo:Landing Optical Circuit Switching at Datacenter Scale,华创证券 OCS 的创新性应用,有助于的创新性应用,有助于 MEMS 代工业务的拓展代工业务的拓展。结合 Google 相关论文的描述,我们判断其 OCS 为自研产品,内部相关器件主要都为定制化开发和代工生产,如 MEM
73、S 反射镜模组。根据 Yole 的预测,MEMS 器件在电信领域的市场将由 2022 年的 2 亿美元增长至 2028 年的 8 亿美元,CAGR 达到 28%,是各主要的 MEMS 应用市场中增长最快的细分方向,产品具体包括光学 MEMS 和基于 MEMS 的振荡器。此外 MEMS 代工厂的商业模式增长较快,MEMS 代工业务的总收入同比增长 6%,达到近 7.7 亿美元,一些 IDM由于运营成本高昂而正在重新考虑其商业模式,并转向无晶圆厂模式,此外主要 MEMS代工厂的客户数量也在激增,寻求新 MEMS 技术的合作,Google 的 OCS 业务正是其中的重要场景。全球 MEMS 代工厂近
74、几年的排名相对稳定,其中赛微电子的全资控股子公司 silex 已连续数年保持排名第一。根据赛微电子在投资者问答平台披露的信息,公司向客户提供的产品包括 OCS(Optical Circuit Switch,MEMS 型光开关),MEMS-OCS 是基于 8 英寸 MEMS 工艺和设计技术制造,对于大模型所使用的 MEMS-OCS,公司瑞典工厂历经 7 年研发已实现量产,公司北京工厂已进行约 2 年时间的工艺开发,希望后续能够尽快推进风险试产及量产。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 22 图表图表 28 MEMS
75、 在电信领域的市场增长较快在电信领域的市场增长较快 图表图表 29 2012-2021 年度全球年度全球 MEMS 代工厂排名代工厂排名 资料来源:Yole,华创证券 资料来源:Yole Development 转引自赛微电子2022年报,华创证券(二)(二)适配适配 OCS 需求,需求,定制化设计定制化设计光模块光模块 针对针对OCS的特定应用的特定应用,Google定制化定制化最新最新光模块设计。光模块设计。Google在论文 Lightwave Fabrics:At-Scale Optical Circuit Switching for Datacenter and Machine Le
76、arning Systems中认为,相较于数据中心网络连接,用于机器学习系统网络的光模块在高带宽、低延迟和同步特性有更高的要求,与传统光模块有较大的差异,因此 Google 对光模块中的关键组件,如激光器,环行器,跨阻放大器(TIA),光电探测器(PD),数字信号处理(DSP)ASIC 等进行了重新设计或者加强集成,以实现更低成本,提高可制造性。目前 Google 在基于 OCS 的TPUv4 Pod 中所使用的,是使用环形器+CWDM4/8 的最新一代 Bidi OSFP 封装光模块,分别是支持双工 2400G(CWDM4,20nm 波长间隔)和双工 800G(CWDM8,10nm 波长间隔
77、)的传输速率。图表图表 30 数据中心网络中数据中心网络中 WDM 光模块的演进光模块的演进 图表图表 31 CWDM4(上)和(上)和 CWDM8(下)的光模块(下)的光模块 资料来源:Hong Liu,Ryohei Urata,et al.Lightwave Fabrics:At-Scale Optical Circuit Switching for Datacenter and Machine Learning Systems,华创证券 资料来源:Hong Liu,Ryohei Urata,et al.Lightwave Fabrics:At-Scale Optical Circuit
78、Switching for Datacenter and Machine Learning Systems,华创证券 光模块光模块国内企业具有较强竞争力,未来应用技术难度更高,客户粘性有望持续提升国内企业具有较强竞争力,未来应用技术难度更高,客户粘性有望持续提升。根据 Google 论文所披露的信息,目前 OCS 中主要使用的新一代光模块以 800G 端口速率为主,并且在 2024-2025 年有望引入 1.6T 速率光模块。目前我国的光模块企业在全球范围具有较强竞争力,而且在 800G/1.6T 等高端高速产品上具有领先布局。我们认为,Google 通信行业深度研究报告通信行业深度研究报告
79、证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 23 应用于 OCS 的光模块在性能上要求较高,因此其在选择 800G 光模块的供应商时应该会重点考虑供应商的综合实力,此外光模块具有较高的定制化要求,故也会优先选择有较强研发能力和良好合作关系的光模块企业。在面向下一代更高速度,如 1.6T 的光模块,由于速率提升后,技术、产品和稳定性的门槛更高,我们判断,已有 800G 光模块供应经验的公司将具有先发卡位优势,延续强者恒强的趋势。图表图表 32 中国企业中国企业已占据已占据全球光模块全球光模块 Top10 榜单最多数量榜单最多数量 资料来源:LightCountin
80、gAI Clusters,Data Centers,Optical Networks,华创证券 图表图表 33 部分部分光模块企业在光模块企业在 800G/1.6T 产品布局产品布局 公司公司 800G 产品情况产品情况 1.6T 产品情况产品情况 中际旭创 800G 光模块现有 4x100Gx2 和 8X100G 两种架构方案,包括分立式及硅光两类技术路径;预计 24Q1 后相关产能交付爬坡会有显现。具体产品包括 800G OSFP-T-OP8CNT-N00:模块传输速率达800Gbps,工作温度为 0-70,功耗低于 16W,可支持 2 公里的传输距离。已有客户需求,若顺利将于 24 年通
81、过验证并下单,25 年上量;具体产品包括 1.6T OSFP-XDDR8+:模块传输速率达 1.6Tbps,工作温度为 0-70,功耗低于 32W,可支持 2 公里的传输距离。Finisar 公司预计 2024 年 800G 出货量将迎来指数级增长;具体产品包括 800G DR8 QSFP-DD:模块设计用于 800 千兆以太网链路,光纤传输距离为 500 米。公司认为第一批 1.6T 产品预计将于未来几年出货 新易盛 800G 产品包括硅光、LPO 两类技术路径,部分产品已实现小批量出货,2023 年 OFC 期间公司曾推出 800G LPO 系列产品;具体产品包括 800G OSFP-DD
82、:800G 单波 200G 光模块符合QSFPDD800MSA 的最新版本;固件支持 CMIS5.0 和更新版本;涵盖 DR4+、1xDR4、1xFR4 和 2xFR2 传输接口 2023OFC 期间公司曾推出 1.6T 相关光模块产品;具体产品包括 1.6T OSFP-DD:采用 4xFR2 规格、OSFP-DD 封装,采用 4XSN 连接器光接口,16X100Gbps 电接口,可支持最远 2 公里传输,支持1.6T 点对点以及 2x800G,4X400G 的扇出式点对多点应用 云晖(cloudlight)客户目前对 800G 的反馈非常积极,截止至 2023 年 10 月,云晖过去 12
83、个月 400G 收入占比高于 90%,最近一个季度公司 800G 收入占比已过半;具体产品包括 800G QSFP-DD DR8:每个通道可支持106.25Gb/s(PAM4)的数据传输,单模光纤传输长度为 500 米。-通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 24 光迅科技 800G 多模和单模的进展均较顺利,送样后陆续获得订单;具体产品包括 800G OSFP 2xLR4:设计用于 10 公里单模光纤上的800 千兆以太网链路。2023 年 OFC 期间公司曾推出 1.6Tdemo 版本;具体产品包括 1.6T
84、OSFP-XD DR8+:设计用于在单模光纤上通过 PAM4 调制格式传输和接收高达 212.5 Gb/s 数据速率(每信道)的串行光学数据链路,采用热插拔方式并集成了 EML 激光器 博创科技 公司将加大 800G 硅光模块的开发进度,尽快实现 800G 产品的送样 产品正在开发中 剑桥科技 一款硅光 800G 产品已进入小批量发货,其他硅光、LPO 产品也在测试中。此外,截止至 2023 年 10 月公司 800G 模块思科已认证通过,准备量产。具体产品包括 800G QSFP-DD 2xFR4 EML:双工 LC 单模光纤可达2 公里,工作温度为 0-70 摄氏度 2023 年 OFC
85、期间公司曾展示使用 200G Lumentum激光器构建的 1.6T 光模块原型;具体产品包括 1.6T OSFP-XD 2xDR4 EML:单模光纤传输距离为 500 米,工作温度为 0-70。华工科技 2022Q3 公司 800G 硅光模块已正式推出市场。截止至 2023 年 11 月公司 400G/800G DSP 系列模块已经开始批量出货。预计 24Q1 末800G LPO 产品也会批量出货。具体产品包括 800G OSFP DR8 SiPh:自研的硅光芯片具备高调制效率支持 7 nm;DSP 内置驱动器直驱;无需使用 TEC 控温,模块全温功耗小于 15W。产品处于研发中 联特科技
86、截止至 2023 年 5 月公司 800G 光模块处于客户验证阶段。同时公司表示基于 SIP(硅光)和 TFLN(薄膜铌酸锂)调制技术的 800G 产品也会相继推出。具体产品包括 800G QSFP-DD 2DR4:功耗低于 14W,8 通道 PIN 接收机,单模光纤传输距离可达 500m 产品处于研发中 索尔思光电 800G 数据中心光模块已实现量产;具体产品包括 800G FR4(4x200G)OSFP:采用自主开发高功率激光器和先进 3D 密集光电混合封装提升高速射频性能,搭配收端高集成度多通道 PIN/TIA 接收机并配合最新工艺 5nm DSP 高性能均衡算法,传输距离可满足 2km
87、 应用需求。2023OFC 期间公司曾推出用于 1.6T 光模块的单波200G PAM4 EML 激光器。AAOI 公司认为未来几年 400G+800G 产品的营收可能超过 3 亿美元;截止至 2023Q3 公司已向两家客户进行 800G 产品的送样,未来还将继续为另外两家数据中心客户送样,公司预计 24Q2 或 Q3 公司 800G光模块有望放量。-资料来源:公司公告,公司官网等,华创证券 (三)(三)光模块内创新光模块内创新性引入环形器,传输效率进一步提升性引入环形器,传输效率进一步提升 引入引入环形器环形器,单光纤传输带宽再提升。,单光纤传输带宽再提升。此前环形器在电信系统中已有一定的应
88、用,但数量规模有限,未形成大批量的稳定生态系统。此外也考虑到在机器学习的应用场景中要增加端口间的回波损耗和减少串扰等需要,Google 同样选择了对环形器的重新设计。使用环形器可实现单根光纤的双工传输,主要作用是限制光的传输方向,如光由端口 1 输入时,可以几乎无损失地从端口 2 输出,但不可从端口 3 输出;当光从端口 2 输入时,可以几乎无损地从端口 3 输出,但不可从端口 1 输出。环形器的实现原理主要是基于光的偏振特性。环形器主要由三个组件构成,分别是:PBS,偏振分束器,可实现 P 偏振光的透传,S 偏振光的反射;通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业
89、务资格批文号:证监许可(2009)1210 号 25 FR,法拉第旋光器,具有非互易性,正向传输和反向传输偏振态旋转方向一致 HWP,半波片,具有互易性,正向传输和反向传输偏振态旋转方向相反 通过以上器件的叠加作用,可以限定光路的传输路径:发射端到光纤:光由端口 1 进入环形器后,仅有 P 偏振态的光可以通过 PBS,经过 FR 后偏振态旋转-45,再经过 HWP 后偏振态旋转 45,抵消了 FR 的旋转,仍为 P 偏振态,最终通过 PBS 传输到光纤处;光纤到接收端:光由光纤进入环形器后,经过 PBS 会分成 S 偏振态和 P 偏振态两部分的光,其中 P 偏振态光会穿透 PBS,经过 HWP
90、 和 FR 两次偏振态 45旋转后成为 S 偏振态的光,经过 PBS 两次反射后到达接收端口 3;S 偏振态光先经过 PBS 两次发射后再经过 HWP 和 FR 两次偏振态 45旋转后成为 P 偏振态的光,到达接收端口 3。因此光信号经过环形器可以几乎无损地传输到接收端。图表图表 34 环形器可实现单光纤的双工通信环形器可实现单光纤的双工通信 图表图表 35 环形器环形器基于光偏振基于光偏振的实现原理的实现原理 资料来源:Hong Liu,Ryohei Urata,et al.Lightwave Fabrics:At-Scale Optical Circuit Switching for Da
91、tacenter and Machine Learning Systems,华创证券 资料来源:Hong Liu,Ryohei Urata,et al.Lightwave Fabrics:At-Scale Optical Circuit Switching for Datacenter and Machine Learning Systems,华创证券 环形器环形器供应链较为成熟供应链较为成熟,核心器件法拉第旋转片国产化程度较低,核心器件法拉第旋转片国产化程度较低。环形器此前比较多是应用在掺铒光纤放大器中,并且一般用在光模块的外部,在 Google 的 OCS 应用场景中则被集成到光模块内部,
92、以获得更高的性能、更小尺寸和更低成本。传统独立形态的环形器较为成熟,供应商较多,其中主要的供应商包括珠海光联(Oplink)、II-VI(高意)、珠海三石园等,此外腾景科技可以提供可集成在光模块中的环形器产品。在环形器内部,法拉第旋转片是关键器件之一。根据光隆科技披露信息,目前法拉第旋转片主要供应商为日本的 GRANOPT 和美国的 II-VI,二者在法拉第旋转片市场的占有率合计超过 90%。国内的福晶科技、长飞光纤、东田微和飞锐特等公司在法拉第旋转片晶体材料有布局,部分公司产品已通过下游大客户验证,达到商业化标准。此外 PBS 偏振分束器近年国内厂商不断突破关键技术,如福晶科技、腾景科技、莱
93、择光电等均已具备量产能力。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 26 图表图表 36 腾景科技可提供光模块中的环形器腾景科技可提供光模块中的环形器 资料来源:腾景科技官网,华创证券(四)(四)更高链路预算更高链路预算需求需求带来的带来的光芯片与电芯片配套升级光芯片与电芯片配套升级 配合配合 OCS 的应用环境,光模块内光电芯片需进行较大的应用环境,光模块内光电芯片需进行较大改变改变。由于 OCS 和环行器的使用,链路需要提供更高的损耗预算,因此配套的光模块需要更少的光学元件和更低的封装损耗,光模块内部设计需进行较大
94、改动:光芯片:Google 与业界合作开发了更快的光学元件(激光器/光电探测器),同时由于更高的速率和更大的消光比要求,为了减轻双向通信带来的多光路干扰(MPI)效应,光模块所使用的激光器芯片需从 DML 演进为外部调制激光器 EML;电芯片:对于高速 IC/电气技术,Google 用 DSP 方案替换了原来基于模拟的时钟数据恢复(CDR)方案。使用 DSP 虽然增加了功耗和延迟,但是方案降低了对光器件和模拟电子元件的要求,通过算法降低双工链路固有的多路干扰,应用 FEC 支持更高的链路预算,具有更高的鲁棒性和可扩展性。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资
95、格批文号:证监许可(2009)1210 号 27 图表图表 37 OCS 配套光模块需改动的光芯片与电芯片设计配套光模块需改动的光芯片与电芯片设计 资料来源:Ryohei Urata,Hong Liu,Kevin Yasumura,et al.Mission Apollo:Landing Optical Circuit Switching at Datacenter Scale,华创证券 EML 及及 DSP 芯片均以海外供应商为主,国产化程度较低。芯片均以海外供应商为主,国产化程度较低。根据源杰科技招股说明书,2021 年 25G 光芯片的国产化率约 20%,但 25G 以上光芯片的国产化率
96、仍较低约为 5%,目前仍以海外光芯片厂商为主。800G 光模块中主要使用 100G PAM4 EML 激光器,海外企业如 Lumemtum、II-VI 和三菱等公司较早实现了产品布局,国内企业如源杰科技、长光华芯等正全力追赶,其中源杰科技在投资者平台披露其 100G PAM4 EML 产品特性可以与海外产品对标,目前已在客户端测试;长光华芯披露其单波 100G EML(56GBd EML 通过 PAM4 调制)产品已量产。DSP 也主要以海外企业为主,其中已被 Marvell 收购的Inphi 在 PAM4 DSP 领域占据较大市场份额,此外还有 Broadcom、Credo 和 Max Li
97、near 等企业也提供 PAM4 DSP 产品。其中 Credo(默升科技)成立于 2008 年,由 3 名海归华人在中国上海创立,目前可提供 Dove 800D/800/801/802/850 等适用于不同场景的 800G PAM4 DSP。图表图表 38 Credo 面向面向 800G 的单向的单向 PAM4 DSP 资料来源:Credo官网,华创证券 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 28 (五)(五)两两层连接释放大量层连接释放大量铜缆与铜缆与光纤需求光纤需求 Rack 内采用铜缆连接,内采用铜缆连接,
98、Rack 外采用光纤连接外采用光纤连接。在 TPUv4 的系统设计中,每个 Rack 由4x4x4 个 TPUv4 芯片组成,其中 4 个 TPUv4 组成一张板卡,同一个 Rack 内的板卡间通过铜缆连接,Rack 和 OCS 之间使用光互联,需要使用光模块进行光电转换。TPUv4 的核间互联 ICI 带宽为 2400 Gb/s,每个 TPUv4 对外有 6 条 ICI 链路,因此每条 ICI 链路端口速率为 400Gb/s;TPUv5p 的 ICI 带宽为 4800 Gb/s,同样采用 3D Torus 拓扑,我们判断其同样有 6 条 ICI 链路,因此每条 ICI 链路端口速率为 800
99、Gb/s。结合此前的测算,每个TPUv4 Pod 将释放 6144 条光缆和 5120 条铜缆的连接需求,官方未公开 TPUv5p Pod 的具体硬件网络设计,但其芯片数量为 8960 个,超过 TPUv4 Pod 芯片数量的两倍,我们认为 TPUv5p Pod 集群的光缆和铜缆的数量将大幅提升,同时接口速率也将达到 800 Gb/s。图表图表 39 TPUv4 板间板间通过通过 4 个个 OSFP 连接器实现互联连接器实现互联 图表图表 40 TPUv4 超级计算机中使用了大量的光缆连接超级计算机中使用了大量的光缆连接 资料来源:GoogleA Machine Learning Superc
100、omputer With An Optically Reconfigurable Interconnect and Embeddings Support,华创证券 资料来源:GoogleA Machine Learning Supercomputer With An Optically Reconfigurable Interconnect and Embeddings Support,华创证券 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 29 四、四、AI 浪潮加速浪潮加速算力算力基础设施的演进,重点关注基础设施的演进
101、,重点关注产业产业演变演变趋势趋势带来的带来的机遇机遇(一)(一)趋势趋势 1:自研自研低成本低成本算力算力部署部署方案方案或成为或成为新新选择,有助于算力基础设施的快速建选择,有助于算力基础设施的快速建设设 自研芯片有助于低成本高性能算力部署自研芯片有助于低成本高性能算力部署,或成为产业发展新趋势,或成为产业发展新趋势。Google 的 TPUv4 相较于 A100 性能更佳、成本更低、功耗更低,下游客户拥有更多高性价比选择。根据 Google论文披露,对于类似大小的系统,TPUv4 的 BERT 训练速度比 A100 快 1.15 倍;对于ResNet,TPUv4 表现为 A100 的 1
102、.67 倍。而在部分测试中,A100 的功耗是 TPUv4 的 1.3-1.9 倍。对于 TPUv4 和 A100 的使用成本,我们参考 Google Cloud 的相关报价进行对比,TPUv4 Pod 在 us-centra2 区域按需/1 年租/3 年租的单芯片每小时使用价格分别约为 3.22美元、2.03 美元、1.45 美元,而 Google 提供向虚拟机(VM)实例挂接 GPU 的服务,其中 A100 80G GPU 在 us-central1 区域的每小时价格约为 1.57 美元。综合以上数据,TPUv4在性能表现和功耗成本上,相较于 A100 都具有一定的优势。这为下游客户提供了
103、更多的选择,有望助力原本受制于成本和供应因素而未完全释放的下游需求得到进一步加快加大的释放,利好算力基础设施产业链。Google 的客户如 Anthropic、Hugging Face 和AssemblyAI 等就已在广泛应用 TPU 所提供的算力服务。图表图表 41 TPUv4 与与 A100 在在 MLPerf 测试的表现对比测试的表现对比 图表图表 42 TPUv4 与与 A100 在在 MLPerf 测试的功耗对比测试的功耗对比 资料来源:Norman P.Jouppi,George Kurian,et al.TPU v4:An Optically Reconfigurable Sup
104、ercomputer for Machine Learning with Hardware Support for Embeddings,华创证券 资料来源:Norman P.Jouppi,George Kurian,et al.TPU v4:An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings,华创证券 降低核心芯片供应风险,降低核心芯片供应风险,AI 巨头积极布局自研芯片。巨头积极布局自研芯片。目前 Nvidia 的 GPU 因算力军备竞赛而需求
105、大增,但其产能受限于 HBM、CoWos 封装等的供应,因此 H100 芯片存在大量缺口,各 AI 巨头能分到的 GPU 数量有限,根据 GPU Utils 预测,H100 的短缺情况或将持续至 2024 年。在此背景下 H100 的售价已达 3.5 万美元左右,对应毛利率水平已超过90%。Google 通过自研 TPU,可降低算力核心芯片的供应风险,同时减少算力部署成本。除 Google 以外,众多 AI 巨头公司也都在布局自研 AI 算力芯片,比如 Amazon 的 Trainium和 Inferentia、微软的 Athena、META 的 MTIA 等。通信行业深度研究报告通信行业深度
106、研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 30 图表图表 43 Omdia 测算测算 2023Q3 A100 和和 H100 出货量出货量约为约为 500K 资料来源:Omdia Research 转引自科技每日推送谷歌大模型,把李彦宏当成了创始人,华创证券(二)(二)趋势趋势 2:AI 巨头的巨头的算力需求算力需求景气度高景气度高,进一步推动进一步推动高度定制化高度定制化成为成为新新商业模式商业模式 AI 巨头巨头持续投入算力设施建设,持续投入算力设施建设,或更倾向定制化算力解决方案。或更倾向定制化算力解决方案。Google、微软两大 AI 巨头近
107、两个季度的 Capex 保持上升趋势,对 24 年的投入预期也较为乐观。目前 AI 产业中前端包括 Gemini、GPT-5 等更多参数量更大的大模型持续在训练和发布,后端类似 Video Poet、Pika 等更多新颖 AI 应用持续推出,行业对于算力的需求仍在持续释放中。由于大模型对算力的要求高,存在很多新技术难点,比如集群传输带宽的提升等。Google 等 AI巨头本身就具有很强的技术实力,作为最终用户,对需求的理解也更为深入,配合着对核心 AI 算力芯片的自研,对整体解决方案高度定制化开发或成为合理有效的解决方式。图表图表 44 Google 推出的零样本视频生成推出的零样本视频生成应
108、用应用 Video Poet 资料来源:Dan Kondratyuk,Lijun Yu,Xiuye Gu,et al.VideoPoet:A Large Language Model for Zero-Shot Video Generation,华创证券 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 31 与与客户客户深度绑定的供应链企业,深度绑定的供应链企业,有望有望核心核心享受享受定制化带来的高价值红利定制化带来的高价值红利。我们认为,当定制化成为新商业模式时,将核心利好具备技术能力,同时与下游客户具有深厚合作关系的供
109、应企业。他们在产品形态持续升级过程中,有望紧跟客户研发步伐,率先进入客户供应链,提前锁定客户需求,从而在产品代际更迭时率先享受红利。例如 Google 为适配其 OCS 架构,对光模块进行了定制设计,增加了环形器等器件,因此应用于 OCS 中的光模块的价值量较一般应用场景的光模块有较大提升,而且竞争门槛也有所提升,对于早期已切入 Google 供应链的相关光模块企业以及上游的环形器等光学器件企业,受益利好的确定性高,享受红利的周期长。图表图表 45 技术能力和客户关系奠定供应链企技术能力和客户关系奠定供应链企业的受益确定性业的受益确定性 资料来源:华创证券整理 (三)(三)趋势趋势 3:网络架
110、构升级网络架构升级将催生如将催生如 OCS 等新型设备的落地应用,带来产业格局变化等新型设备的落地应用,带来产业格局变化 高性能计算领域的拓扑结构高性能计算领域的拓扑结构正正被引入到智能算力中心被引入到智能算力中心。由传统的三层网络架构到适合大规模扩展的 CLOS 架构,目前数据中心应用较多的 CLOS 架构包括 Fat-tree 三层无带宽收敛架构和 Spine-Leaf 二层 Fabric 架构两种。随着 AI 产业的快速发展,目前大型 AI 模型的参数数量级从几百亿跃升到几万亿级别,对计算能力和内存资源的需求也随之急剧增长,业界普遍采用构建算力集群的方式去满足相应需求。如英伟达的 DGX
111、 系列 AI 超级计算机,服务器间的 InfiniBand 网络和服务器内 GPU 间的 NVLink 网络均是采用 Fat-tree 架构。但传统的 Fat-tree 架构在扩展性、跳转延迟和成本等方面存在瓶颈,因此如Torus、Dragonfly 等高性能计算领域的拓扑结构也逐步被引入到智能算力中心,以提供大规模、低延迟、高带宽的多算力芯片间互联,比如 Google 在 TPUv4 超级计算机中所应用的 3D-Torus 拓扑。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 32 图表图表 46 数据中心拓扑架构演进数据
112、中心拓扑架构演进 资料来源:开放数据中心委员会总线级数据中心网络技术白皮书,华创证券 拓扑的演进必然会带来使用设备的更新,拓扑的演进必然会带来使用设备的更新,或或推动推动产业格局产业格局变革变革。拓扑演进将带来网络设备的更新,OCS 就是最有代表性的案例。除了 Google 在 TPUv4 超级计算机中应用了 OCS以外,Nvidia 研发高级副总裁兼首席科学家 Bill Dally 在 Hoti 2023 年的主旨演讲中也分享了其在 Dragonfly 拓扑中应用 OCS 的案例。通过引入 OCS 技术,可以有效解决网络规模扩展时重新布线的难点,提高网络的灵活性和可管理性,实现资源的灵活分配
113、。同时通过 OCS 的灵活切换,可实现冗余节点对故障节点的轻松替换,进一步提高系统的可靠性。而 OCS 的供应链和传统电交换机的有较大差异,因此在网络拓扑演进促进 OCS 得到更多应用的趋势下,产业格局或出现变革。图表图表 47 在在 Dragonfly 拓扑中应用拓扑中应用 OCS 资料来源:Sharada YeluriGPU Fabrics for GenAI Workloads转引自SDNLAB,华创证券 通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 33 五、五、投资建议投资建议 随着 AI 行业成熟度逐步提升,海
114、量算力需求将持续释放,给光模块光器件光芯片的整条光互联产业链都将带来长期而有力的拉动。以 Google OCS 为代表的新型算力互联解决方案有望得到更多应用,产业格局因此而出现新的变化,更多的产业机遇将逐步明晰。建议关注算力释放带来的全产业链机遇,并重点关注新技术新方案从 0到 1 演进带来的产业预期差。建议核心关注以下标的:中际旭创(中际旭创(300308):全球知名的光模块头部供应商。):全球知名的光模块头部供应商。公司凭借行业领先的技术研发能力、低成本产品制造能力和全面可靠的交付能力等优势,赢得了海内外客户的广泛认可,并保持在数通光模块细分市场的领先优势和份额。天孚通信(天孚通信(300
115、394):业界领先的光器件整体解决方案提供商。):业界领先的光器件整体解决方案提供商。公司通过自主研发和外延并购,在精密陶瓷、工程塑料、复合金属、光学玻璃等基础材料领域积累沉淀了多项全球领先的核心工艺技术,为全球客户提供多种垂直整合一站式产品解决方案。腾景科技(腾景科技(688195):):深耕定制化精密光学元件。深耕定制化精密光学元件。公司基于核心技术,为客户提供定制化的光电子元器件产品,已与全球主要的光模块/设备厂商和光纤激光器厂商建立了合作关系,同时优势产品在细分领域具有较高的市场影响力。源杰科技(源杰科技(600498):稀缺的高端光芯片国产代表企业。:稀缺的高端光芯片国产代表企业。公
116、司目前产品包括 2.5G、10G、25G、50G、100G 光芯片产品、CW 光源、车载激光雷达光源等产品,在境内外市场开拓了众多的直接或间接优质客户。六、六、风险提示风险提示 全球宏观经济发展不及预期,国际贸易局势进一步紧张,AI 产业发展不及预期,产业供应格局出现较大变化。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 34 通信组团队介绍通信组团队介绍 组长、首席分析师:欧子兴组长、首席分析师:欧子兴 北京邮电大学硕士&学士,通信专业,6 年中国移动集团采购和供应链管理经验,曾任职于招商证券,2023 年加入华创证券研
117、究所,研究领域覆盖通信全行业。通信行业深度研究报告通信行业深度研究报告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 36 华创行业公司投资评级体系华创行业公司投资评级体系 基准指数说明:基准指数说明:A 股市场基准为沪深 300 指数,香港市场基准为恒生指数,美国市场基准为标普 500/纳斯达克指数。公司投资评级说明:公司投资评级说明:强推:预期未来 6 个月内超越基准指数 20%以上;推荐:预期未来 6 个月内超越基准指数 10%20%;中性:预期未来 6 个月内相对基准指数变动幅度在-10%10%之间;回避:预期未来 6 个月内相对基准指数跌幅在 10%20
118、%之间。行业投资评级说明:行业投资评级说明:推荐:预期未来 3-6 个月内该行业指数涨幅超过基准指数 5%以上;中性:预期未来 3-6 个月内该行业指数变动幅度相对基准指数-5%5%;回避:预期未来 3-6 个月内该行业指数跌幅超过基准指数 5%以上。分析师声分析师声明明 每位负责撰写本研究报告全部或部分内容的分析师在此作以下声明:分析师在本报告中对所提及的证券或发行人发表的任何建议和观点均准确地反映了其个人对该证券或发行人的看法和判断;分析师对任何其他券商发布的所有可能存在雷同的研究报告不负有任何直接或者间接的可能责任。免责声明免责声明 。本公司不会因接收人收到本报告而视其为客户。本报告所载
119、资料的来源被认为是可靠的,但本公司不保证其准确性或完整性。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司在知晓范围内履行披露义务。报告中的内容和意见仅供参考,并不构成本公司对具体证券买卖的出价或询价。本报告所载信息不构成对所涉及证券的个人投资建议,也未考虑到个别客户特殊的投资目标、财务状况或需求。客户应考虑本报告中的任何意见或建议是否符合其特定状况,自主作出投资决策并自行承担投资风险,任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。本报告中提及的投资价格和价值以及这些投资带来的预期
120、收入可能会波动。本报告版权仅为本公司所有,本公司对本报告保留一切权利。未经本公司事先书面许可,任何机构和个人不得以任何形式翻版、复制、发表、转发或引用本报告的任何部分。如征得本公司许可进行引用、刊发的,需在允许的范围内使用,并注明出处为“华创证券研究”,且不得对本报告进行任何有悖原意的引用、删节和修改。证券市场是一个风险无时不在的市场,请您务必对盈亏风险有清醒的认识,认真考虑是否进行证券交易。市场有风险,投资需谨慎。华创证券研究所华创证券研究所 北京总部北京总部 广深分部广深分部 上海分部上海分部 地址:北京市西城区锦什坊街 26 号 恒奥中心 C 座 3A 地址:深圳市福田区香梅路 1061 号 中投国际商务中心 A 座 19 楼 地址:上海市浦东新区花园石桥路 33 号 花旗大厦 12 层 邮编:100033 邮编:518034 邮编:200120 传真:010-66500801 传真:0755-82027731 传真:021-20572500 会议室:010-66500900 会议室:0755-82828562 会议室:021-20572522