《半导体行业Chiplet:设计引领、封装赋能助推产业链价值重构和国产芯破局-230315(22页).pdf》由会员分享,可在线阅读,更多相关《半导体行业Chiplet:设计引领、封装赋能助推产业链价值重构和国产芯破局-230315(22页).pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、 行业行业报告报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 1 半导体半导体 证券证券研究报告研究报告 2023 年年 03 月月 15 日日 投资投资评级评级 行业评级行业评级 强于大市(维持评级)上次评级上次评级 强于大市 作者作者 潘暕潘暕 分析师 SAC 执业证书编号:S1110517070005 资料来源:聚源数据 相关报告相关报告 1 半导体-行业研究周报:荷兰对光刻机出口进一步限制,国产化亟待加速 2023-03-14 2 半导体-行业研究周报:政策预期升温,关注国产化,周期复苏,与新技术 2023-03-06 3 半导体-行业研究周报:23Q1 库存持
2、续 去 化,基 本 面 或 加 速 触 底 2023-02-27 行业走势图行业走势图 Chiplet:设计引领、封装赋能,助推产业链价值重构和国产芯破局:设计引领、封装赋能,助推产业链价值重构和国产芯破局 事件:事件:当地时间 3 月 2 日,BIS 将浪潮、龙芯等 29 家中国实体列入实体清单。其中浪潮、龙芯同时被列入脚注 4 实体(即涉及先进计算类芯片与超级计算机的实体),将限制其获取 18类软件和技术。我们看好外部我们看好外部形势趋紧之下,形势趋紧之下,Chiplet 技术方案由设计公司引领、先进封装赋能落地,从上游技术方案由设计公司引领、先进封装赋能落地,从上游IP、EDA、设计到中
3、游制造,再到下游封测,革新半导体产业链,重塑产业链价值、设计到中游制造,再到下游封测,革新半导体产业链,重塑产业链价值,有望助力有望助力国产芯实现换道超车国产芯实现换道超车。看好。看好封装封装公司估值处于历史公司估值处于历史相对相对低位,周期底部有望率先复苏低位,周期底部有望率先复苏,伴随,伴随2D 封装到封装到 3D Chiplet 发展发展,封装环节封装环节价值价值逐步逐步提升提升。1、硅片级“解构、硅片级“解构-重构重构-复用”,复用”,Chiplet 突破三大产业瓶颈突破三大产业瓶颈 作为硅片级“解构-重构-复用”的方案,Chiplet 或为破局摩尔定律、实现产业再度飞跃的关键。其突破
4、主要体现在三个方面,分别带来百分比级、翻倍级和指数级的性能提升:(1)成本&良率突破:芯片良率与芯片性能之间存在矛盾,同构小芯粒集成可以提升良率,降低成本;(2)面积&性能突破:目前服务器 CPU 和 GPU 已逼近单个芯片面积上限,无法满足高算力需求,同构扩展可以提高性能,应对各场景大量增长的算力诉求;(3)设计&制程突破:先进制程芯片设计成本高昂,而异构集成下各模块使用适宜制程各司其职,从我国视角来看,Chiplet或为打破国产制程瓶颈的关键方案。同时,Chiplet 可助力超异构集成计算的发展,处理器性能&灵活性同步提升。2、产业链价值重塑,封装、产业链价值重塑,封装环节环节具有具有“估
5、值估值处历史处历史相对相对低位低位+周期周期复苏复苏+产业价值量提升产业价值量提升”的投的投资资逻辑逻辑 从全产业链来看,从全产业链来看,Chiplet 作为一种全新设计理念提升了设计、IP、EDA 环节的引领性地位,有望为中游制造、下游封测带来价值增量。从具体的落地方案来看,Chiplet 主要依靠高速互联的设计和异构集成先进封装技术的支撑。设计方面,设计方面,主要通过 Base Die/IO Die/Die to Die 设计实现核心处理模块之间,及其他各模块间的高速互联。封装方面,封装方面,Chiplet 封装演进的本质是在成本可控的情况下尽可能提升互联的密度与速度,从 2D 封装到 2
6、.5D Chiplet、3D Chiplet,封装环节价值量&重要性有望不断提升。我国封装厂商技术积累深厚,长电科技、通富微电、华天科技已实现 Chiplet 量产,封装环节具有“估值处历史相对低位+周期复苏+产业价值量提升”的投资逻辑。3、高性能计算(、高性能计算(HPC)或为)或为 Chiplet 当前的主要发力点当前的主要发力点 ChatGPT 是大数据+大模型+大算力的产物,每一代 GPT 模型的参数量高速增长,根据人工智能学家公众号数据,2020 年 5 月发布的 ChatGPT 的前身 GPT-3 参数量达到了 1750 亿(预训练数据量达 45TB,远远大于 GPT 2 的 40
7、GB)。算力需求方面,训练 ChatGPT 所耗费的算力大概是 3640 PetaFLOPs per day,即用每秒能够运算一千万亿次的算力对模型进行训练,需要3640 天完成。随着科技巨头类 ChatGPT 项目入局,整体在算力提升、数据存储及数据传输端需求迭起。而随着摩尔定律逐渐趋缓,我们认为 Chiplet 有望成为支持高性能计算存储的关键。美国正在开发的三个超级计算机 Aurora、El Capitan 和 Frontier,CPU 和 GPU 利用 Chiplet 方案,AMD,Intel,华为的服务器处理器芯片均采用 Chiplet 方案助力算力突破及性能提升。4、投资建议、投资
8、建议 我们看好我们看好 Chiplet 重塑半导体产业格局,为我国半导体产业带来换道超车的发展机遇。建议关重塑半导体产业格局,为我国半导体产业带来换道超车的发展机遇。建议关注:注:(1)封测板块:长电科技、通富微电、华天科技等(2)测试板块:伟测科技、利扬芯片等(3)IP 板块:芯原股份、润欣科技等(4)EDA 板块:华大九天、概伦电子等(5)封装测试设备板块:长川科技、华峰测控、金海通、新益昌等(6)材料板块:兴森科技、南亚新材、华正新材、方邦股份、德邦科技、和林微纳、联瑞新材等 风险风险提示提示:国际局势不确定性加剧;科研进度不及预期;需求不及预期 -28%-22%-16%-10%-4%2
9、%8%2022-032022-072022-11半导体沪深300 行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 2 内容目录内容目录 1.质的飞跃:从成本到性能,质的飞跃:从成本到性能,Chiplet 突破三大瓶颈突破三大瓶颈.4 1.1.良率&成本突破:同构小芯粒集成提升良率,降低成本.5 1.2.面积&性能突破:同构扩展提高性能,应对算力的指数级增长.6 1.3.设计&制程突破:模块化拆分优化设计,超异构打开想象空间.9 1.4.地缘政治影响下,Chiplet 加持中国自主产业链的构建.12 2.产业革新:设计产业革新:设计+先进封装实现高速互联,产业
10、链价值迎来重构先进封装实现高速互联,产业链价值迎来重构.13 2.1.产业环节:Chiplet 革新半导体产业生态.13 2.2.设计环节:高速互联设计实现各模块“Chiplet 化”.14 2.3.封装环节:国内厂商布局加速,有望受益价值量提升+周期复苏双逻辑.15 2.3.1.从 2D 封装到 3D Chiplet:先进封装价值量不断提升.15 2.3.2.国内头部厂商:实现 Chiplet 产品量产,掌握核心工艺.16 3.应用场景:高性能计算(应用场景:高性能计算(HPC)为主战场)为主战场.18 4.投资建议投资建议.19 5.风险提示风险提示.21 图表目录图表目录 图 1:SoC
11、 与 Chiplet 对比.4 图 2:异构集成和异质集成.4 图 3:Chiplet 带来的三大突破示意图及与性能提升的关系.5 图 4:AMD Zen1 架构四合一同构方案提升良率.5 图 5:服务器 CPU 和 GPU 芯片尺寸接近上限.6 图 6:数据量爆炸式增长.6 图 7:算力增长曲线.6 图 8:机器学习大幅提升算力需求.7 图 9:自动驾驶算力需求增长.8 图 10:苹果 M1-M1 Ultra 芯片面积.8 图 11:特斯拉 Dojo 核心芯片.9 图 12:先进制程芯片的单位面积成本增加(亿美元).9 图 13:摩尔定律不断放缓.9 图 14:Zen1 到 Zen2“异构集
12、成”设计变化.10 图 15:英特尔超算芯片 Ponte Vecchio 结构.11 图 16:处理器异构集成发展.11 图 17:Chiplet 产业链.13 图 18:AMD Zen2 架构中 I/O Die 与 Die to Die 的互联方案及片上缓存性能的提升.14 图 19:中介层和中介层通孔.15 图 20:3D 封装示意图.16 图 21:长电科技 XDFOI 技术.17 图 22:通富微电 VISionS 平台.17 nNrQWWeXeUeUqU9YMB9PaObRmOrRnPtQjMrRsRiNrQmR7NnMuMMYoPtRxNrRuN 行业报告行业报告|行业专题研究行业
13、专题研究 请务必阅读正文之后的信息披露和免责申明 3 图 23:华天科技 3D Matrix 平台.17 图 24:封测板块估值处历史相对低位.17 图 25:Chiplet 助力服务器算力提升&性能优化.18 表 1:苹果 M1-M1 Ultra 芯片性能.8 表 2:美国政府对我国半导体产业制裁已久.12 表 3:各业务板块 Chiplet 相关标的.19 表 4:相关公司盈利预测与估值.21 行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 4 1.质的飞跃:从成本到性能,质的飞跃:从成本到性能,Chiplet 突破三大瓶颈突破三大瓶颈 事件:事件:当地
14、时间 3 月 2 日,BIS 将浪潮集团、龙芯中科、第四范式、盛科通信等 29 家中国实体被列入实体清单。其中浪潮、龙芯同时被列入脚注 4 实体(即涉及先进计算类芯片与超级计算机的实体),将限制其获取 18 类软件和技术。部分被限制企业业务与先进芯片或超级计算机相关。部分被限制企业业务与先进芯片或超级计算机相关。被限制的企业中,浪潮集团旗下拥有X86 服务器业务,龙芯中科是 CPU 设计企业,第四范式是一家 AI 独角兽,盛科通信则是一家以太网交换芯片设计企业,且浪潮集团并非第一次遭遇被列入实体清单。超算产业发展受限、国际形势不确定性加剧之下,芯片国产化亦在加速。我们看好超算产业发展受限、国际
15、形势不确定性加剧之下,芯片国产化亦在加速。我们看好 Chiplet助力突破制程瓶颈,实现国产算力芯片产业飞跃。助力突破制程瓶颈,实现国产算力芯片产业飞跃。以浪潮为例,其业务对英特尔多有依赖。2013 年以来,英特尔始终为浪潮第一大供应商,在服务器、存储、AI 解决方案、云服务等多方面,其底层技术均依赖英特尔的 CPU。2019 年,浪潮信息从英特尔采购的金额达到179 亿元,占比达到 37.53%。在 2021 年财报中,浪潮信息隐去了前五大供应商的名称,但第一大供应商采购的金额仍高达 169 亿元,占比为 23.83%。我们认为此类企业受限或会束缚我国先进芯片及超级计算机产业发展,Chipl
16、et 有望助力突破先进制程及算力受限的困境。Chiplet 又称芯粒或小芯片,是硅片级别的“解构又称芯粒或小芯片,是硅片级别的“解构-重构重构-复用”,复用”,它把传统的 SoC 分解为多个芯粒模块,将这些芯粒分开制备后再通过互联封装形成一个完整芯片。芯粒可以采用不同工艺进行分离制造,可以显著降低成本,并实现一种新形式的 IP 复用。其为 SoC 集成发展到当今时代,摩尔定律逐渐放缓情况下,持续提高集成度和芯片算力的重要途径。相比传统 Monolithic(单一整体)芯片技术,Chiplet 技术能够在降低成本的同时获得更高的集成度。图图 1:SoC 与与 Chiplet 对比对比 资料来源:
17、第六届中国系统级封装大会,长电科技,天风证券研究所 Chiplet 具体方案包括同构、异构、异质。具体方案包括同构、异构、异质。同构即对相同制程和类型的芯片进行连接扩展,如 4 个 7nm,单颗算力 30 个 tops,4 个堆为 120tops。异构堆叠是通过把大芯片分成面积更小的单元模块,选择最适合的半导体制程工艺,从而实现媲美乃至超越传统 SOC 的性能和各项表现。异质主要指将不同材料的芯片集成为一体。图图 2:异构集成和异质集成:异构集成和异质集成 资料来源:第六届中国系统级封装大会,SCI,天风证券研究所 行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责
18、申明 5 摩尔定律放缓及国际形势不确定加剧下,预期摩尔定律放缓及国际形势不确定加剧下,预期 Chiplet 能为半导体产业带来三大突破,海能为半导体产业带来三大突破,海内外内外有望同步受益有望同步受益,对我国半导体产业而言,也是一次突破先进制程和算力瓶颈的产业机,对我国半导体产业而言,也是一次突破先进制程和算力瓶颈的产业机遇。遇。(1)同构小芯粒集成方案提升良率,降低成本,结合 AMD Zen1 架构的应用案例,增加10%面积,良率提升,降低了 40%的量产成本。我们认为在同等成本下,同构小芯粒集成方案有望带来性能的百分比增长。(2)同构扩展方案能够大幅提高性能以应对算力爆炸的时代需求,结合苹
19、果 M1 Ultra 将两个 M1 Max 芯片连成一个芯片,芯片面积增加 100%,各项硬件指标也实现了直接翻倍。我们认为同构扩展方案或可带来性能的翻倍增长。(3)异构集成方案对芯片进行了“模块化”的拆分,各个模块采用其合适的制程,在降低设计成本和难度的同时大幅提升芯片性能。同时 Chiplet 能够助力处理器的超异构趋势,平衡处理器的性能和灵活性,带来算力的指数级增长。图图 3:Chiplet 带来的三大突破示意图及与性能提升的关系带来的三大突破示意图及与性能提升的关系 资料来源:奇异摩尔公众号,电脑爱好者公众号,摩尔芯球,半导体行业观察,天风证券研究所 1.1.良率良率&成本突破:同构小
20、芯粒集成提升良率,降低成本成本突破:同构小芯粒集成提升良率,降低成本(1)良率方面:将单一芯片分割为多个面积较小的)良率方面:将单一芯片分割为多个面积较小的 Chiplet,提升良率,提升良率(2)成本方面:提升良率,降低成本)成本方面:提升良率,降低成本 瓶颈:芯片良率与芯片性能之间存在矛盾,芯片良率提升遇瓶颈瓶颈:芯片良率与芯片性能之间存在矛盾,芯片良率提升遇瓶颈。为了提升性能,必须要增加芯片中的晶体管数量,而若要提升良率则必须保证单一芯片面积不能太大。例如,150mm 芯片的良品率约为 80%,700mm 的设计芯片合格率会骤降至 30%。从工艺制造良率的 Bose-Einstein 模
21、型:良率=1/(1+芯片面积*缺陷密度)n,其中 n 代表掩膜版层数相关系数。单芯片的面积越大,良率越低,对应制造成本也越高。Chiplet 突破案例:突破案例:AMDZen1 架构增加架构增加 10%面积,良率提升,降低了面积,良率提升,降低了 40%的量产成本。的量产成本。厂商将单一芯片分割为多个面积较小的 Chiplet,再把多个相同的 Chiplet 集成在一起来优化性能。AMD 率先在其数据中心处理器 Zen1 中采用了该方案。AMD 将 Zen1 分成四个独立的模块,并将它们重新拼接在一起。这种方式让 AMD 在维持该处理器整体性能不变的基础上,以 10%面积的增加,降低了 40%
22、的量产成本。图图 4:AMD Zen1 架构四合一同构方案提升良率架构四合一同构方案提升良率 行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 6 资料来源:祺芯智能公众号,奇异摩尔公众号,AMD,天风证券研究所 1.2.面积面积&性能突破:同构扩展提高性能,应对算力的指数级增长性能突破:同构扩展提高性能,应对算力的指数级增长(1)面积方面:单芯片做集成,面积)面积方面:单芯片做集成,面积或可或可成倍提升不受约束。成倍提升不受约束。(2)性能方面:面积提升,性能成倍增长。)性能方面:面积提升,性能成倍增长。瓶颈:单个芯片面积有上限,无法满足各场景高算力需求。瓶
23、颈:单个芯片面积有上限,无法满足各场景高算力需求。通常来说,由于光刻掩膜版的尺寸限定在 33mm*26mm,单个芯片的面积一般不超过 800mm2,当前服务器 CPU 和GPU 已逼近单个芯片面积上限。图图 5:服务器:服务器 CPU 和和 GPU 芯片尺寸接近上限芯片尺寸接近上限 资料来源:芯东西公众号,天风证券研究所 人工智能、自动驾驶等场景带来算力缺口。人工智能、自动驾驶等场景带来算力缺口。互联网普及下,数据规模翻倍增长,未来算力缺口大。据 IDC 公司发布 DataSphere 和 StorageSphere 报告,2020 年全球产生了超过64ZB 数据量;到 2025 年,全球数据
24、总量将增至 175ZB,较 2010 年的全球的数据总量增加 175 倍。所谓算力,就是设备处理数据、输出结果的能力。据奇异摩尔公众号预测,作为提供多样化计算能力支撑的新型基础设施,下一代数据中心在 5 年内将面临约 1000 倍的算力需求。图图 6:数据量爆炸式增长:数据量爆炸式增长 图图 7:算力增长曲线:算力增长曲线 行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 7 资料来源:奇异摩尔公众号,天风证券研究所 资料来源:奇异摩尔公众号,Intel Architecture Day 2020,天风证券研究所 人工智能方面,深度学习的出现带动机器学习(人工
25、智能方面,深度学习的出现带动机器学习(ML)算力需求呈现指数级增长。)算力需求呈现指数级增长。2010 年之前其所需的算力增长符合摩尔定律,大约每 20 个月翻一番。伴随深度学习问世,2010后每 6 个月翻一番,2015 年后大规模 ML 模型的出现,训练算力的需求提高了 10 到 100 倍。其中代表,ChatGPT 的总算力消耗约为 3640PF-days,至少要 7-8 个投资 30 亿规模数据中心才能支撑运行。此外,据奇异摩尔公众号预测,代表第四次计算机浪潮的元宇宙将需要至少 10 的 6 次方倍于目前的算力,而元宇宙的终极理想形式,对算力资源的需求近乎无限。图图 8:机器学习大幅提
26、升算力需求:机器学习大幅提升算力需求 资料来源:Jaime SevillaCOMPUTE TRENDS ACROSS THREE ERAS OF MACHINE LEARNING,天风证券研究所 自动驾驶方面,现阶段大多单芯片算力仍小于自动驾驶方面,现阶段大多单芯片算力仍小于 10TOPS,相对,相对 L3 级别级别 100TOPS 以上的算以上的算力需求缺口大。力需求缺口大。L0-L5 六个自动驾驶级别,每一分级都比上一级有更高的算力要求,L2 级别大致需要 10TOPS 计算能力,L3 需要 100TOPS 以上的算力,L3+的算力级别需要1000TOPS 以上,到 2030 年 L4+自
27、动驾驶汽车的单车算力将达到 5000TOPS,而现阶段很多单颗芯片算力仍小于 10 TOPS,算力缺口大。此外,自动驾驶催生端云协同的计算需求,据华为智能世界 2030预测,未来单个车厂的云端至少需要 10EFLOPS 以上的算力。行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 8 图图 9:自动驾驶算力需求增长:自动驾驶算力需求增长 资料来源:佐思汽车研究公众号,天风证券研究所 Chiplet突破案例:苹果突破案例:苹果M1 Ultra两个两个M1 Max芯片被连成一个芯片,芯片面积增加芯片被连成一个芯片,芯片面积增加100%,各项硬件指标也实现了直接翻倍
28、。各项硬件指标也实现了直接翻倍。芯片面积越大意味着晶体管数量越多,也代表着性能和功能越强,通过多个芯片的片间集成,可以在封装层面突破单芯片上限,进一步提高集成度。苹果推出 M1 Max 芯片时,市场普遍以为这已达到了 M1 系列芯片的封顶之作,面积高达 432mm。随着 M1 Ultra 的推出,两个 M1 Max 芯片被连成一个芯片,芯片面积增加到 200%,各项硬件指标也实现了直接翻倍。和最初的 Apple M1 处理器相比,Apple M1 Pro、M1 Max、M1 Ultra 同样 5nm 制程工艺,但芯片面积却分别提升了 2 倍8 倍,晶体管数量也达到了 337 亿、570 亿和
29、1140 亿,在消费级处理器领域处高水平。图图 10:苹果:苹果 M1-M1 Ultra 芯片面积芯片面积 资料来源:电脑爱好者公众号,天风证券研究所 2 颗颗 Apple M1 Max 芯片之间通过苹果创新定制的多晶粒架构“连在一起”,官方将这种芯片之间通过苹果创新定制的多晶粒架构“连在一起”,官方将这种连接架构命名为“连接架构命名为“UltraFutI/On”,该架构拥有 1 万多个信号点,芯片相互之间的数据传输速率高达 2.5TB/s,延迟和功耗都非常低。1 颗 Apple M1 Max 的晶体管数量就是 570 亿,由 2 颗 M1 Max 缝合而来的 M1 Ultra 晶体管数量也首
30、次突破千亿大关,达到了 1140 亿,整颗芯片上的统一内存最高可以达到 128GB,内存带宽也进一步提升至 800GB/s。表表 1:苹果苹果 M1-M1 Ultra 芯片性能芯片性能 型号型号 晶体管数晶体管数 CPU GPU 统一内存统一内存 内存宽带内存宽带 Apple M1 160 亿 4+4 7 或 8 16GB 68GB/S Apple M1 Pro 337 亿 6+2 或 8+2 14 或 16 32GB 200GB/S Apple M1 Max 570 亿 8+2 24 或 32 64GB 400GB/S Apple M1 Ultra 1140 亿 16+4 48 或 64 1
31、28GB 800GB/S 资料来源:电脑爱好者公众号,天风证券研究所 Chiplet 突破案例:在自动驾驶领域,特斯拉利用同构扩展将其突破案例:在自动驾驶领域,特斯拉利用同构扩展将其 AI 专用训练平台专用训练平台 Dojo 的的 行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 9 性能推向了极致。性能推向了极致。Dojo 是特斯拉针对自身自动驾驶 AI 训练场景所设计的 AI 专用训练平台,其技术核心芯片就是特斯拉自研神经网络训练芯片“D1”。每个 D1 芯片以 7nm 工艺制造,包含 500 亿个晶体管,面积 645 mm。而每个 Dojo 则将 25
32、个 D1 训练模块和 40个专用 I/O 集成在一起,从而实现超大算力支持。Dojo 是目前全球最快的 AI 训练计算机。相比业内其他芯片,同成本下性能提升 4 倍,同能耗下性能提高 1.3 倍,占用空间节省 5倍。图图 11:特斯拉:特斯拉 Dojo 核心芯片核心芯片 资料来源:佐思汽车研究公众号,奇异摩尔公众号,天风证券研究所 1.3.设计设计&制程突破:模块化拆分优化设计,超异构打开想象空间制程突破:模块化拆分优化设计,超异构打开想象空间(1)设计方面:)设计方面:IP 复用复用提升设计效率,节省设计阶段的研发投入提升设计效率,节省设计阶段的研发投入(2)制程方面:突破摩尔定律放缓的局限
33、,特别是对于我国来说,可以缓解先进制程)制程方面:突破摩尔定律放缓的局限,特别是对于我国来说,可以缓解先进制程被被限制限制的压力的压力(3)超异构方面:)超异构方面:助力提供异构混合、相互协同的处理器解决方案,平衡性能和灵活性。助力提供异构混合、相互协同的处理器解决方案,平衡性能和灵活性。瓶颈瓶颈:先进制程芯片设计成本高昂,单位面积成本在先进制程芯片设计成本高昂,单位面积成本在 14/16nm 后陡增,且摩尔定律不断后陡增,且摩尔定律不断放缓。放缓。根据奇异摩尔,随着制程从 28nm 制程演变到 5nm,研发投入也从 5130 万美元剧增至 5.42 亿美元,2nm 的开发费用接近 20 亿美
34、元,先进制程已然成了全球巨头的烧钱竞赛。根据 EETOP 公众号,在 7nm 节点,设计一款芯片的费用高达 3 亿美元。且伴随摩尔定律不断放缓,晶体管同时逼近物理极限、成本极限。图图 12:先进制程芯片的单位面积成本增加:先进制程芯片的单位面积成本增加(亿美元)(亿美元)图图 13:摩尔定律不断放缓:摩尔定律不断放缓 资料来源:车东西公众号,AMD,天风证券研究所 资料来源:车东西公众号,AMD,天风证券研究所 芯片制程并非“越先进越好”。芯片制程并非“越先进越好”。在一颗 SoC 中,逻辑计算单元(CPU/GPU)通常依赖于先进制程来提升性能,而其他的部分(SRAM、I/O 接口、模拟或数模
35、混合元件等)对于制程工艺的要求并不高。把这些对制程要求不同的模块用同样的先进制程一体化制造会带来浪费。各类主要芯片制程要求如下:行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 10 逻辑芯片逻辑芯片3nm 节点节点:制作工艺复杂,如 CPU、GPU、AI、MCU。受益于先进制程技术的进步,逻辑芯片依然沿着摩尔定律向前演进,当前台积电 3nm 已量产。存储芯片存储芯片18/16nm 节点节点:与逻辑芯片相比,内部结构相对简单,主要分为 DRAM、NAND Flash、NOR Flash 三类。以 DRAM 为例,当制程到了 18/16nm 以下,继续缩减尺寸已
36、不再具备成本和性能方面的优势。模拟芯片模拟芯片28-65nm 节点节点:参与感知信息处理的芯片就是模拟芯片,无法感知但客观存在的模拟信号处理芯片,比如微波,电信号处理芯片等,也属于模拟范畴。模拟芯片不受制于摩尔定律和高端制程,强调高信噪比、低失真、低耗电、高可靠性和稳定性,业界普遍认为 28nm65nm 为其性能最优节点,制程的缩小反而可能导致模拟电路性能的降低;而被广泛地应用在 IoT 领域的传感器和光电器件,则因为工艺不同,无法集成到 CMOS 中。Chiplet 突破案例:突破案例:AMD 的的 EPYC 处理器为处理器为 Zen2 架构,是典型的异构集成的案例。架构,是典型的异构集成的
37、案例。在第一代 EPYC 中,处理器由 4 个 14nm 工艺的小芯片组合而成。第二代 EPYC 为 Zen2 架构,处理器由 4 组共八个 7nm 小芯片和一个 14nm 的 I/O 芯片组合而成。8 组 CPU 核心、1 组I/O 核心堆出了 64 核处理器。图图 14:Zen1 到到 Zen2“异构集成”设计变化异构集成”设计变化 资料来源:大半导体产业网,SEMI 公众号,锐杰微科技集团总裁刘海川,天风证券研究所 Chiplet 异构下异构下 7nm 工艺工艺+I/O 分离大幅降低核心面积,加倍缓存降低延时。分离大幅降低核心面积,加倍缓存降低延时。从 AMD 公开的数据来看,7nm 工
38、艺带来了明显的计算效率,包括 2 倍的晶体管密度、功耗降低 50%(同性能下),性能提升了 25%(同功耗下)。在 Zen 2 架构中,一个 Chiplet 芯片的总面积仅74mm2,其中 CCX+16MB L3 缓存的核心面积仅 31.3mm2,同比减少了 47%,一方面是因为 7nm 工艺的密度优势,一方面也与 Zen2 的 CCX 只有 CPU 核心减少了 I/O 单元有关。这里也可以解释为了降低延迟 AMD 为什么敢于大幅加倍 L3 缓存的原因了,每个 CCX 翻倍到 16MB L3 缓存后 CCX 核心面积依然减少一半左右。此外芯片配置也非常灵活,此外芯片配置也非常灵活,I/O Di
39、e12nm 工艺降低成本。工艺降低成本。提升 CPU 核心数量就堆 CPU 模块即可,因此锐龙处理器可以从 8 核 16 线程轻松变成 16 核 32 线程。此外,AMD 这样做也需要生产小核心,提高了良率,降低了成本,而且 I/O 核心使用的还是更成熟的 12nm工艺,进一步削减了成本。Chiplet 突破案例:英特尔使用其英特尔使用其 Foveros 3D 堆叠技术发布了堆叠技术发布了 Ponte Vecchio GPU 助力助力Aurora 超级计算机超级计算机,Aurora 超级计算机旨在成为美国首批突破 exaflop 障碍的高性能计算机之一。Ponte Vecchio 是一个结合了
40、多个计算、缓存、网络和内存硅片的封装。Ponte Vecchio 由多达由多达 47 个个 Chiplet/(方格方格 tile)通过横、纵向封装与其他模块(通过横、纵向封装与其他模块(Tile)连接构成,集成超过连接构成,集成超过 1000 亿个晶体管亿个晶体管,是特斯拉 D1 的 2 倍。47 个小晶粒分别是 16 个Xe HPC(又叫 Compute Tiles 计算核)内核、8 个 Rambo、2 个 XeBase、11 个 EMIB、2个 XeLink、8 个 HBM2。这 47 个小晶粒分别来自台积电、三星和英特尔三个厂家,Compute 来自台积电,采用台积电 5 纳米工艺。封装
41、中的每块 tile 都是使用不同的工艺技术制成。Co-EMIB 芯片将高带宽内存和 Xe Link I/O 小芯片横向连接到“基础芯片”,其他芯片采用 行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 11 其 Foveros 3D 堆叠技术,在两个芯片之间建立了密集的芯片到芯片的垂直连接阵列。图图 15:英特尔超算芯片:英特尔超算芯片 Ponte Vecchio 结构结构 资料来源:佐思汽车研究院公众号,天风证券研究所 Chiplet 助力助力超异构超异构应用:应用:单一的处理器无法兼顾性能和灵活性是行业痛点。单一的处理器无法兼顾性能和灵活性是行业痛点。CP
42、U 通用灵活性是最好的,但是如果CPU 性能不足,就需要运行各种加速。而当前很多芯片的优化方案,特别是 AI 芯片等加速芯片的优化方案损失了灵活性,是目前行业的痛点之所在。Chiplet 助力助力提供异构混合、相互协同的解决方案提供异构混合、相互协同的解决方案,带来算力指数级提升,使得带来算力指数级提升,使得 Chiplet的价值得到更加充分的发挥的价值得到更加充分的发挥。2019 年,英特尔提出超异构计算相关概念:XPU 是架构组合,包括 CPU、GPU、FPGA 和其他加速器(即图中第四阶段)。超异构计算在传统的异构计算基础上,通过更强大的模块化 Chiplet 能力,封装互连能力和软件能
43、力,将越来越复杂的系统整合成了宏系统芯片 MSOC(Macro-System on Chip)。图图 16:处理器异构集成发展:处理器异构集成发展 资料来源:硬核芯时代公众号,天风证券研究所 基于超异构计算的架构创新正在成为芯片巨头们的未来驱动力。基于超异构计算的架构创新正在成为芯片巨头们的未来驱动力。通过一连串的收购和自研行为,全球三大处理器头部厂商都在向 CPU+GPU+FPGA/NPU 的方向靠拢,构建超异构计算体系。NVIDIA 拟收购 Arm,其目的在于增强其服务器 CPU 能力,虽然最终未能收购成功,NVIDIA 仍获得了未来 10 年 Arm 开发授权。AMD 对赛灵思的收购,也
44、释放出强化异构计算布局的信号,成功弥补了 FPGA 短板。同时,赛灵思在异构计算上也有所积累,已 行业报告行业报告|行业专题研究行业专题研究 请务必阅读正文之后的信息披露和免责申明 12 推出 Versal ACAP 异构计算平台,以缩短车载多传感器同步和融合所带来的系统整体响应时间。1.4.地缘政治影响下,地缘政治影响下,Chiplet 加持中国自主产业链的加持中国自主产业链的构建构建 站在中国的视角看,美国政府对中国半导体产业打压已久,先进制程突破及算力问题亟待站在中国的视角看,美国政府对中国半导体产业打压已久,先进制程突破及算力问题亟待解决,解决,Chiplet 在一定程度上拉近了与国际
45、先进厂商的起跑线,中国有机会突破限制问题,在一定程度上拉近了与国际先进厂商的起跑线,中国有机会突破限制问题,实现弯道超车。实现弯道超车。2019 年以来对华为打压开始,本土芯片企业在芯片制程的关键节点持续受限,迫使我国本土芯片国产化进入加速期。表表 2:美国政府对我国半导体产业制裁已久美国政府对我国半导体产业制裁已久 时间时间 事件事件 对华为打压 2019 年 5 月 15 日 商务部宣布华为加入实体名单 2020 年 5 月 15 日 限制华为使用美国技术设计和生产的产品 2020 年 8 月 17 日 进一步限制华为获取美国技术 中芯国际制造14nm 及以下芯片受阻 2020 年 12
46、月 21 日 中芯国际被列入实体名单,限制获取美国技术 2022 年 7 月 1 日 路透社援引五位知情人士的报道称,美国商务部正在研究禁止向中国公司出口芯片制造工具的可能性,即使用 14nm 制造节点和其他制造节点制造逻辑芯片。目前,中国唯一一家使用其 14nm 制造工艺生产芯片的公司是中芯国际,该公司在 2019 年底实现了 14m 级芯片的量产。打压中国半导体制造行业 2022 年 8 月 9 日 国会通过2022 年芯片与科学法案,计划未来五年提供合计 527 亿美元的政府补贴,且禁止获得补贴的企业 10 年内在中国或其他相关国家进行实质性扩张 限制 EDA与第四代半导体材料出口 20
47、22 年 8 月 12 日 对四项“新兴和基础技术”纳入新的出口管制。包括两项被称做“第四代半导体材料”的氧化和金刚石;开发 GAAFET(全场效应晶体管)结构果成电路必需的 ECAD(电子计算机辅助设计)软件。断供高性能 GPU 2022 年 8 月 31 日 美国限制对中国出口高性能 GPU,后发布授权至 2023 年 9 月 1 日。进一步加深对先进计算和半导体制造相关的对华出口管制 2022 年 10 月 7 日 进一步限制与先进计算和半导体制造相关的对华出口管制,在商业管制清单(CCL)中增加了某些半导体制造设备和相关项目。针对半导体制造,特别指明了三类技术:(1)16/14 或非平
美埃科技-公司研究报告-国内洁净设备龙头半导体国产替代助力公司加速成长-230208(34页).pdf
珀莱雅-公司研究报告-“平销”角度看珀莱雅坚持变革的强劲动力-230208(29页).pdf
启明医疗-港股公司研究报告-中国TAVR先驱者绘制结构心蓝图-230208(61页).pdf
腾远钴业-公司首次覆盖报告:技术领先一体化布局未来可期-230208(29页).pdf
天顺风能-公司深度报告:深耕风塔十余载快意雄风海上来-230131(45页).pdf
欣锐科技-公司深度报告:车载电源优质供应商高压化强者恒强-230208(29页).pdf
中国黄金-首次覆盖报告:央企背景黄金珠宝企业入局培育钻产业链-230208(31页).pdf
大丰实业-公司研究报告-乘疫后复苏东风开启大丰2.0时代-230208(23页).pdf
公牛集团-公司研究系列报告5:双翼拓展打造新兴成长曲线-230209(61页).pdf
平安银行-公司深度报告:把握财富良机零售新王崛起 -230208 (44页).pdf
圣农发展-公司公司深度分析:产业链一体化龙头生食+熟食双轮驱动-230208(20页).pdf
伊力特-公司研究报告-疆酒复苏改善可期-230208(26页).pdf
董事会脉动(第四期)(18页).pdf
中国责任投资论坛:中国责任投资年度报告2020(56页).pdf
360智慧商业:2021年360网服行业用户洞察研究报告(47页).pdf
阿里研究院:“移动互联网 ”中国双创生态研究报告(42页).pdf
中国基金会发展论坛:2020年度中国基金会行业大事记(18页).pdf
2021年中国风电行业发展分析及零部件国产化趋势研究报告(32页).pdf
2021年聚乙二醇PEG及衍生物应用场景分析及龙头企业键凯科技发展竞争力研究报告(28页).pdf
2021年能量饮料行业发展需求趋势分析及市场竞争格局研究报告(23页).pdf
2021年中药行业发展现状及中成药市场供需驱动力研究报告(21页).pdf
2021年中国精酿啤酒市场规模分析及乐惠国际商业模式产能布局研究报告(25页).pdf
UIPATH.:规划自动化之旅:选择变革性自动化项目的分布指南(24页).pdf
关于SAP的洞见:全球及中国视角(31页).pdf
半导体行业报告:Chiplet缓解先进制程焦虑行业巨头推进产业发展-230326(47页).pdf
半导体行业报告:AI板块投资热度持续华为盘古大模型4发布在即-230326(16页).pdf
千际投行:2023年半导体行业研究报告(15页).pdf
半导体行业专题研究:ChatGPT推动AI芯应用算力提升终端多点开花-230323(17页).pdf
半导体设备行业:进口替代逻辑强化招标启动前仍是配置期-230320(27页).pdf
中观科技产业系列专题报告01:全球半导体产业框架与投资机遇-230316(79页).pdf
探迹:2023年半导体行业发展趋势报告(29页).pdf
半导体行业更新报告:半导体公司全面布局攻坚国产替代-230313(28页).pdf
半导体行业深度报告:海外观察系列十从美光破净看存储行业投资机会-230309(39页).pdf
蜜雪冰城招股说明书-连锁茶饮第一股(724页).pdf
线上健身第一股-keep招股说明书(463页).pdf
麦肯锡:2023中国消费者报告:韧性时代(33页).pdf
罗振宇2023“时间的朋友”跨年演讲完整PDF.pdf
QuestMobile:2022新中产人群洞察报告(37页).pdf
QuestMobile:2022年中国短视频直播电商发展洞察报告(30页).pdf
小红书:2023年度生活趋势报告(34页).pdf
町芒:2022现制茶饮行业研究报告(47页).pdf
QuestMobile:2021新中产人群洞察报告(30页).pdf
锐仕方达&薪智:2022年薪酬白皮书(105页).pdf