《电子设备行业深度研究-AI系列报告(01):AGI驱动算力芯片增长国产芯片加速替代-250216(42页).pdf》由会员分享,可在线阅读,更多相关《电子设备行业深度研究-AI系列报告(01):AGI驱动算力芯片增长国产芯片加速替代-250216(42页).pdf(42页珍藏版)》请在三个皮匠报告上搜索。
1、 电子设备业深度研究 AI系列报告01AGI驱动算力芯w增长,国产芯w速替代 2025 年 02 o 16 日 00投资投资要要11 AGI 在 ChatGPT 按Q了键,它能像人类般处理多种复g任,突破单一任限制,p望p知识型作者的业革命=2 Scaling Law 作一范式的基q规则,揭示了模型性能P模型参数量1数据量等因素在幂律s系,直接导算力的需求呈指数P升2尤w是 25 各类用n落地,AI 理侧需求规模更,算力增长势确立2海外 CSP 厂商 24 前O季度资q开支度维持高O,要源自于 AI n看到商品W和_W能力,预计算力行业将投资驱走U用驱的段2 GPU 芯w在 AI 和理中x备势
2、,是目前流的架构,续理s比升过程中,原厂基于性能1pq1竞等方面考虑会n大ASIC 的采购比例2英_达凭借硬和网等方面的综合势,目前s据行业的领Y地O,预计续竞势能够维持2但是理百花齐的过程中,英_达和 GPU 的断地O会小幅收缩,部V定制W芯w厂的产品和营收经表明一势2 在算力需求增长和技术供给渐缓的背景Q,Y封装的值大幅增,_给中 AI 芯w厂供了追的契机223,美发a了多次针 AI 芯ww产业链的限制施,一n升了产W的紧性和必要性2预计 25 产芯w单t性能n达到或超英_达 A800 的时候,理侧的 AI 产W率p望得到升,w中g腾1寒o纪表的龙头厂商将得一定场份额2 00配置配置建建1
3、1 荐 AI 需求升过程中算力芯ww配套产业链机会,要包括芯w产W1理芯w1自研 ASIC 芯w1Y封装等V方U,建s注寒o纪1海Z信o1_丰技1生益电子1沪电股份1通富微电1拓荆技1芯源微1V易创等o的2 00风险风险示示11 AI 发展O预期2产业处于发展初期,要依赖大型技企业和家投资,行业发展度缓会大幅影响产业链需求和度2 技术n缓2产业依赖于技术n的度,缓会影响pqQ降曲线和产品商业W能力,而导行业整体需求Q滑2 中美摩擦剧2美多次限制中 AI 相s芯ww产业链口,限制中企业海外,摩擦和限制一n剧会影响相s行业需求和供给2 强强于大于大维持 东东方方富证富证xx研究研究所所 证x分析师
4、李亮 证书编S1160524100007 相相对对指指数表数表 相关研究相关研究:配X美算力硬方向1关注 CES带来的端侧 AI 机会;2025.01.07:新型大模型持续迭代,国内政策大力扶持算力P数据产业;2024.12.31:AI 创新动云&端共振P,自领域向卡脖子节攻坚;2024.12.27:豆包视觉模型引爆 AI 眼镜,存储乘势而P;2024.12.26:5G 规模W应用p望迎来速;2024.11.26-7.18%5.88%18.95%32.02%45.08%58.15%2/194/196/198/1910/1912/19电子设备 沪深300 挖挖掘掘值值 投资投资r长r长 业研究/
5、电子设备/证x研究报告 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 2 Table_yemei 电子设备业深度研究电子设备业深度研究 ll文目文目录录 1.AGI1.AGI 驱算力增长,驱算力增长,Scaling Scaling LawLaw 走U理走U理.5 1.1.A1.1.AGIGI 产业发展,OpenAI 引领技术革.5 1.1.1.AGI 心在于泛W能力.5 1.1.2.Transformer 架构 AGI 理论发展.6 1.1.3.ChatGPT p最快用,AGI l式走U实.7 1.1.4.o1 改革大模型研发方U,大模型升潜力.9 1.2.1.2
6、.ScaScaling Lawling Law 引领算力增长,大模型n入引领算力增长,大模型n入理理时时.10 1.2.1.Scaling Law 指引算力投资.10 1.2.2.AI 用n落地,理需求ns据流.13 1.2.3.算力需求测算相s于参数和数据量.14 1.3.1.3.海外海外 CSPCSP 厂商维持高厂商维持高度投资,h度投资,h AIAI 增长潜增长潜力大力大.14 1.3.1.AI 业增长,CSP 资q开支意愿烈.14 1.3.2.AI 竞P升家层面,h AI x备增长潜力.16 2.2.英_达凭借英_达凭借 GPUGPU 抢s抢s AIAI 芯w高,自研芯w高,自研 AI
7、SCAISC 潜力潜力大大.18 2.1.G2.1.GPUPU 势明显,势明显,AISCAISC n获得场份额n获得场份额.18 2.1.1.AI 芯w要求高并行计算1大内带宽和P耗.18 2.1.2.GPU 是 AI 芯w的流架构.18 2.1.3.理时 ASIC 增长潜力大.20 2.2.2.2.英_达领Y势明显英_达领Y势明显,硬构筑竞壁,硬构筑竞壁垒垒.21 2.2.1.英_达 AI 芯w迭.21 2.2.2.英_达硬城河高.23 2.2.3.英_达s率领Y,数据中心持续高增.24 2.3.C2.3.CSPSP 厂商自研厂商自研 AIAI 芯w芯w势,供链势,供链极扩极扩产需求产需求.
8、25 2.3.1.自研 AI 芯w性能表O差.25 2.3.2.合作厂商 AI 营收高增,厂商指引长期 AISC s比 50%.26 2.3.3.AISC 供链中 PCB 需求升,配套厂商极扩产.27 3.3.摩尔定律缓和易摩摩尔定律缓和易摩擦剧,产芯w擦剧,产芯w.28 3.1.3.1.摩尔定律缓制单摩尔定律缓制单t性能,Y封装t性能,Y封装要性要性增增.28 3.1.1.COWOS 封装升 AI 芯w性能.28 3.1.2.Y封装产难度小于前道,心备材料亟待突破.30 3.2.3.2.易摩擦态势剧,易摩擦态势剧,AIAI 芯w产W经形pr芯w产W经形pr识识.31 3.2.1.23 芯w法
9、案升 AI 芯w限制施.31 3.2.2.24 芯w法案增 HBM 芯w限制施.32 3.2.3.家和地方策码扶持产芯w.33 3.3.3.3.产芯w性能n追产芯w性能n追英_达,理时英_达,理时能性升能性升.34 3.3.1.产芯w算力性能x备o A800 能力.34 3.3.2.g腾打全产业解决方案,全面o英_达.35 3.3.2.寒o纪AI 芯wY行者,聚焦端算力,拐将.38 4.4.投资建投资建.40 5.5.风险示风险示.41 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 3 Table_yemei 电子设备业深度研究电子设备业深度研究 表目表目录录 表
10、表 1 1AIAI 发展程发展程.6 表表 2 2TransformTransformerer 架架构原理构原理.6 表表 3 3TraTransformnsformerer 中中O大O大 AttentionAttention 机制机制.7 表表 4 45 5 y注用户突y注用户突破破 100100 万万.8 表表 5 5ChatGPTChatGPT 原理原理.8 表表 6 6全球生p式全球生p式 AIAI 计算计算场规模预测场规模预测.9 表表 7 7MedQA MedQA P多个模P多个模型性能的比较V析型性能的比较V析.9 表表 8 8帕帕累累托托前前沿沿在在 MedQAMedQA 基基
11、准准测测试试PP显显示示准准确确性性PP总总 API API pq的s系pq的s系.10 表表 9 9Scaling LScaling Lawsaws 原理原理.10 表表 1010多模态多模态 Scaling LawScaling Law.11 表表 1111算力需求算力需求升升.11 表表 1212New New OpenAI OpenAI o1 o1 Long Long ThinThinking king Time=Time=Creates Creates a a N New ew W Way ay to to ScaleScale.12 表表 1313AIAI 大模型大模型算力增长情况
12、算力增长情况.12 表表 1414大模型o来算力大模型o来算力增长限制情况增长限制情况.12 表表 151520242024 1010 oo AIAI 产品全球总榜情况产品全球总榜情况.13 表表 1616大模型度调用大模型度调用量情况量情况.13 表表 1717中人智能中人智能服服器作负载预测,器作负载预测,20222022-2027E2027E.13 表表 1818TransforTransformer mer 每每一次前U播模型参一次前U播模型参数测数测算算.14 表表 1919海外四大海外四大 CSPCSP 厂厂商V季度资q开支商V季度资q开支.15 表表 202020232023 全
13、球算全球算力规模力规模.16 表表 2121hh AIAI a局情a局情况况.17 表表 2222中算力规模中算力规模情况情况.17 表表 2323模型中模型中 62%62%的开销在h的开销在h(Weights)(Weights)和梯度和梯度(Gradien(Gradient)t)通信中通信中18 表表 2424使用英_达使用英_达 AllAllReducReduce e 技术,负载技术,负载比例比例.18 表表 2525流流 AIAI 芯wV芯wV类情况类情况.19 表表 2626GPU vs CGPU vs CPUPU 的的架构架构.19 表表 272720242024 P半P半中人智能芯
14、w中人智能芯w场份场份额额.20 表表 28282021202620212026 各类各类 AIAI 芯ws率芯ws率.21 表表 2929英_达发展英_达发展.22 表表 3030英_达要的英_达要的 AIAI 算力芯w迭情况算力芯w迭情况.23 表表 3131英_达的英_达的 AIAI 群硬技术架构群硬技术架构.24 表表 3232英_达的英_达的 CUDACUDA 架构架构.24 表表 3333英_达数据中心英_达数据中心V季度营收情况百V季度营收情况百万美万美元,元,%.25 表表 3434Trn2Trn2 芯wP芯wP NVIDIANVIDIA 和和 GoogGooglele 的产品
15、比的产品比性能P比性能P比.26 表表 3434博通博通 XPUXPU 丰富丰富的的 IPIP a局a局.26 表表 3535博通定制芯w博通定制芯w度度.26 表表 3636marvellmarvell 数据中心业长期规划数据中心业长期规划.27 表表 3737marvell marvell 20242024 3 3 季度数据中心业情季度数据中心业情况况.27 表表 343420232023-2022028 8 全球多层全球多层 PCPCB B 产值均复合产值均复合增长率预测用领增长率预测用领域域.27 表表 3838硬算力峰值P硬算力峰值P内带宽内带宽.29 表表 3939COWOSCOW
16、OS-S S 的封装结构的封装结构.29 表表 4040COWOSCOWOS-L L 的的封装结构封装结构.29 表表 4141COWOSCOWOS 的艺流的艺流程程.29 表表 4242Y封装要Y封装要序备节厂序备节厂商梳商梳理理.30 表表 4343Y封装要Y封装要序材料节厂序材料节厂商梳商梳理理.31 表表 4444流流 AIAI 芯w相芯w相s参数情况s参数情况.31 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 4 Table_yemei 电子设备业深度研究电子设备业深度研究 表表 4545HBMHBM 和和 GDDR5GDDR5 的性能比的性能比.32
17、 表表 4747英_达各英_达各 GPUGPU 的的 HBMHBM 用量情况用量情况.33 表表 484820222022 中中 AIAI t竞格局t竞格局.34 表表 4949内外要算力内外要算力芯w参数比芯w参数比.34 表表 5050g腾计算产业生g腾计算产业生态态.35 表表 5151 CANNCANN 架构架构.36 表表 5252 g腾服g腾服.36 表表 5353g思g思 MiMindSporendSpore 框架框架.36 表表 5454g腾计算产品系g腾计算产品系列列.37 表表 5555 Atlas 900Atlas 900 SuperClu SuperClusterste
18、r 群群.38 表表 5656寒o纪产品谱系寒o纪产品谱系.38 表表 5757MLUMLU 架构情况架构情况.39 表表 5858寒o纪基础寒o纪基础系统系统.39 表表 5959寒o纪寒o纪/预预付款季度情况万元付款季度情况万元.40 表表 6060要s注o的p要s注o的p值比较表截值比较表截 20252025 1 1 oo 1313 .41 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 5 Table_yemei 电子设备业深度研究电子设备业深度研究 1 1.AGIAGI 驱驱算力算力增长增长,ScalingScaling LawLaw 走走UU理理 1 1
19、.1.1.A.AGIGI产业发展,OpenAI 引领技术革 1.1.1.AGI 心在于泛W能力 AGI 是Artificial General Intelligence=的缩写,s通用人智能2它是一种xp广泛智能能力的人智能,能够像人类一理解1学1理并解决各种O类型的复g问,而O局限于特定的1预Y定好的任,如单纯的像识别或者Q棋2在多个领域和任中展类似人类的认知灵活性和适性2 P统 AI 相比,在任范围1学方式1智能表1通用性等方面p较大差_ 1 任范围统 AI 要是弱人智能Narrow AI,侧于特定任2 例如,统的像识别 AI 精准地判断照w中的物体是猫是狗,但它无法完pw他类型的任,如文
20、q翻译或金融数据V析2 系统是针某一特定领域的问行计和的,w能力局限在预Y定义好的任范围内2AGI 是通用人智能,目o是像人类一x备广泛的智能,能够处理各种各的任2 它在O的任领域之间灵活W换,比如Y行文q创作,接着解决复g的数学问,然像行创意性的修改等,而O限于特定的任类型 2 学方式统 AI 的学方式较固定和局限2通常是通过大量特定任的数据行,学到特定的模式2例如,圾邮V类的 AI 会通过大量o圾邮和非圾邮的q数据,学识别邮中的特来判断邮是否圾邮2 它的学要是基于特定的数据和预Y定的算法结构,缺O灵活性和类型知识的自获能力2 AGI 被期望能够更接人类的方式学2 它O仅大量的数据中学,能够
21、通过少量的示例行_纳理,甚能够自探索的知识领域 3 智能表统 AI 在w擅长的特定任中表色,但缺O通用性和灵活性2例如,语音识别 AI 能够很好地将语音转换文_,但如果让它理解段文_的深层含义并行逻辑理来回答复g问,就会显得力O心2 它的智能要体在特定任的高效处理P,而Ox备综合的智能表2AGI 则能够表类似人类的综合智能2 它理解语言的含义1 行逻辑理1 解决复g问1创的内容等多种智能行 4 适性和通用性统 AI 境W和任的适性较差2一遇到超w范围的任或者数据特发生较大W,统 AI 的性能能会急剧Q降2AGI xp很的适性和通用性2它能够在O的境和任Q快调整自的知识和策略来2 就像人类在O的
22、境和任中找到解决问的方法一,AGI _该能够适简单到复g1 知到o知的各种情况,并能够灵活地用w智能来解决问2 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 6 Table_yemei 电子设备业深度研究电子设备业深度研究 表表 1 1A AI I 发发展展程程 资料来源daniellejwilliams 研究团队,东方富证券研究所 1.1.2.Transformer 架构 AGI 理论发展 2017 google 的机器翻译团队在 NIPS P发表了Attention is all you need=的文章,xp开创性的论文述了 Transformer Tran
23、sformer 的心概念和架构的心概念和架构计计,摒了统的循神经网RNN和卷神经网CNN中常的序计算方式,统序列模型在处理长序列时在统序列模型在处理长序列时在梯度梯度失和梯度爆等问失和梯度爆等问,而而TransTransformerformer 架构通过引入注意力机制来解决架构通过引入注意力机制来解决问问,实了更好的建模能力和并行计算效率,自然语言处理领域带来了大革2 表表 2 2T Tr ransformeransformer 架架构原构原理理 资料来源阿,东方富证券研究所 w心结构包含编码器和解码器n部V 编码器编码器EncoderEncoder负接收并处理输入数据,如文q子中的单词序列2
24、 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 7 Table_yemei 电子设备业深度研究电子设备业深度研究 首Y通过输入嵌入层将单词射高维U量,随O置编码层添单词O置信o,于捕捉序列序s要2s键的多头自注意力层则计算序列内各单词间的注意力V数,模拟单词间的s联程度,多个头并行处理O视角捕捉丰富语义,经和规范W层稳定数据,前馈神经网层一n非线性特,n将输入数据转换深层次的特表示2 解解码码器器DecodeDecoder r在生p任中发挥作用,如文q翻译或生p回答2它p输嵌入PO置编码,之的遮多头自注意力层在时确保生pQ一词仅依赖生p部V,避免信o泄露2多头注意
25、力层整合编码器信oP解码器自身输入,让生p过程能UV利用全局语境,最前馈神经网层生p输序列中的单词2 注意力机制是注意力机制是 TransformerTransformer 架构的心p部V架构的心p部V2它通过计算输入序列中每个O置Pw他O置之间的s联程度,而每个O置V配O的h2种h表示了OO置之间的要性,使得模型能够更好地捕捉序列中的s联信o2注意力机制要包括自注意力和多头注意自注意力和多头注意力力n个s键概念,前者用于捕前者用于捕捉捉输入序列内部的s联输入序列内部的s联,者用于处理O输入者用于处理O输入序列序列之间的s联之间的s联2 自注意力机制通过将输入序列的每个O置作查询1键和值来计算
26、注意力h2x体而言,它通过计算查询P键的相似度得到注意力V数,并将注意力V数P值相乘得到h和表示2,每个O置都通过Pw他O置的交来获全局信o,并每个O置的h是据输入序列的内容态计算的2 多头注意力机制通过并行地行多个自注意力计算,而捕捉O的s联模式2每个注意力头都学到了O的特表示,通过将多个注意力头的输行拼接和线性换,得到更丰富的特表示2多头注意力机制在高模型性能的时,增了模型于O特的建模能力2 表表 3 3T Transformerransformer 中中O大O大 AttentionAttention 机制机制 资料来源极_,东方富证券研究所 1.1.3.ChatGPT p最快用,AGI
27、l式走U实 2022 11 o 30,OpenAI 人智能聊y原型 ChatGPT,迅在社交媒体P走红,短短 5 y,注用户数就超过 100 万,23 1 opo活突破 1 亿,20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 8 Table_yemei 电子设备业深度研究电子设备业深度研究 pP最快增长最快的者用,o志着 AGI l式走U实2 表表 4 45 5 yy注注用用户户突破突破 1 10000 万万 资料来源机器之心信o服,东方富证券研究所 GPT 系列模型的基q思路是让 AI 在海量的数据P通过文_PQ文接,而掌握基于前文内容生p续文q的能力2种方法O需
28、要人类o注数据,只需要供一段话的P文并遮QQ文,然将 AI 生p的文qPQ文内容行比来 AI2ChatGPT 是在 GPT3.5 模型的基础P行W的,作 GPT 系列的第O,GPT3.5 在万亿词汇量的通用文_数据P行了,几N完p自然语言处理的大部V任,例如完形填空1阅理解1语义断1机器翻译1文章生p和自问答等2 表表 5 5ChatChatGPTGPT 原理原理 资料来源OPENAI 官网,东方富证券研究所 Bloomberg Intelligence 告指,生p式 AI 场规模将 2022 的400 亿美元,增长 2032 的 1.3 万亿美元,复合增p望达到 46%2预计到 2032,生
29、p式 AI 将s IT 硬1服1广告支和游o场支的12%,但预计 2024 一比例仅p 3%2 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 9 Table_yemei 电子设备业深度研究电子设备业深度研究 表表 6 6全全球球生p生p式式 A AI I 计算计算场场规模规模预预测测 资料来源Bloomberg Intelligence,IDC 数据,东方富证券研究所 1.1.4.o1 改革大模型研发方U,大模型升潜力 OpenAOpenAI I o1 o1 模型系列的模型系列的o志着P之前的o志着P之前的 GPT GPT 模模型的大转型的大转2 P GPT O,
30、o1 模型是使用W学 RL 技术行的,使它们能够在生p输之前思考=2o1 并O依赖复g的示程技术,而是在模型的过程中直接融入了理能力2微研究表明,o1-preview 模型s便在没p任何示的情况Q,_能在多个|疗基准测试中超了使用 Medprompt 的 GPT-42o1的心势在于w原生理机制2模型能够在生p最答案之前行自理,一过程O仅高了理的准确性,使得模型能够在面复g问时展更灵活和全面的能力2种能力的内置,使得 o1 能够超统的示依赖方法,尤w是在|疗领域类需要深度理的用中,展更大的性能2 表表 7 7MedQA MedQA PP多多个模个模型性型性能能的的比较比较VV析析 资料来源微官网
31、,东方富证券研究所 但是微的研究_表明,管 o1-preview 在理能力P表色,准确率_比 GPT-4o 高了几个百V,但w所需的计算资源和行pq大幅增,尤w是在处理大规模数据时,pq的升非常显著2 准确率 88%升到 96%,20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 10 Table_yemei 电子设备业深度研究电子设备业深度研究 pq增 100 倍2一数据展示了高性能模型带来的pq效益h衡2在追求更高准确率时,pq会显著增,于 AI 产品的开发人员来说是一个要的决策因素2 表表 8 8帕帕累累托前托前沿沿在在 M Me ed dQ QA A 基基准准测
32、试测试PP显示显示准准确性P确性P总总 API API pqpq的的s系s系 资料来源微官网,东方富证券研究所 1 1.2 2.ScScalialingng La Law w 引引领算领算力增力增长,大长,大模型模型n入n入理时理时 1.2.1.Scaling Law 指引算力投资 2020,OpenAI 发a的论文:Scaling Laws for Neural Language Models;xp程碑意义2篇论文通过大量的实验,系统地研究了神经语言模型性能P模型大小1数据大小用于的计算量之间的s系2心发是因素之间在幂律s系,s模型大小1数据大小或计算量增时,模型的性能会按幂律高2 Scal
33、ing Law 的在促使研究人员O断探索的模型架构1算法和方法,更好地利用规模效来升模型性能,是 AGI 目前的黄金规则2 表表 9 9Scaling LawsScaling Laws 原理原理 资料来源OpenAI2020:Scaling Laws for Neural Language Models;,电子发烧,东方富证券研究所 Scaling Law O仅适用于语言模型,适用于w他模态跨模态的任2 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 11 Table_yemei 电子设备业深度研究电子设备业深度研究 表表 1010多多模模态态 ScalingSca
34、ling L Lawaw 资料来源OpenAI 2020:Scaling Laws for Neural Language Models;,东方富证券研究所 Scaling Law 揭示了模型性能P模型参数量1数据量等因素在幂律s系2随着人智能模型O断发展,了追求更高的性能和更准确的结果,研究人员和企业O断扩大模型的规模2大型语言模型的参数量最初的几千万增长到如的数千亿甚更高2种模型规模的快增长直接导算力的需求呈指数P升2 表表 1111算算力力需求需求升升 资料来源Shiqiang Zhu 等 Intelligent Computing 2023:Intelligent Computing:
35、The Latest Advances,Challenges,and Future;,东方富证券研究所 针针 ScaScalingling LaLaw w 的持续的持续性论剧性论剧2支持 Scaling Law 到头的认 1边效益递减边效益递减随着模型参数量1数据量和计算量的O断增,模型性能的升幅度渐小2就像 OpenAI 的研究中,模型规模达到一定程度,继续扩大规模,所带来的性能升经O显著,而会导pq大幅P升,包括计算资源的耗1时间pq能源耗等,经o和效率的角度来看,种投入产比的降P意味着 Scaling Law 渐失去了w原p的势 20172017 敬敬请阅读本请阅读本报告k报告k文后各文
36、后各项声明项声明 12 Table_yemei 电子设备业深度研究电子设备业深度研究 2数据瓶颈数据瓶颈高量的数据获难度来大2一方面,实世界中的数据虽然海量,但符合模型要求1o注准确xp表性的数据t相p限2一方面,随着模型数据量的需求O断增,数据的收1整理和o注作得愈发困难和昂2u渊栋到,模型离人类就难获得的数据,数据量达到一定程度,很难找到足够多的数据来一n模型性能的升,p了制 Scaling Law 继续发挥作用的要因素 3架构P算法的局限架构P算法的局限目前的模型架构和算法在面超大规模的模型和数据时,能在一q性的限制2s使O断增模型的参数量和数据量,如果架构和算法q身无法p效利用资源,_
37、难实性能的持续突破2例如,一研究发,某模型在扩展到一定规模,会梯度失或爆等问,影响模型的和W效果,表明单纯依靠 Scaling Law 而O改架构和算法,模型性能的升将面临瓶颈2 英_达依然支持英_达依然支持 ScalingScaling LawLaw22在英_达的电话会P,黄仁勋表示基础模型预的 Scaling 然p效 2他指 OpenAI 的 o1 模型所依赖的 测试时间扩展=能会在英_达o来的业中发挥更大的作用,w 最人t奋的发展之一=和 的扩展定律=,认 o1 表了人智能行业改模型的方法,并竭全力U投资者保证,英_达一W做好了UV准备2黄仁勋的言论P微 CEO 纳德拉的一,s并没p看到
38、人智能 Scaling Law 遇到障碍,相了测试时计算的缩定律2 表表 1212N Ne ew w O Op pe en nA AI I o o1 1 L Lo on ng g Thinking Thinking TimeTime=C Cr re ea at te es s a a N Ne ew w W Wa ay y t to o S Sc ca al le e 资料来源英_达官网,东方富证券研究所 据 Epoch AI 研究表明,过去多大模型端一直沿着 45 倍每升的度前,预计到 2030 大模型少p 1000 倍升的空间2 表表 1313AIAI 大模型大模型算力增长情况算力增长情况
39、 表表 1414大模型o来算力大模型o来算力增长限制情况增长限制情况 资料来源EPOCH AI研究机构,东方富证券研究所 资料来源EPOCH AI研究机构,东方富证券研究所 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 13 Table_yemei 电子设备业深度研究电子设备业深度研究 1.2.2.AI 用n落地,理需求ns据流 A AI I 用经n入用经n入态势态势,理理侧侧需求s需求s比会比会持续升持续升2据 AI 产品榜的统计,202410o全球要的AI产品均实了增长,全球总榜前 20 微的 copilot 增最快 87.57%,w次是 Perplexity
40、 25.53%2大模型的 API调用量_在持续升,10 o_明显P了一个,表明各类 AI 用经n在入常作生活中2 表表 151520242024 1010 oo AIAI 产品全球总榜情况产品全球总榜情况 表表 1616大模型度调用大模型度调用量情况量情况 资料来源AI产品榜_,东方富证券研究所 资料来源OpenRouter官网,东方富证券研究所 英_达 2024 第四季度电话会露,2023 数据中心中理业创的营收s比 40%,预计一s比o来将p所升2IDC 数据显示,在中,2023 P半作负载的服器s比达到 49.4%,预计全的s比将达到 58.7%2随着模型的完善Pp熟,模型和用产品n入投
41、产模式,处理理作负载的人智能服器s比将随之攀升2IDC 预计,到 2027,用于理的作负载将达到 72.6%2 2 表表 1717中中人人智智能服能服器器作负作负载载预测预测,20222022-2 20 02 27 7E E 资料来源浪潮,IDC 数据:2023-2024 中人智能计算力发展评p告;,东方富证券研究所 58.4%41.3%67.7%68.8%70.5%72.6%41.6%58.7%32.3%31.2%29.5%27.4%0.0%20.0%40.0%60.0%80.0%100.0%202220232024E2025E2026E2027E理 20172017 敬敬请阅读本请阅读本报
42、告k报告k文后各文后各项声明项声明 14 Table_yemei 电子设备业深度研究电子设备业深度研究 1.2.3.算力需求测算相s于参数和数据量 据 OpenAI 在 2020 发表的:Scaling Laws for Neural Language Models;论文,算力需求算力需求要包含和理要包含和理n大n大部V部V2 部V,OAI 给了一个经验式 6 w中C表示预所需的算力,N是模型的参数量,B每n耗的 token 批量,S是预需要的迭次数,系数 6 是在前U播中,需要将 wP输入节相乘,并将w添到语言模型的计算的输节中1 次乘法和1 次法,在计算损失 w 的梯度时,需要p好 2 次
43、,在用损失的梯度更参数 w 时,需要p好 2 次,的原因是无论 bias vector addition,layer normalization,residual connections,non-linearities,是 softmax,甚是 attention 的计算都O是s算力的要因素,最s键的是 Transformer 中的矩算2 表表 1818T Transformerransformer 每一每一次次前前UU播播模型模型参参数测数测算算 资料来源OpenAI:Scaling Laws for Neural Language Models;,东方富证券研究所 相的,理部V就是一个简单
44、的前U播,因m理算力计算式 2 w中C表示理所需的算力,N是模型的参数量,B token 总量,v于实用中理任的需求并非始处于稳状态,能会在某特定时间段或场景Q突发的高峰2例如,在电商促销活期间,大量用户时使用智能服系统行咨询,基于人智能的服理服了极高的并发请求2m时,系统需要x备足够的算力来高峰需求,确保服的流畅性和响度,因m场会增一个峰值倍数S2 1 1.3 3.海外海外 CSCSP P 厂商厂商维持维持高高度投资度投资,hh AIAI 增长增长潜力大潜力大 1.3.1.AI 业增长,CSP 资q开支意愿烈 A AI I 经开始产生一定经o经开始产生一定经o回,尤w是回,尤w是在类在类用用
45、和搜广之中2和搜广之中2微1谷歌1meta1applovin1Palantir 等最均展喜展2 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 15 Table_yemei 电子设备业深度研究电子设备业深度研究 微表示 AI 驱的转型l在改每个角色1职能和业流程的作1作和作流程,户的增长和营杆2Azure Arc 在在各个行业拥p超过 39,000 户,包括 American Tower1CTT1LOral,比增长超过 80%2借 Microsoft 365 Copilot1Copilot Studio 和 Agents 在的 Autonomous Agents,A
46、I 业转型构建了端到端系统,超过 100,000 家经使用了 Copilot Studio,比增长了 2 倍多,Copilot 企业户比增长了 55%2 谷歌在搜索和计算等业领域的人智能投资开始结回2Alphabet lO断大在人智能方面的研发投入,在个快发展的领域POpenAI 等t手展开竞2利用 AI xp的长视频中生p了多W的视频1像和文q内容,使网站流量增了 80%,量高了 2.7 倍,促了销售增长2AI 搜索 MAU 超过了 10 亿,w_W率P统业大相27个 MAU 超过 20 亿的产品都在使用 Gemini 模型2 Meta表示o活超过5亿,Facebook P的使用时长增了 8
47、%,在 Instagram P的使用时长增了 6%2P个o,超过 100 万广告使用q们的 Gen AI x创建了超过 1500 万广告2 AppLovin 表示w AI 驱的 Axon 2.0 广告引擎,力广告率升,p业增长的要催W剂2旗Q的程序W广告交易全球用户超过 15 亿,通过p AppLovin SDK,将广告P全球 15 亿手机备和 6 万款移用紧密接,广告供更广泛的广告覆盖和更高的投回2 Palantir 表示 24 3 季度美商业业比增长 54%1.79 亿美元,美府业比增长 40%3.2 亿美元,表示业增长要_于满足了美府和商业户人智能的坚定需求,w收入中p 4.99 亿美元
48、 70%来自美户2 海外海外 C CSPSP 资q开支意愿资q开支意愿烈烈,投资度持续维投资度持续维持高持高OO22微1谷歌1马1meta 等在最均展很的投资意愿224 3 季度合计资q开支达 588.6 亿美元,比增长 59%,比增长 11%2 表表 1919海海外外四大四大 C CSPSP 厂商厂商VV季季度资度资qq开支开支 资料来源Choice 马1微1谷歌1脸书的深度资料,东方富证券研究所 -20%-10%0%10%20%30%40%50%60%70%010000200003000040000500006000070000联网四头马1微1谷歌1Facebook合计资q支百万美元 比轴
49、 比轴 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 16 Table_yemei 电子设备业深度研究电子设备业深度研究 1.3.2.AI 竞P升家层面,h AI x备增长潜力 算力p各极算力p各极抢s抢s的战略制高的战略制高22算力是信o产业的要p部V,是衡量一个家数_经o发展水,实经o社会数_W转型1适技革命和产业革的s键指o2算力竞直表算力规模和算力s比的竞,中信o通信研究院数据显示,截 2023 全球计算备算力规模1397EFlops,q计算备算力规模达到 435EFlops,全球s比OV之一,增 50%2中信o通信研究院数据显示,全球算力s比方面,美1中
50、1q1德1英 1拿大的算力s比V别 32%126%15%14%13%13%,美1中算力规模O列前n2 表表 202020232023 全全球算球算力规力规模模 资料来源开数据中心委员会,东方富证券研究所 hh AI AI l在t,o来l在t,o来增长潜力较大增长潜力较大2h AI 是指一个家在人智能领域拥p自的技术1数据和基础施,能够独立地行人智能技术的研发1用和监管2它调家在人智能战略层面的自性,包括算法开发1模型1数据管理硬支持等各个节都O外部的过度制2来多的家将h AI 升到家战略高度,如美1 欧盟1 中1 q等,都在纷纷制定相s战略规划和策2 2 o,英_达创始人黄仁勋在世界府峰会直言
51、,每个家都该建立自的h AI=2英_达官网发a的闻稿显示,黄仁勋经V别P拿大1法1印度1q1马来西1坡1南等领导人行了会谈2据O完全统计,和英_达行h AI=合作的家包括坡1印度1印度|西1马来西1q1德1法1荷q1阿联酋1沙特阿拉o2 hAI=通常V多期目投资,投资n 5 亿-10 亿美元2q府建立hAI=,U银等O家q电信营商投资了 7.4 亿美元2银计划 2025 前要投资 9.6 亿美元建立家智算中心2印度府和几家大型企业l在行多个超过 10 亿美元的英_达 AI 芯w采购计划2该管理层在 2024 一季度电话会P披露,2024 h AI=业将英_达带来 100 亿美元营收,预计s 2
52、4 数据中心营收的 9%2而在 2023,该业收入零2 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 17 Table_yemei 电子设备业深度研究电子设备业深度研究 表表 2121hh A AI I a局a局情情况况 家家 建建方方 部部署方案署方案 美 Oracle A100/H100 搭建美府 坡 坡电信 Singtel H100 升家超算中心,在东南建节能 AI 厂 q 银 1 KDDI 1 Sakura Ineternet 516G 用构建生p式 AI 和 AI 厂网,开发语大模型 印度 塔塔1信实业1瑞莱 采购 GH200 芯w搭建只算中心,定制印地
53、语 AI 大模型 法 伊利特团 127 个 DGX H100 系统,1016 个 H100 芯w 西q Team IM1Oracle 采购英_达芯w建q地 阿联酋 阿联酋电信1Oracle 采购英_达芯wr建h 意大利 瑞士电信 采购英_达 AI 芯w建超算中心,定制开发意大利语大模型 资料来源经g志,东方富证券研究所 IDC 预测,2022 中通用算力规模达 54.5 EFLOPS,智能算力规模达259.9EFLOPS,预计到 2027 通用算力规模将达到 117.3 EFLOPS,而智能算力规模将达到 1117.4EFLOPS22022-2027 期间,中智能算力规模复合增长率达 47.1
54、%,期通用算力规模复合增长率 16.8%2 表表 2222中中算力算力规规模情况模情况 资料来源浪潮,IDC 数据:2023-2024 中人智能计算力发展评p告;,东方富证券研究所 050010001500200020202021202220232024202520262027通用算力FP16)智能算力FP16 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 18 Table_yemei 电子设备业深度研究电子设备业深度研究 2 2.英英_达_达凭凭借借 G GPUPU 抢s抢s A AI I 芯芯w高w高,自自研研 A AISCISC 潜力大潜力大 2.2.1 1
55、.G.GPUPU 势明显势明显,A AISISC C n获得n获得场场份额份额 2.1.1.AI 芯w要求高并行计算1大内带宽和P耗 了处理大规模的深了处理大规模的深度学度学模型,模型,芯w厂商芯w厂商需要研需要研发xp更高并行计算发xp更高并行计算能能力1更大内带宽和力1更大内带宽和更P更P耗的算力芯w耗的算力芯w2 首Y是高性能计算高性能计算能力2大模型包含海量的参数,过程到复g的矩算1张量算等2像 Transformer 架构中的多头注意力机制,需要算力芯wp大的浮算能力,特别是 FP32单精度浮数和 FP16半精度浮数算性能2 GPT 需要芯w能够快处理大规模的矩乘法,大量的参数更和梯
56、度计算,而模型收敛2 w次是高高并并行行处处理理能力2大模型的数据量极大,了缩短时间,需要时处理多个任或数据块2算力芯w支持多线程1多处理技术,像 GPU形处理器p数千个计算心,能够并行地执行大量计算任2 者是高带宽和大容高带宽和大容量量储储2在过程中,频繁的数据写是必O少的2算力芯w需要P内之间p高带宽的接,快地和储模型参数1梯度等数据2时,芯w自身_需要p一定的缓容量来暂中间数据,减少外部储的问延2 最,要求芯wp良好的能耗比良好的能耗比2因大模型是一个长时间1高能耗的过程,秀的能耗比降Ppq2 表表 2323模模型型中中 62%62%的开销在h的开销在h(Weights)Weights)
57、和梯度和梯度(Gradient)(Gradient)通信中通信中 表表 2424使用英_达使用英_达 AllAllReducReduce e 技术,技术,负载负载比例比例 资料来源Mengdi Wang 等2019 IEEE International Symposium on Workload Characterization(IISWC):Characterizing Deep Learning Training Workloads on Alibaba-PAI;,东方富证券研究所 资料来源Mengdi Wang 等2019 IEEE International Symposium on
58、Workload Characterization(IISWC):Characterizing Deep Learning Training Workloads on Alibaba-PAI;,东方富证券研究所 2.1.2.GPU 是 AI 芯w的流架构 A AI I 芯w要包含芯w要包含 C CPU/GPU/PU/GPU/FPGA/FPGA/ASICASIC 等几类等几类2 CPU/GPU 是最流的产品,FPGA1ASIC 表的 AI 芯w基于统芯w架构,某类特定算法或者场景行 AI 计算_sp一地O,p比较前沿性的研究,例如类脑 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后
59、各项声明项声明 19 Table_yemei 电子设备业深度研究电子设备业深度研究 芯w1构通用 AI 芯w等但距离大规模商用p较长距离 2 表表 2525流流 A AI I 芯w芯wVV类情类情况况 资料来源中院物理所_,东方富证券研究所 CPU1GPU1FPGA1ASIC 是目前 AI 计算过程中最流的四种芯w类型,他们的要别体在计算效率1能耗和灵活性P面2 CPUCPUCPU 是冯依曼架构Q的处理器,遵循Fetch(指)-Decode(译码)-Execute(执行)-Memory Access()-Write Back(写回)=的处理流程2在执行计算任过程中,数据需要Y获并入 RAM,然
60、解码获得指,然在 ALU 计算模块计算,最将计算结果返回 RAM2整个流程更调制和决策,在并行计算效率Pp较大升空间2 GPUGPU GPU 采用并行架构,减少了大量数据预和决策模块,超过 80%部V算单元,x备较高性能算度2相比较Q,CPU 仅p 20%算单元,更多的是逻辑单元,因m CPU 擅长逻辑制P串行算,而 GPU 擅长大规模并行算2GPU 最作深度学算法的芯w被引入人智能领域,因w良好的浮计算能力适用于矩计算,相比 CPU xp明显的数据吞T量和并行计算势2但是,GPU _在一定的限制2在深度学算法中,和断是n个O的段2 GPU 在段效率非常高,但在行单个输入的断时,并行计算的势并
61、O能完全发挥来2 表表 2626GPU vs CPGPU vs CPU U 的架构的架构 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 20 Table_yemei 电子设备业深度研究电子设备业深度研究 资料来源英_达官网,东方富证券研究所 FPGAFPGAField Programmable Gate Array是在 PAL 编程列逻辑 1GAL通用列逻辑等编程器的基础P一n发展的产物2它是作_用p电路ASIC领域中的一种半定制电路而的,既解决了定制电路的O足,又克服了原p编程器门电路数p限的缺2FPGA 能够时实数据并行和任并行计算,在处理特定用时能够显著升效
62、率2P通用 CPU 相比,通用 CPU 能需要多个时钟周期才能完p特定算,而 FPGA 通过编程电路,直接生p_用电路,就能在仅耗少量甚一次时钟周期的情况Q完p算2v于 FPGA xp编程灵活性高1开发周期短并行计算效率高等特,FPGA 的用场景非常广泛,遍a航空航y1 汽车1|疗1 广播1测试测量1电子1业制等热门领域2 ASICASIC(Application Specific Integrated Circuit)芯w是_用p电路,是针用户特定电子系统的需求,计1制的_p用程序芯w,w计算能力和计算效率据算法需要行定制,是固定算法最W计的产物2定制W特性高 ASIC 的性能耗比,尤w在高
63、性能1P耗和移用方面xp明显势2然而,缺包括定制W程度较高1计周期长1算法依赖性高和扩展性差等2来来多的开始采用 ASIC 芯w行深度学算法,w中表最突的是 Google 的 TPU2 TPU 比时期的 GPU或 CPU 均 1530 倍,能效比升 3080 倍2相比 FPGA,ASIC 芯wx备更P的能耗P更高的计算效率2但是 ASIC 研发周期较长1商业用风险较大等O足_使得只p大企业或背靠大企业的团队愿意投入到它的完整开发中2 G GPUPU 然是目前最流的然是目前最流的 A AI I 芯w芯w2IDC 统计显示,2023,中芯w的场规模达到 140 万张,w中 GPU ts据 85%的
64、场份额2 2024 P半,中芯w的场规模达超过 90 万张,w中 GPU ts据 80%的场份额2 表表 27272 2024024 PP半半中中人人智能智能芯芯ww场场份额份额 资料来源IDC 数据,东方富证券研究所 2.1.3.理时 ASIC 增长潜力大 ASICASIC o来增长潜力较大o来增长潜力较大2TrendForce 研究显示,CPU1GPU P ASIC 芯w在 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 21 Table_yemei 电子设备业深度研究电子设备业深度研究 2026 AI 场规模的比将达 33134126,w中 ASIC 芯w场p
65、长最快2 表表 282820212021 20262026 各类各类 A AI I 芯芯wwss率率 资料来源TrendForce 研究机构,东方富证券研究所 理侧理侧 A ASICSIC x备独特的x备独特的势势2首Y,性能势层面,ASIC 芯w针特定的人智能任行了定制W计,能够实高度并行计算,ASIC 芯w的架构和计使w在执行特定任时,能够较P的耗供较高的性能2于大规模的 AI 数据中心和边缘计算备来说,降P耗O仅意味着营pq的降P,能高备的稳定性和靠性,使w更适合长时间1 大规模的理任2 w次,pq效益层面,虽然 ASIC 芯w的初始计和开发pq较高,但随着生产规模的扩大,单Opq会渐降
66、P2场 ASIC 芯w的需求增,大规模生产使得芯w的制pq1封装测试pq等大幅Q降,而在pqP更x竞力,ASIC 芯w在理任中的能效比高,能够较P的能耗完p相的计算任,降P了电力pq2m外,w稳定性高,减少了因硬故障导的维pq和停机时间,一n高了整体的pq效益2 者,技术发展方面,随着人智能算法的O断发展和p熟,一常用的算法和模型被固W到 ASIC 芯w的硬电路中,实了算法P硬的深度融合2种W方式能够一n高芯w的性能和效率,使w在特定的理任中表更色,而促了 ASIC 芯w的用和s比升,O断创的硬架构计使得 ASIC 芯w能够更好地适O类型的 AI 理任2 最,在场竞层面,英_达目前一家独大,产
67、业h过高,CSP 原厂均在大力研发和采用自的产品,而削弱英_达的行业地O2 2.2.2 2.英_英_达领达领Y势Y势明显明显,硬构硬构筑竞筑竞壁垒壁垒 2.2.1.英_达 AI 芯w迭 英_达 1993 v黄仁勋等O人创,1995 发a第一个流多能芯w NV1,1999 行业首个显示形处理单元 GeForce 256,开启 GPU 时2m,英_达凭借技术势在游o显t领域O断发展,p行业领导者22016 英_达转型人智能计算,w GPU 相s产品 AI 发展供 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 22 Table_yemei 电子设备业深度研究电子设备业深
68、度研究 大算力支持,了 AI 的快发展,尤w在大模型等方面发挥要作用,如英_达p全球 AI 芯w行业的领军企业2 表表 2929英英_达发达发展展 资料来源智 AGI _,神问学_,东方富证券研究所 英_达 AI 端算力芯w经了多个更迭 Tesla2008,NVIDIA 第一个实统一着色器模型的微架构2经y型G80,采用电90纳米艺制程,并实个第一=Fermi 架构2010,NVIDIA GPU 是初 G80 来最大的飞跃,是第一个完整的 GPU 计算架构2Fermi 架构p 30 亿个晶体管,电 40nm 艺制程,512 个 CUDA 内,每个 CUDA 心每个时钟周期执行一个浮数或整数指,
69、采用第O流式多处理器 SM,512个 CUDA 心V 16 个 SM,每个 SM p 32 个 CUDA 内,实了 IEEE 754-2008 浮o准,单精度和精度算术供了融合乘FMA指 Kepler 架构2012,采用电 28nm 艺制程,整体架构PFermi 保持一性,但思路减少 SM 单元数,增 CUDA 内数,SM改 SMX,Kepler 架构中每个 SM 单元的 CUDA 内数 Fermi 架构的 32 个增 192 个 Maxwell 架构2014,是Y前 Kepler 架构的升x,采用电 28nm 艺制程,SM 全计 SMM妙地模仿了 4 个 Fermi架构 SM 单元 2x2
70、排列方式,每 SMM 单元的 CUDA 心数减少,但每个 SMM 单元拥p更多的逻辑制电路,便于精确制 Pascal 架构2016,采用电 16nm 艺制程,p 1500亿个晶体管,首个了深度学而计的 GPU,支持所p流的深度学计算框架2s键技术包括 NVIDIA NVLink 高技术1HBM2第 3D 堆p式高带宽内1依靠 Async shaders 硬层面完整实 AsyncCompute1支持 DirectX 12Feature Level 12_1 Volta 架构2017,第一 TensorCore,采用电 12nm 艺制程,p 210 亿个晶体管,配备 640 个 Tensor 心,
71、每供超过一 125teraFLOPs 的深度学效能,比P一 5 倍P 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 23 Table_yemei 电子设备业深度研究电子设备业深度研究 Turing 架构2018,第 TensorCore,采用电 12nm艺制程,p 186 亿个晶体管,引入_门用于Z线追踪的 RT 心,高达每 10 Giga Rays 的度Z线和声音在 3D 境中的播行计算,是初 G80 来最大的飞跃2Turning 配备全的Tensor Core,每供高达 500 万亿次的张量算,极大 AI增能2基于 Turing 的 GPU 搭载型流多处理器(
72、SM)架构,支持高达 16 万亿次浮算,时能够并行执行 16 万亿次整数算 Ampere 架构2020,采用电 7nm/O 8nm 艺制程,p 540 亿个晶体管,采用突破性创技术,_性计算时计,在各种规模Q能实色的,显著增 CUDA 心数量,高每个 SM 的计算能力,整体性能得到大幅度升 Hopper 架构2022,采用电 4nm 艺制程,p 800 亿个晶体管,采用突破性创技术 H100 Tensor Core GPU 供力支持,通过 Transformer 引擎 TensorCore 技术的发展,在 AI 模型,Hopper Tensor Core 用混合的 FP8 和 FP16 精度,
73、大幅 Transformer 模型的 AI 计算,并P Transformer 引擎和第四 NVIDIA NVLink 相结合,使 HPC 和 AI 作负载的实数量升2第 MIG 能,MIG 技术支持将单个 GPU V七个更小完全独立的实例,一n支持各种作负荷 Blackwell 架构2024,Blackwell 架构的 GPU p 2080 亿个晶体管,采用电 4NP 艺,NVIDIA w实在十万亿参数模型P的 AI 和实时 LLM大语言模型理2 表表 3030英英_达达要要的的 A AI I 算算力力芯芯w迭w迭情况情况 资料来源搜狐,网界,东方富证券研究所 2.2.2.英_达硬城河高 英
74、_达在人智能领域的a局堪全面,w系统系统和网1和网1硬和硬和O大支柱,构建了深厚的技术城河2在计算芯w方面,Nvidia 拥p CPU1GPU1CPU-CPU/CPU-GPU SuperChip 等全面的a局在超节网层面,Nvidia供了 NVLink 和 InfiniBand n种定制W网在群网方面,Nvidiap基于 Ethernet 的交换芯w和 DPU 芯wa局2 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 24 Table_yemei 电子设备业深度研究电子设备业深度研究 表表 3131英英_达的达的 A AI I 群硬群硬技技术架术架构构 资料来源搜
75、狐,R思汽车研究,东方富证券研究所 英_达在英_达在 CUDACUDA并行编程并行编程模型模型P的战略P的战略眼Z持眼Z持续坚持,续坚持,是如是如形p形p硬合生态的最心硬合生态的最心壁垒壁垒2CUDA最初的计算统一备架构是 16 英_达创立的_p的并行计算和用程序编程接口 API,它允许使用某类型的形处理单元行通用处理2CUDA 包含 CUDA 指架构ISA GPU 内部的并行计算引擎,采用通用并行计算架构,使 GPU 能够解决复g计算问,相较 AMD 采的通用 OpenCL 而言,并行计算能力高 10-200倍O等2 英_达通过十余迭扩U形p丰富的函数1 API 指1 x链1用程序等,开发者
76、好程度更高2CUDA 只针 NVIDIA 的 GPGPU,通过一的境才能让 NVIDIA 的产品能够实最大限度的2 表表 3232英英_达的达的 CUDACUDA 架构架构 资料来源英_达官网,东方富证券研究所 2.2.3.英_达s率领Y,数据中心持续高增 凭借累的竞凭借累的竞势势,英_达几N断了目前英_达几N断了目前 A AGIGI 场的算力芯w供场的算力芯w供2据半导体V析 TechInsights 研究告,英_达在 2023 数据中心 GPU 量方面得了爆式增长,总计量 376 万块,相比于 2022 的264 万块增长了超百万块2在数据中心 GPU 场领域依然是N断性的霸 201720
77、17 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 25 Table_yemei 电子设备业深度研究电子设备业深度研究 地O,场份额P 2022 的水相,98%2 2024 3 季度s FY3Q25数据中心营收达到 308 亿美元,较P一季度增长 17%,较P期增长 112%2Blackwell 芯w全面投产,并在第O季度U户交付了 1.3 万个 GPU 品,w中包括U OpenAI 交付的首批 Blackwell DGX 程品,l式生产计划于第四季开始,预计 2026 将供O求2m外,H200 产品在q季度销量显著增长,w计算业收入 276 亿美元,比增长 132%,比增长 22
78、%2网业收入 31 亿美元,比增长 22%,比Q降 15%,增长要来自人智能z网Spectrum-X 端到端,虽收入比Q降,但需求O断增长2 表表 3333英英_达数达数据据中心V中心V季季度度营收营收情情况况百百万美万美元,元,%资料来源Choice 英_达-深度资料-营业构p,东方富证券研究所 2.2.3 3.C.CSPSP 厂厂商自商自研研 A AI I 芯芯ww势势,供,供链链极扩极扩产产需求需求 2.3.1.自研 AI 芯w性能表O差 伴随理侧需求的增伴随理侧需求的增,各各家家C CSPSP厂厂_在_在自自研产品和比例的升2研产品和比例的升2谷歌很就开始投入 AI 芯w的研发,w的张
79、量处理单元TPU是_门机器学定制的芯w2TPU 在理方面表色,通过W硬架构和指,能够高效地处理神经网模型的理任2 微自 2019 来一直在 Athena 芯w研发目,目v微 CEO 萨蒂纳德拉Satya Nadella牵头,_大语言模型的和理而计2Athena 目前lv一小群微和 OpenAI 员行测试,初芯w能基于电 5nm 艺2 马的 AWS 了 Trainium 和 Inferentia 芯w,w中 Inferentia 芯w要用于 AI 理任2 在2024 re:Invent大会P,AWSaTrainium2l式用,w性能比第一产品升 4 倍,在极短的时间内基础模型和大语言模型2Trn
80、2 每个芯w大概 500w,仅需要风冷散热,单芯w的 BF16 浮算力 650TFLOPS,大 H100 的 60%,内 96GB HBM3e,内带宽43%80%167%162%97%79%35%55%71%83%61%31%11%14%171%279%409%427%154%112%0%50%100%150%200%250%300%350%400%450%05000100001500020000250003000035000数据中心营收百万美金 YOY 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 26 Table_yemei 电子设备业深度研究电子设备业深度研
81、究 和 H100 持2 表表 3434TrnTrn2 2 芯wP芯wP N NV VI ID DI IA A 和和 GoogleGoogle 的的产品产品比性能比性能PP比比 资料来源CDCC _,Semianalysis 研究机构,东方富证券研究所 Meta 计划第一自研 AI 芯w MTIA,该芯w采用电 7nm 艺量产,行频率 800MHz,TDP 仅 25w,INT8 整数算能力 102.4TOPS,FP16 浮算能力 51.2TFLops2 2.3.2.合作厂商 AI 营收高增,厂商指引长期 AISC s比 50%博通首执行官 Hock Tan 在 2024 9 o表示,的超大规模户
82、继续扩大w AI 群,基于m博通P调了 2024 AI 收入预期 120 亿美元,m前预期 110 亿美元2预计 2024 结时,AI 支热潮带来的 AI 相s营收规模将sw半导体业营收的 35%,高于m前预测的 25%2博通开发了 3.5D XDSiP=的技术,在一个封装备中p超过 6000 方毫米的硅w和多达 12 个高带宽内堆p,Pl面背方法相比,该技术在密度和率效率方面p显著改,能实大规模 AI 的高效1P耗计算,预计将于 2026 2 o开始生产2据道,OpenAI l在P博通合作开发一款型人智能芯w,_门用于 AI 模型的理过程,方在P电行磋商,计划 2026 v电m款芯w2 表表
83、 3535博博通通 X XPUPU 丰富丰富的的 I IP P a局a局 表表 3636博博通通定制定制芯芯w度w度 资料来源博通官网,东方富证券研究所 资料来源博通官网,东方富证券研究所 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 27 Table_yemei 电子设备业深度研究电子设备业深度研究 在最一季度的业绩说明会P,博通预计 20202727 场定制款场定制款 AIAI 芯w芯wASICASIC 的需求规模的需求规模 600600 亿亿 900900 亿美元亿美元2而,在 AI 芯w方面,博通pn家额外的超户,预计户将在 2027 之前带来收入2长期来
84、说,博通的CEO Hock Tan 预言 o来o来 50%50%的的 AI AI FlFlopsops算力算力都都会是会是 ASICASIC,甚甚 CSPCSP超超大规模计算产商大规模计算产商内部内部自用自用 100%100%都将是都将是 ASICASIC=2 Marvell 2024 第O季度数据中心产品中的 AI 定制芯w销售额比翻倍达到 11 亿美元,s总收入的比例达 73%,数据中心业收入创高,该业p收入的要献者2马供定制 AI 芯w,如 Trainium 芯w量产,Inferentia 芯w预计 2025 开始生产2谷歌供 Axion 芯w等产品,Axion 芯w量产2P微合作的 M
85、aia-2 芯w预计到 2025 开始交付2预计到 2026 AI 芯w业销售额将达到 25 亿美元,并计划到 2028 能够获得数据中心芯w场 25%的份额,将带来超过 400 亿美元的收入2 表表 3737marvellmarvell 数数据据中心中心业业长期长期规规划划 表表 3838marvellmarvell 20242024 3 3 季度季度数数据中据中心心业业情情况况 资料来源marvell 官网,东方富证券研究所 资料来源marvell 官网,东方富证券研究所 2.3.3.AISC 供链中 PCB 需求升,配套厂商极扩产 AIAISCSC 心的心的 A AI I 服器服器会升会
86、升 P PCBCB 的值量的值量 AI 服器是采用_构形式的服器,在_构方式P据用的范围采用O的合方式,如 CPU+GPU1CPU+TPU1CPU+w他的t等2据 Prismark 预p,2023 全球服器储用PCB场规模82亿美元,到2028p望增长138亿美元,复合增长率高达 11%,po来 PCB 用领域中p长能最的板块2在技术层面,人智能服器采用的 PCB 技术一般包含 20 28 层的多层架构,超过统服器 12-16 层的 PCB 2AI 服器所使用的 PCB 难度显著高于常规服器,单机值量大幅升,行业带来的增长,而带整个行业的技术n2 表表 393920232023-2028202
87、8 全球全球多多层层 PCBPCB 产产值值均均复复合增长合增长率率预预测测用领用领域域 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 28 Table_yemei 电子设备业深度研究电子设备业深度研究 资料来源PCBworld _,Prismark 研究机构,东方富证券研究所 内领Y的内领Y的 P PCBCB 厂商_在厂商_在扩U相产能扩U相产能满足满足户需求户需求生益电子表示,紧抓 AI1高性能计算机等领域相s产品研发,目前经p开发了包括马在内的多家服器户,AI 配套的板t目均经入量产段2在 12 o告,投资 14 亿元人民_用于智能算力中心高多层高密电路板,
88、计划产 25 万方米的高多层高密印制线路板,w中第一期计划产 15 万方米,第期计划产 10 万方米,满足t领域高端印制电路板的中长期需求2沪电股份 2024 前O季度购买固定资产1无形资产和w他长期资产支付的金达到 13.1 亿元,相较于 2023 前O季度比升 149%,显示扩产的极性2时,告投资 43 亿元,用于人智能芯w配套高端印制电路板扩产目,计划产 29 万方米人智能芯w配套高端印制电路板2w中第一段计划产 18 万方米高层高密度层板第段计划产 11 万方米高层高密度层板2q目全部实施完p,预p增营业收入 48 亿元人民_2w中第一段实施完p,预p增营业收入 30 亿元人民_,扣除
89、总pq用和销售税金的利润总额 5.58 亿元人民_考虑所得税,税率 15%计算,净利润 4.7 亿元人民_第段实施完p,预p增营业收入 18 亿元人民_,扣除总pq用和销售税金的利润总额 3.35 亿元人民_考虑所得税,税率 15%计算,净利润 2.85 亿元人民_2 3.3.摩摩尔定尔定律律缓和缓和易摩易摩擦擦剧,剧,产产芯w芯w 3 3.1.1.摩尔摩尔定律定律缓制缓制单t单t性能,性能,YY封装封装要性要性增增 3.1.1.COWOS 封装升 AI 芯w性能 Y封装突破摩尔定Y封装突破摩尔定律,律,COWOS 内墙挑战内墙挑战2随着摩尔定律渐失效,封装在升芯w能效的作用愈发要2在过去的十
90、,CPU 和 GPU 的计算能力增了 60,000 倍,但 DRAM 内带宽和带宽t仅增了 100 倍和30 倍2 v于硬计算效率P内带宽率差距来大,vm形p 内墙=,拖累计算效率2解决内墙象,开发者通过Y封装的方式拉计算单元P内的距离,m升通信效率2 目前英_达择采用 COWOS 技术,将 GPU 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 29 Table_yemei 电子设备业深度研究电子设备业深度研究 P高带宽内HBMp,p效的缩短了计算中心P内之间的距离,升通效率2在大模型需求O断升的背景Q,Y封装场需求在O断增2据研究机构 DIGITIMES Res
91、earch 表示,端 AI 器需求旺盛,2025 全球 CoWoS 类似封装产能的需求或将增长 113%2 表表 4040硬硬算力算力峰峰值P内值P内带带宽宽 资料来源Yole 研究机构,东方富证券研究所 COWOS 产能产能紧缺p紧缺p限限制制 AI 芯w产芯w产量量的s键因素的s键因素22COWOS 艺VCOWOS-R1COWOS-S1COWOS-L O种方案2他们之间的要别在于中层方案差_2w中,COWOS-R 采用Va层RDL构中层,实 SoC P HBM的,实_构p2COWOS-S 择硅wU中层2在 COWOS-L 中,使用中层和q地硅 LSI 芯w行晶粒间,并使用 RDL 层行电源
92、和信输2英_达在 H 系列所采用的 COWOS-S 封装方案,在的GB200 芯w,英_达采用 COWOS-L 的封装方式2艺难度来看,COWOS 作 2.5D 封装技术的一种,要将多个p源芯wp在硅中层P2 w心艺流程到中层的晶圆等前道序,因m该技术要v晶圆厂掌握2目前电拥p全球大部V的 COWOS 产能,在 AI 芯w需求旺盛的背景Q,COWOS 产能的紧缺是限制 AI 芯w产量的要瓶颈2 表表 4141COWOSCOWOS-S S 的的封封装结装结构构 表表 4242COWOSCOWOS-L L 的的封封装结装结构构 资料来源电官网,东方富证券研究所 资料来源电官网,东方富证券研究所 C
93、OWOS按照艺流程VCOWPOS2 w中COW指的是Chip on Wafer,指的是将芯wP中层通过 uBump 行接,并通过部填U2OS 流程中是将 COW 中制备完p晶圆P载板相接2 表表 4343COWOSCOWOS 的的艺流程艺流程 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 30 Table_yemei 电子设备业深度研究电子设备业深度研究 资料来源 J.Lau 等:Redistribution layers(RDLs)for 2.5D/3D IC integration;International Journal of Microcircuits&
94、Electronic Packaging,2014,东方富证券研究所 3.1.2.Y封装产难度小于前道,心备材料亟待突破 Y封装要性凸显Y封装要性凸显,q,q极研发Y极研发Y封装封装艺艺据微网道,电自 11 o 11,中断U中大户供采用 7 纳米更Y艺制程的 AI 芯w2面复g的海外境,q封测极拓展Y封装艺研发2通富微电面U高端处理器等产品领域持续投入,持续发力服器场大尺高算力产品,5nm14nm13nm 品研发2长电技的 XDFOI Chiplet 高密度多维_构p系列艺按计划入稳定量产段2 COWOS1HBM 表的Y封装,是 AI 芯w制节中心值增量部V2 Y封装制过程中,要较多用到了 T
95、SV1Bumping1减薄1键合1RDL等艺,增量序_P游备材料节带来了的增长机会2前内技术均处于期段,无论是制1封测节是P游备材料节均处于O断突破过程中2 表表 4444YY封装封装要序要序备备节节厂厂商梳商梳理理 要艺要艺 心序心序 备备 全球要厂商全球要厂商 大厂商大厂商 TSV 深硅蚀 蚀备 AMAT1Lam1TEL X方_创1中微 电镀沉铜 电镀备 AMAT1Lam Research1Ebara1ASMP 盛美P海 CMP 抛Z CMP 备 AMAT1Ebara _海清 测试 CP 测试 FT 测试 探针 TEL1东精密1惠特技1旺矽技 矽电股份1长技 测试机 Advantest1T
96、eradyne 长技1_峰测1精智达1精测电子 V机 Cohu1Advantest1Epson 长技1金海通 Bumping PVD PVD 备 AMAT1Evatec X方_创 曝Z Z备 ASML1Nikon1Canon1Orbotech P海微电子1芯碁微装 研磨减薄 研磨减薄备 DISCO1东精密 _海清1中电1Z力技等 W割划w 划w机 DISCO1东精密 Z力技1大族激Z等 临时键合解键合 临时键合机 EV Group 芯源微等 堆叠键合 TC-NCF/TC Bonder HANMI1Besi 等 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 31 T
97、able_yemei 电子设备业深度研究电子设备业深度研究 MR-MUF 混合键合 混合键合机 EV Group1Besi1SUSS 拓荆技等 塑封 塑封备 TOWA1ASMPT 文一技1耐装备 资料来源各官网告,东方富证券研究所 注部V艺所用序p合,如 TSV1RDL1Bumping 中均用到曝Z1蚀1电镀等,仅列示一次,O复列示2 表表 4545YY封装封装要序要序材料材料节节厂厂商梳商梳理理 材料材料 全球要厂商全球要厂商 大厂商大厂商 封装基板 欣t1Ibiden1O电机等 t森技1深南电路等 塑封料 Q电木1立Wp1Namics 等 _海诚1衡所_威等 Z材料 TOK1JSR1杜邦1
98、信1东等 艾森股份1鼎龙股份1力材等 电镀液 杜邦1石原等 艾森股份1P海1力材1安技等 前驱体 默克1法液空1SK 等 克技等 半导体胶带 Nitto1OW学1LINTEC1Denka 等 德邦技 固晶1粘结材料 Henkel1立Wp 德邦技1_海诚等 部填U胶 Namics1Henkel1立Wp等 _海诚1德邦技1鼎龙股份等 抛Z材料 杜邦1Cabot 等 安技1鼎龙股份等 靶材 矿1东曹等 江丰电子等 资料来源各官网告,东方富证券研究所 3.3.2 2.易易摩擦态摩擦态势剧势剧,A AI I 芯w芯w产产W经W经形p形pr识r识 3.2.1.23 芯w法案升 AI 芯w限制施 芯w法案升
99、限制多芯w法案升限制多款高款高性能算力芯w_销性能算力芯w_销售售22023 10 o 17,登府更了针人智能AI芯w的口管制规定,计划阻k英_达等U中口Y的 AI 芯w2据最的规则,英_达包括 A800 和 H800 在内的芯w_口都将禁2 要增O内容 w一,把性能密度作口管制o准2禁k中售行度超过300teraflopss每计算 300 万亿次算的数据中心芯w2行度在150-300teraflops 的芯w,如果性能密度超过每方毫米 370 gigaflops十亿次计算,_会被禁k销售2 w,Y芯w口许范围扩大到 40 多个家2w目的是,kYAI 芯ww他家辗转入中2 wO,21 个家了芯
100、w制备的许要求,并扩大了禁k入家的备清单2 m在限制中的 14 纳米QY芯w的制能力2 表表 4646流流 A AI I 芯w芯w相相s参s参数数情情况况 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 32 Table_yemei 电子设备业深度研究电子设备业深度研究 资料来源Semianalysis 研究机构,东方富证券研究所 3.2.2.24 芯w法案增 HBM 芯w限制施 期,美增期,美增 H HBMBMHigh Bandwidth Memory,企一n限制内,企一n限制内 A AI I芯w的发展2芯w的发展22024 12 o 2,据美商部业P安全局BIS
101、发a的文,q次规 BIS 继续大人智能产业特别要的 HBM 芯w实施的限制施,包括将高性能 HBM 芯w如 HBM3 更Y类型纳入管范围1置性能阈值例如,如果内带宽密度超过 2GB/方毫米,则将触发许要求 2管 HBM 到o格管,但在某情况Q然在例外,如果 HBM P逻辑芯wr封装,逻辑芯w的要能是计算而非储,则 HBM 能O单独到口限制2某r封装p电路_被排除在 3A090.c 的制范围之外,外,规_特定符合许例外的场景时允许wl常口,包括要求最用户和最母O得O于中澳门 1内带宽密度要小于每每方毫米3.3GB,时担心通过V销商转移等因素要求必v一封装计商行采购,s确保时必知道封装计商等2 H
102、BM s高带宽储,一款型的 CPU/GPU 内芯w2HBM 属于形 DDR 内的一种,xp高带宽1高容量1P延时PP耗等势2 它将多个 DDR 芯w堆叠在一,每层 Die 通过 TSV 穿硅通孔技术实P逻辑 Die 接,P GPU 封装合p,通过增带宽1扩展内容量p DDR 合列,实小尺P高带宽1高输度的兼容,而减少内和储解决方案所带来的延2在 AI 大模型理过程中,HBM 快数据处理度,因m更适用于 ChatGPT 等高性能计算场景2 表表 4747HBMHBM 和和 GDDRGDDR5 5 的性的性能能比比 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 33
103、Table_yemei 电子设备业深度研究电子设备业深度研究 资料来源 半导体产业纵横_,东方富证券研究所 目目前前流流 AIAI 芯芯ww都都使使用用 HBMHBM,一,一 GPUGPU 配配多多 H HBMBM22XpeaGPU 露,B100 GPU 的n个计算芯w将接到8个8-Hi HBM3e显堆p,总容量192GB2AMD 经供了 192GB 的相容量,并在w Instinct MI300 GPU P搭载了 8 个HBM3 芯w2 表表 4848英英_达各达各 GPUGPU 的的 HBMHBM 用量情况用量情况 资料来源 英_达开信o,Trendforce 研究机构,东方富证券研究所
104、3.2.3.家和地方策码扶持产芯w 前,前,家和地方都在家和地方都在极制定策1极制定策1大投入,大投入,z激和引导算力产业z激和引导算力产业发发展展22023 10 o 8,业和信oW部等部门发a:算力基础施高量发展行计划;12 o 23,家发展改革委1家数据局发a:数_经o促r富裕实施方案;,调要快全一体W算力网建,弥合域数_鸿沟=12 o 25,家发展改革委等部门发a:s于深入实施东数西算=程 快构建全一体W算力网的实施意;2要,将一nq算力产业高量发展,经o高量发展供要支撑2多地_了针性策2例如,四省发改委印发:四省算力基础施高量发展行方案(20242027);,到 2027,算力总规模
105、达到 40eflops,w中智能算力s比OP于 60%,大规模智能计算中心达到 15 个 2河南省人民府发a:河南省算力基础施发展规划(20242026);,计划到 2026,算力规模超过 120eflops,智算1超算等高性能算力s比超过 90%,形p 10 个P算力规模达到 e 的大型算力中心2 内前内前A AI I芯w采购芯w采购英英_达_达,产W得到产W得到明确明确策扶持策扶持2 据 IDC 数据,2022 中 AI t量 109 万张,w中英_达在中 AI 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 34 Table_yemei 电子设备业深度研究电子
106、设备业深度研究 t场份额 85%,_s率 10%,百度s率 2%,寒o纪和燧原技均 1%2:生p式人智能服管理暂行法;鼓生p式人智能算法1框架1芯w配套等基础技术的自创,鼓采用安全信的芯w11x1算力和数据资源2地方层面,X经开于服企业采购产算力芯w企业相s产品,并在经开算力调度P架外供服的,给购买合中的实采购产智算芯w服器部V金额最高 10%的补,每个目累计O超过 1000 万元2 表表 49492 2022022 中中 AIAI tt竞竞格格局局 资料来源IDC 数据,东方富证券研究所 3 3.3.3.产产芯w芯w性能性能n追n追英英_达,_达,理理时时能性能性升升 3.3.1.产芯w算力
107、性能x备o A800 能力 口禁带产销口禁带产销售增售增,内算力x备,内算力x备oo A A800800 的能力的能力22023,中芯w的场规模达到 140 万张2技术角度来看,GPU ts据 85%的场份额品牌角度来看,中q土人智能芯w品牌的量超过 20万张,s整个场份额的 14%2用于理的人智能芯ws据了 67%的场份额2内算力t在迭,g腾 910 例,基于自研_达芬奇架构 3D Cube 技术,半精度FP16算力达到 320TFlops,整数精度INT8算力达到 640Tops,而英_达 A100 的 FP16 tensor core 峰值性能 312TF/624TF,INT8 tens
108、or core 峰值性能 624Tops/1248Tops2因m,半精度和整数精度的算力数据来看,g腾 910 的 FP16 算力略高于英_达 A100,而 INT8 算力则是英_达 A100 的n倍,在算力一s键指oP,g腾 910 表了较的竞力2 表表 5050内内外外要要算力芯算力芯ww参参数数比比 品牌品牌 NVIDIANVIDIA NVIDIANVIDIA NVIDIANVIDIA 寒寒o纪o纪 _海思海思 海海Z信oZ信o ff仑芯仑芯 英_达,85%_,10%f仑芯,2%寒o纪,1%燧原技,1%w他,1%20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明
109、35 Table_yemei 电子设备业深度研究电子设备业深度研究 处理器 A100 PCIe A800 80GB PCIe H20 SXM 思元 370-X8 g腾 910B 深算一 逻辑心数 6912CUDA cores 6912CUDA cores 9338CUDA cores 多 性多 4096 64 CUs)-微架构 Ampere Ampere Hopper MLUarch03 达芬奇-XPU-R 算力 19.5 TFLOPS 19.5 TFLOPS 44 TFLOPS 96TFLOPS 256 TFLOPS-128 TFLOPS FP32 FP32 FP32 FP16 FP16-F
110、P16 内大小 40/80GB 80GB 96GB 48GB 32GB 32GB 32GB HBM 类型 HBM2 HBM2E HBM3 LPDDR5 HBM2/2E HBM2 GDDR6 内带宽 2039GB/S 2TB/S 4.0TB/S 614.4 GB/s 2TB/S 2014GB/S 512GB/S TDP 400W 250W 400W 250W 310W 350W 120W 艺节 7nm 7nm 5nm 7nm 7nm 7nm 7nm 联技术 NVLink Gen 3:600GB/s,PCIe 4.0 x16 NVLink Gen 3:400GB/s,PCIe 4.0 x16 NV
111、Link Gen 4:900GB/s,PCIe 5.0 x16 MLU-Link 200 GB/S;PCIe 4.0 x16 HCCS 392 GB/sPCIe 5.0 x16 PCIe 4.0 x16 PCIe 4.0 x16 资料来源_官网1英_达官网1寒o纪官网1海Z股说明书1网开信o,东方富证券研究所 3.3.2.g腾打全产业解决方案,全面o英_达 g腾计算产业是基于g腾系列HUAWEI Ascend处理器和基础构建的全p AI 计算基础施1 行业用服,包括g腾系列处理器1 系列硬1CANNCompute Architecture for Neural Networks,_构计算架构
112、1AI 计算框架1 用使能1 开发x链1 管理维x1 行业用服等全产业链2 表表 5151gg腾腾计算计算产产业生态业生态 资料来源_官网,东方富证券研究所 g腾芯w基于自研的达芬奇架构研发而p,xp高性能1P耗的特2g腾的 AI 算力备丰富,涵盖了智能边缘硬1中心理硬1中心硬 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 36 Table_yemei 电子设备业深度研究电子设备业深度研究 1开发者套等多个产品形态,n芯w覆盖四大用场景,能够满足O户在O场景Q的算力需求,w场拓展供了p力支撑2 表表 5252 CANNCANN 架构架构 表表 5353 g腾g腾服
113、服 资料来源_官网,东方富证券研究所 资料来源_官网,东方富证券研究所 g腾了类似 CUDA 的 AI 框架和生态,g思 MindSpore 是一种适用于端边场景的型开源深度学/理框架2 MindSpore 供了好的计和高效的执行,在升数据学家和算法程师的开发体验,并Ascend AI 处理器供原生支持,硬W2 表表 5454gg思思 MindMindSporeSpore 框架框架 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 37 Table_yemei 电子设备业深度研究电子设备业深度研究 资料来源_官网,东方富证券研究所 g腾 AI 产品包含和理产品,形态多
114、,满足户各种需求2 表表 5555gg腾腾计算计算产产品系列品系列 产产品系列品系列 产产品型品型 Atlas A2 系列产品 Atlas 800T A2 服器1Atlas 900 A2 PoD 群基础单元1Atlas 200T A2 Box16 _构子框 Atlas 系列产品 Atlas 800 服器型90001Atlas 800 服器型90101Atlas 900 PoD型90001Atlas 900T PoD Lite1Atlas 300T t型 90001Atlas 300T Pro t型9000 Atlas 800I A2 理产品 Atlas 800I A2 理服器 Atlas 理系
115、列产品 tAtlas 300I Pro 理t1Atlas 300V 视频解析t1Atlas 300V Pro 视频解析t1Atlas 300I Duo 理t 模块Atlas 200I SoC A1 心板 边缘服器Atlas 500 Pro 智能边缘服器支持插入 Atlas 300I Pro 理t1Atlas 300V 视频解析t1Atlas 300V Pro 视频解析t使用 中心理服器Atlas 800 理服器型3000或 Atlas 800 理服器型3010支持插入 Atlas 300I Pro 理t1Atlas 300V 视频解析t1Atlas 300V Pro 视频解析t1Atlas 3
116、00I Duo 理t使用 Atlas 200I/500 A2 理产品 Atlas 500 A2 智能小站1Atlas 200I DK A2 开发者套1Atlas 200I A2 模块 Atlas 200/300/500 理产品 Atlas 200 AI 模块1Atlas 300I 理t型30001Atlas 300I 理t型3010Atlas 500 智能小站1Atlas 200 DK 开发者套 资料来源_官网,东方富证券研究所 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 38 Table_yemei 电子设备业深度研究电子设备业深度研究 群方面,_全联接大会
117、2023 P,_常董1ICT 基础施业管理委员会任1 企业BG总裁汪涛l式发a了全架构的g腾AI计算群Atlas 900 SuperCluster,支持超万亿参数的大模型2群采用了全的_河 AI 智算交换机 CloudEngine XH16800,借w高密的 800GE 端口能力,n层交换网s实 2250 节相于 1.8 万张t超大规模无收敛群网2群时使用了创的超节架构,供高达 200PFLOPSFP16 的算力,大大升了大模型能力2m外,发挥_在计算1网1储1能源等领域的综合势,器1节1群和业全面升系统靠性,将大模型稳定性y升到o2 表表 5656 Atlas 900 SupeAtlas 9
118、00 SuperClusterrCluster 群群 资料来源 _官网,东方富证券研究所 3.3.2.寒o纪AI 芯wY行者,聚焦端算力,拐将 寒o纪p立于 2016,_注于人智能芯w产品的研发P技术创,供边端一体1硬1理融合1x备统一生态的系列W智能芯w产品和W基础系统2产品1边1端=,全链路直a局2但是在经了多场开拓和易制裁,n聚焦端产品2 表表 5757寒寒oo纪产纪产品品谱系谱系 资料来源寒o纪官网,东方富证券研究所 寒o纪的 MLU 硬是面U AI 用的领域_用处理器,针 AI 算法的 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 39 Table_ye
119、mei 电子设备业深度研究电子设备业深度研究 计算特性和特性,计了高效的指1流水线1算部和部2P通用处理器相比,MLU 硬在处理 AI 任时p更高的性能1灵活性和能效比2MLU 硬针 AI 中O特的数据流计_用的数据通路和算部,实了O的数据流之间的隔离时U暴露了灵活的wP储空间问能,高了处理效率2最一 MLUarch03 架构采用一张量算单元,内置 Supercharger 模块大幅升各类卷效率采用全的多算子硬融合技术,在融合的基础P大幅减少算子执行时间wP通带宽是P一 MLUarch02 的 2 倍1wPr缓容量最高是 MLUarch02 的 2.75 倍全 MLUv03 指,更完备,更高效
120、U前兼容2 表表 5858M MLULU 架架构构情况情况 资料来源电子程,IT 之家,东方富证券研究所 寒o纪p自的一套o英_达的p,o CUDA C 的编程语言 BANG C,o CuDNN CuBLAS 的算子 CNNL,o NCCL 的通信 CNCL,o TensorRT 的理引擎 MagicMind,o cuda-gdb 的调试器 cngdb 等等2 表表 5959寒寒oo纪基纪基础础系系统统 资料来源寒o纪官网,东方富证券研究所 2023 是人智能大模型大爆发的一2寒o纪持续行大模型的W和适配作,Y开发了 BangTransformer 大模型Va式理引擎,20172017 敬敬请
121、阅读本请阅读本报告k报告k文后各文后各项声明项声明 40 Table_yemei 电子设备业深度研究电子设备业深度研究 CNDeepspeed/Megatron-LM 大模型Va式引擎,大模型理P性能预px1V析x精度V析x等大模型相sp,时基于思元370 等系列产品,P LLaMa 系列1BLOOM 系列1GLM 系列1Stable Diffusion1T5,内的百1千象等大模型行了广泛的适配和验证,性能_,并支持自然语言处理1视1多模态等多种场景的大模型用2 2024 第O季度营业收入 1.21 亿元,比增长 284.59%,显示业的快扩张态势,要得益于持续的场拓展力,通过W产品a局1升服
122、量等方式,吸引了更多户2截O季度p,达到 10.15 亿元,较P半p暴增 331.18%,创高,意味着o来场需求p较好预期,l在极备料生产,续业增长做准备2预付款达 8.54 亿元,较P半p增长 54%,创高,表明UP游供商单,产业链的掌力和资源调配能力较,_体了wo来业发展信心2 表表 6060寒寒oo纪纪/预付款预付款季季度度情况情况万元万元 资料来源Choice-深度资料-资产负债表,东方富证券研究所 4 4.投投资建资建 荐 AI 需求升过程中算力芯ww配套产业链机会,要包括芯w020040060080010001200(万元)预付款(万元)20172017 敬敬请阅读本请阅读本报告k
123、报告k文后各文后各项声明项声明 41 Table_yemei 电子设备业深度研究电子设备业深度研究 产W1理芯w1自研 ASIC 芯w1Y封装等V方U,建s注寒o纪1海Z信o1_丰技1生益电子1沪电股份1通富微电1拓荆技1芯源微1V易创等o的2 表表 6161要要s注s注oo的p值的p值比比较较表表截截 2022025 5 1 1 oo 1313 码码 AIAI 相s业相s业 值值 亿元亿元 EPSEPS元元/股股 PEPE倍倍 股股元元 评评 2023A2023A 2024E2024E 2025E2025E 2023A2023A 2024E2024E 2025E2025E 688256.SH
124、 寒o纪-U AI 芯w 3001.51-2.07-1.18-0.07/719.00 o评 688041.SH 海Z信o AI 芯w 3333.10 0.54 0.81 1.15 265.56 176.23 124.55 143.40 o评 688629.SH _丰技 高背板接器 169.88 0.17 0.20 0.46 216.76 180.11 79.61 36.85 o评 688183.SH 生益电子 PCB 319.75-0.03 0.36 0.82/106.60 46.61 38.44 o评 002463.SZ 沪电股份 PCB 779.34 0.79 1.37 1.90 51.1
125、5 29.66 21.38 40.63 增持 002156.SZ 通富微电 Y封装 412.63 0.11 0.57 0.81 247.18 47.71 33.54 27.19 o评 688072.SH 拓荆技 Y封装备 401.45 3.54 2.48 3.74 40.75 58.08 38.59 144.24 o评 688037.SH 芯源微 Y封装备 157.22 1.82 1.20 1.87 42.98 64.96 41.90 78.23 o评 603986.SH V易创 储 DRAM 782.67 0.24 1.71 2.52 491.04 68.99 46.70 117.85 o评
126、 资料来源Choice-股票数据p器,东方富证券研究所o评预测数据来自 Choice 一预期 5 5.风风险险示示 AI 发展O预期2产业处于发展初期,要依赖大型技企业和家投资,行业发展度缓会大幅影响产业链需求和度2 技术n缓2产业依赖于技术n的度,缓会影响pqQ降曲线和产品商业W能力,而导行业整体需求Q滑2 中美摩擦剧2美多次限制中 AI 相s芯ww产业链口,限制中企业海外,摩擦和限制一n剧会影响相s行业需求和供给2 20172017 敬敬请阅读本请阅读本报告k报告k文后各文后各项声明项声明 42 Table_yemei 电子设备业深度研究电子设备业深度研究 东方富证x股份p东方富证x股份p
127、限公限公以Q简称本公以Q简称本公=xp中国证监会核准xp中国证监会核准的证的证x投资咨询业资格x投资咨询业资格 分析师申明分析师申明 作者xp中国证x业作者xp中国证x业会会授予的证x投资咨询授予的证x投资咨询执业执业资格或相的_业胜资格或相的_业胜任能任能力,力,保证报告所采用的数保证报告所采用的数据均来据均来自合规自合规渠道,渠道,分析逻辑基分析逻辑基于作者的职业理解,于作者的职业理解,本报本报告清晰准确地映了告清晰准确地映了作者作者的研究点,的研究点,力求独立1力求独立1客和客和公k,结论O任何公k,结论O任何第O第O方的授意或影响,特方的授意或影响,特l声l声明2明2 投资建议的评级标
128、准投资建议的评级标准 报告中投资建议所涉报告中投资建议所涉及的及的评级分股票评级和评级分股票评级和业业评级评级另p说明的除外另p说明的除外 22评级标准报告发_评级标准报告发_日后日后3 3到到1212个o内的相对场表个o内的相对场表,也即以报告发_日也即以报告发_日后的后的3 3到到1212个o内的公股个o内的公股或业指数相对同或业指数相对同期相期相关证关证x场代表性指数的x场代表性指数的涨跌涨跌幅作基准2幅作基准2w中w中A A股股场以沪深场以沪深300300指数基准指数基准新O板场以O板r新O板场以O板r指指针对针对议转让标的议转让标的或O板做或O板做指数指数针对做转让标针对做转让标的的
129、基准基准香香港场以港场以恒生指数基准恒生指数基准美国美国场以标场以标普普500500指数基准2指数基准2 股票评级股票评级 买入相对同期相关买入相对同期相关证x证x场代表性指数涨幅场代表性指数涨幅15%15%以以PP 增持相对同期相关增持相对同期相关证x证x场代表性指数涨幅场代表性指数涨幅介于介于5%5%15%15%之间之间 中性相对同期相关中性相对同期相关证x证x场代表性指数涨幅场代表性指数涨幅介于介于-5%5%5%5%之间之间 减持相对同期相关减持相对同期相关证x证x场代表性指数涨幅场代表性指数涨幅介于介于-15%15%-5%5%之间之间 卖出相对同期相关卖出相对同期相关证x证x场代表性指
130、数跌幅场代表性指数跌幅15%15%以以P2P2 业评级业评级 强于大相对同期强于大相对同期相关相关证x场代表性指数证x场代表性指数涨幅涨幅1 10%0%以P以P 中性相对同期相关中性相对同期相关证x证x场代表性指数涨幅场代表性指数涨幅介于介于-10%10%10%10%之间之间 弱于大相对同期弱于大相对同期相关相关证x场代表性指数证x场代表性指数跌幅跌幅1 10%0%以P2以P2 免声明免声明 本研究报告由东方本研究报告由东方富证富证x股份p限公v作x股份p限公v作及在中及在中_人人民民共共和和国国香港香港和澳和澳门门特特别别政政区区11湾湾省除省除外外发_2发_2 本研究报告仅供本公本研究报告
131、仅供本公的的客户使用2本公O客户使用2本公O会因会因接收人收到本报告而接收人收到本报告而视w视w本公的然客户本公的然客户22 本研究报告是基于本本研究报告是基于本公公认靠的目前已认靠的目前已公开公开的信息撰写,的信息撰写,本公力求本公力求但O保证该信息的准但O保证该信息的准确性确性和完整和完整性,性,客户也O应该认该客户也O应该认该信息是准确和完整的2信息是准确和完整的2同同时,时,本公O保证文中本公O保证文中点或陈述O会发生任点或陈述O会发生任何何更,更,在在O同时期,O同时期,本公发出本公发出P本报告所载资料1P本报告所载资料1意意及测O一致的报告2及测O一致的报告2本本公会适时更新s们公
132、会适时更新s们的研的研究,究,但但能会因某些规定而能会因某些规定而无法无法做到2做到2除了一些定除了一些定期出x期出x的报告之外,的报告之外,绝大绝大多数研多数研究报告是在分析师认究报告是在分析师认适适的时的时候O定期地发_2候O定期地发_2 在任何情况Q,在任何情况Q,本本报告中报告中的信息或所表述的意的信息或所表述的意并并O构r对任何人的投O构r对任何人的投资建资建议,议,也没p考虑到也没p考虑到个别客个别客户特殊户特殊的投资目标1的投资目标1状况或状况或需需求2求2客户应考虑客户应考虑本报告本报告中的任何意或建议中的任何意或建议是否是否符合w特定状况,符合w特定状况,若p必若p必要应寻要
133、应寻求_家意2求_家意2本报告所载本报告所载的资料1的资料1工x1工x1意及意及测只提供给客户作参测只提供给客户作参考之考之用,用,并非作或被视出并非作或被视出售或购售或购买证x或w他投资标买证x或w他投资标的的的的邀请或向人作出邀请邀请或向人作出邀请22 本报告中提及的投资本报告中提及的投资格格和值以及这些投资和值以及这些投资带来带来的收入能会波动的收入能会波动22过去过去的表并O代表未来的表并O代表未来的表的表,未未来的回报也无法保证来的回报也无法保证,投投资者能会损失本金资者能会损失本金22外外汇汇率波动p能对汇汇率波动p能对某些某些投资的值或格或投资的值或格或来自来自这一投这一投资的收
134、入产生O良影资的收入产生O良影响2响2 那些涉及期货1期权那些涉及期货1期权及w及w它生工x的交易,它生工x的交易,因w因w包括重大的场风险包括重大的场风险,因,因l并O适合所p投资l并O适合所p投资者2者2 在在任何情况Q,任何情况Q,本本公O公O对任何人因使用本报对任何人因使用本报告中告中的任何内容所引致的的任何内容所引致的任何任何损失负任何任,损失负任何任,投资者投资者需自需自承担风险2承担风险2 本报告要以电子x本报告要以电子x形式形式分发,分发,间或也会辅间或也会辅以印w以印w品形式分发,品形式分发,所p所p报告x报告x权均_本公所p权均_本公所p22未经未经本公本公事先书面授权,事先书面授权,任任何机构何机构或个人O得以任何形或个人O得以任何形式复式复v1v1转发或公开传转发或公开传播本报播本报告的全部或部分内容告的全部或部分内容,OO得将报得将报告内容作诉讼1仲告内容作诉讼1仲裁1裁1传媒所引用之证明或传媒所引用之证明或依据依据,O得用于营利或用,O得用于营利或用于未于未经允许的w它用途2经允许的w它用途2 如需引用1如需引用1刊发或刊发或转载本转载本报告,报告,需注明出处需注明出处东方东方富证x研究所,富证x研究所,O得O得对本报告进任何p对本报告进任何p悖原悖原意的引意的引用1删节和修改2用1删节和修改2