《电子行业COMPUTEX 2024跟踪报告:NV领衔大厂展示算力前景AI PC等端侧应用加速落地-240607(37页).pdf》由会员分享,可在线阅读,更多相关《电子行业COMPUTEX 2024跟踪报告:NV领衔大厂展示算力前景AI PC等端侧应用加速落地-240607(37页).pdf(37页珍藏版)》请在三个皮匠报告上搜索。
1、 敬请阅读末页的重要说明 证券研究报告|行业简评报告 2024 年 06 月 07 日 推荐推荐(维持)(维持)COMPUTEX 2024跟踪报告跟踪报告 TMT 及中小盘/电子 事件:事件:COMPUTEX 为全球最大的电脑和技术贸易展之一,吸引全球上千家厂商参会,近年来亦成为全球科技生态链聚集之处。COMPUTEX 2024 于 6 月 4 日至 7 日在中国台湾如期举办,以“AI 串联、共创未来”为主题。综合主题演讲和展会信息,我们整理了各大厂商对于前沿科技的最新动态和展望,我们认为本届大会 AI 赋能成主旋律,AI 算力、AI PC 等端侧应用为主要关注点。评论:评论:1、算力:各家大
2、厂均展出算力:各家大厂均展出GPU升级迭代图,数据中心液冷方案渗透率提升。升级迭代图,数据中心液冷方案渗透率提升。1)英伟达:)英伟达:Blackwell Ultra:B 系列下一代产品(2025 年推出,8 颗 HBM3e),配合 Spectrum Ultra X800 以太网交换机新品。下一代平台:Rubin 平台(2026年推出),包括 Rubin GPU(8 颗 HBM4)、Vera CPU、NVLink6 交换机芯片(3600GB/s)、CX9 SuperNIC(1.6Gb/s)、X1600 IB/以太网芯片,对应下一代 GPU 为 Rubin Ultra(12 颗 HBM4,202
3、7 年推出)。2)AMD:CPU,第四代EPYC比此前可减少80%的rack空间,降低65%的能源消耗。第五代EPYC Turin(3 纳米与 6 纳米)将于 24H2 推出;GPU,MI 325X 比 H200 具备更高存储与运算能力,与 MI 300X 使用相同架构,方便客户进行替换。单个带有 8颗 MI 325X 芯片的服务器可同时运行高达 1 万亿个参数,是 H200 的两倍。同时公司加入 UA Link 与 UEC,致力推动 AI 互连发展。3)英特尔英特尔:CPU,Xeon 6(144 核)比 Xeon 2(28 核)快 4.2 倍,3:1 的 rack consolidation
4、 ratio,同时今年公司将推出第二代Xeon 6(288 核),形成6:1 的rack consolidation ratio;GPU,Gaudi3 比 H100 性能更高,TCO 更低,time-to-train 比 H100 快 40%,Inference Throughout 快 15%,Inferencing 快 2.3 倍。4)Supermicro:DLC液冷解决方案可节省 OPEX 达 40%,5 年内节省 6000 万美金。公司目标将 DLC市场份额一年内提高到 15%,2 年内提高至 30%。目前每天的液冷机架出货量已经超过 50 个,总体机架出货每月 1000 多个,产能每
5、月 5000 个,同时马来西亚工厂将于 24Q4 上线。2、AI端:端:AI PC加速落地,关注加速落地,关注ARM架构或带来架构或带来PC处理器市场格局变化处理器市场格局变化。1)高通:)高通:搭载骁龙 X Elite/Plus 的设备支持 Copilot+PC 体验,采用 ARM 架构,相较于 X86 架构能效比更优,NPU 算力达 45 TOPS,NPU 每瓦特性能与酷睿Ultra 7 相比高 5.4 倍;首批超过 20 款搭载骁龙 X Elite/Plus 的 Copilot+PC 现已开启预售,6 月 18 日起可购买。2)ARM:分享了凭借 Kleidi AI 和 Arm CSS等
6、创新,预计到 2025 年 Arm 设备将超过 1000 亿台,公司目标是在五年内获得Windows PC 市场超过 50%的份额。3)联发科:)联发科:宣布加入 Arm 全面设计,新一代 Chromebook、智能电视和显示设备芯片亮相。4)AMD:搭载 Ryzen AI 300系列的 AI PC 将于 7 月上市,NPU 性能业内领先,达 50 TOPs。5)英特尔:)英特尔:公布 Lunar Lake 处理器架构细节,将于 24Q3 为 80 多种新型 AI PC 设计提供支持。6)英伟达:)英伟达:认为 AI 下一波浪潮是 Physical AI,重点阐述了机器人等相关应用。3、投资建
7、议:投资建议:关注关注AI算力算力、AI端侧端侧持续持续创新创新带来的投资机遇。带来的投资机遇。1)AI算力:算力:NV 超级算力产品不断赋力各领域应用,硬件领域建议关注英伟达英伟达及其产业链标的,关注服务器硬件层面所涉及到的 GPU、CPU、存储、高速连 行业规模行业规模 占比%股票家数(只)494 9.7 总市值(十亿元)6790.5 8.9 流通市值(十亿元)5621.7 8.2 行业指数行业指数%1m 6m 12m 绝对表现-2.9-21.1-22.7 相对表现-2.6-27.0-16.2 资料来源:公司数据、招商证券 相关相关报告报告 1、消费电子行业深度跟踪报告:一季报业绩边际改善
8、,关注 GPT-4o与苹果 AI 终端创新2024-05-20 2、半导体行业月度深度跟踪:一季报景气边际改善,关注复苏持续性和结构性机会2024-05-14 鄢凡鄢凡 S1090511060002 王恬王恬 S1090522090002 谌薇谌薇 研究助理 涂锟山涂锟山 研究助理 -40-30-20-10010Jun/23Sep/23Jan/24May/24(%)电子沪深300NV领衔大厂展示算力领衔大厂展示算力前景前景,AI PC等端侧等端侧应用应用加速落地加速落地 敬请阅读末页的重要说明 2 行业简评报告 接器和电光连接、PCB/IC 载板、散热、电源、各类辅助芯片等零部件和先进封装/H
9、BM 等的投资机会,建议关注 GB200 新平台以及未来 Rubin 系列下的高速电连接等新技术应用,关注在高速电连接领域深度布局的安费诺安费诺和立讯精密立讯精密等巨头及对应的产业链供应商。2)AI端:端:我们认为随着终端品牌、芯片、软件应用等产业链龙头在 AI 技术上的共同投入,PC/手机/机器人/XR/可穿戴/智能汽车/智能家居等终端有望迎来 AI创新浪潮,近期 AI 端侧创新加速落地,把握 AI 端侧持续创新带来的投资机遇。我们建议关注:1)苹果 AI 端侧硬件 AI 化升级提速,WWDC 24 或将展示苹果AI 相关布局,积极把握苹果链优质公司低位布局机会,继续首推立讯精密立讯精密,看
10、好高伟电子、比亚迪电子、水晶光电、鹏鼎高伟电子、比亚迪电子、水晶光电、鹏鼎控股、控股、东山东山精密精密、长盈精密、环旭、长盈精密、环旭电子电子等,并关注瑞声科技、瑞声科技、兆威机电兆威机电等;2)其他品牌端的 AI 大模型及应用布局,如小米集团、传音控股、小米集团、传音控股、联想集团联想集团(计算机组联合)、萤石网络、萤石网络、海康威海康威视、视、大华大华股份股份、漫步者、漫步者等;3)AI 驱动零部件创新,GPT-4o 视频交互能力有望驱动终端摄像头升级,关注光学链高伟电子、舜宇光学、韦尔高伟电子、舜宇光学、韦尔/格科格科/思特威思特威等,以及 SoC/晶圆代工/存储/声学/PCB/被动元件
11、/散热/电池/电磁屏蔽等环节。风险提示:风险提示:宏观经济波动加剧宏观经济波动加剧、行业景气度变化行业景气度变化、电子产业竞争加剧电子产业竞争加剧、地缘政地缘政治及汇率风险。治及汇率风险。(后附(后附COMPUTEX 2024主题演讲要点主题演讲要点)敬请阅读末页的重要说明 3 行业简评报告 正文正文目录目录 附录:COMPUTEX 2024 主题演讲要点.6 1、AI 算力:各家大厂均展出 GPU 升级迭代图,数据中心液冷方案渗透率提升.6(1)英伟达:展示 Blackwell 系列全套解决方案,展示未来 3 年数据中心 GPU 发展规划.6(2)AMD:24H2 将推出 CPU Turin
12、 与 GPU MI325X.14(3)英特尔:推出新处理器 Xeon 6,展示 Gaudi3 兼具价格与性能优势.19(4)Supermicro:服务器可搭载各家最新芯片产品,将推动服务器液冷系统市占迅速提升.21 2、AI 端:AI PC 加速落地,关注 ARM 架构或带来 PC 处理器市场格局变化.28(1)高通:展示骁龙 X 系列和 Copilot+PC 如何助力重塑 PC,6 月中可购买.28(2)ARM:25 年 Arm 设备将达 1000 多亿台,5 年内获得 Windows PC 市场超过 50%份额.30(3)联发科:加入 Arm 全面设计,新一代 Chromebook、智能电
13、视和显示设备芯片亮相.31(4)AMD:搭载 Ryzen AI 300 系列的 AI PC 将于 7 月上市,NPU 性能业内领先.33(5)英特尔:公布 Lunar Lake 处理器架构细节,将于 24Q3 为 80 多种新型 AI PC 设计提供支持.34(6)英伟达:AI 下一波浪潮是 Physical AI,关注机器人等热门应用领域.35 图表图表目录目录 图 1:Blackwell 平台.6 图 2:Grace CPU.7 图 3:Blackwell 能耗节省.8 图 4:DGX Blackwell 与 DGX Hopper.8 图 5:DGX Blackwell 实图.9 图 6:
14、MGX 系统实图.9 图 7:NVLink Switch 芯片.9 图 8:GPU 机柜实图.10 图 9:DGX GPU 实图.10 图 10:Spectrum X800.11 图 11:从 Blackwell 到数据中心的发展.11 图 12:从 Blackwell 到数据中心的发展.12 图 13:从 Blackwell 到数据中心的发展.12 图 14:从 Blackwell 到数据中心的发展.13 图 15:从 Blackwell 到数据中心的发展.13 图 16:Rubin 平台.14 图 17:公司产品发展.14 图 18:数据中心 EPYC 发展历程.15 图 19:最新 EP
15、YC 运行速度比较.15 敬请阅读末页的重要说明 4 行业简评报告 图 20:EPYC 数据中心数据比较.16 图 21:EPYC 端到端 AI 性能比较.16 图 22:第五代 EPYC 产品数据.16 图 23:第五代 EPYC 产品数据将于下半年推出.16 图 24:AMD GPU 产品 Roadmap.17 图 25:MI 325X 产品数据.17 图 26:MI 325X 与 H200 比较.17 图 27:MI 350 系列产品数据.18 图 28:MI 350 与 B200 比较.18 图 29:UA Link 合作伙伴.18 图 30:UEC 合作伙伴.18 图 31:AMD
16、产品组合.19 图 32:Xeon6(右)与 Xeon2(20 个,左)比较.19 图 33:Xeon6 服务器优势.19 图 34:Xeon+RAG.20 图 35:Gaudi2.20 图 36:AI for Enterprise.20 图 37:Gaudi3 与 H100 比较.21 图 38:Gaudi3 合作生态.21 图 39:Gaudi3 合作伙伴产品.21 图 40:DLC 与 Air-Cooled 比较.22 图 41:DLC 与 Air-Cooled 比较.22 图 42:过去 DLC 的缺陷.23 图 43:公司现今 DLC 优点.23 图 44:Supermicro 机架
17、展示.23 图 45:Supermicro 机架展示.23 图 46:Supermicro 产品展示.24 图 47:Supermicro 产品展示.24 图 48:Supermicro 产品展示.24 图 49:Supermicro 产品展示.25 图 50:Supermicro 256 GPUs 集群 9 Rack SU.25 图 51:Supermicro 256 GPUs 集群 5 Rack SU.25 图 52:SuperCloud Composer 软件.26 图 53:马来西亚工厂 24Q4 上线.26 图 54:Supermicro 边缘 AI 推理产品组合.27 图 55:S
18、upermicro DLC 份额规划.27 图 56:高通 X Elite 拥有出色的每瓦特性能.28 敬请阅读末页的重要说明 5 行业简评报告 图 57:高通 X Elite CPU 性能领先.28 图 58:高通骁龙 X 系列平台赋能的 Copilot+设备.29 图 59:高通合作伙伴引言.29 图 60:高通 AI Hub.30 图 61:高通 X Elite 可运行超过 1200 款游戏.30 图 62:ARM Kleidi AI 介绍.31 图 63:ARM CSS 介绍.31 图 64:Arm 预计到 25 年 Arm 设备将达 1000 多亿台.31 图 65:联发科加入 Ar
19、m 全面设计.32 图 66:联发科 AI 具备领先的加速器能力.32 图 67:联发科 838 Kompanio 838 产品展示.32 图 68:ARM 下一代“Zen 5”CPU.33 图 69:ARM 新的 NPU 性能领先.33 图 70:AMD AI PC 合作伙伴.34 图 71:英特尔 Lunar Lake 处理器亮点.35 敬请阅读末页的重要说明 6 行业简评报告 附录:附录:COMPUTEX 2024主题演讲主题演讲要点要点 1、AI算力:算力:各家大厂均展出各家大厂均展出GPU升级迭代图,数据中心升级迭代图,数据中心液冷方案渗透率提升液冷方案渗透率提升(1)英伟达)英伟达
20、:展示展示Blackwell系列全套解决方案,展示未来系列全套解决方案,展示未来3年数年数据中心据中心GPU发展规划发展规划 Blackwell平台:平台:Blackwell芯片每秒传输芯片每秒传输10TB,第五代第五代NV Link允许将多个允许将多个GPU连在一起连在一起且且具有高可靠性。具有高可靠性。Blackwell 拥有几项非常重要的技术,其中之一就是芯片的尺寸,公司采用了两个台积电能够生产出的最大的芯片,用世界上最先进的连接,每秒传输 10 TB,将两个芯片连接在一起,将这两个芯片连接在一起后,公司将其中两个芯片放在一个计算机节点上,该节点与 Grace CPU 相连。在训练中,G
21、race CPU 可用于多种用途,在推理和生成的情况下,它可以用来存储上下文记忆,这样人工智能就有了记忆,并能理解用户想进行的对话的上下文。公司的第二代transformer 引擎,允许公司根据计算层所需的精度和范围,动态适应较低的精度。公司拥有安全人工智能的第二代 GPU,这样就可以要求服务提供商保护用户的人工智能不被窃取、盗窃或篡改。公司的第五代 NV Link,允许将多个 GPU连接在一起,这也是公司第一代具有可靠性和可用性引擎的产品,这套“RAS system”允许测试每一个晶体管触发器、芯片上的内存、芯片外的内存,这样公司就能在现场确定某个芯片的平均无故障时间(MTBF)是否失效。在
22、一个系统中,拥有 10000 个 GPU 的超级计算机的故障间隔时间是可以测量的,而拥有10 万个 GPU 的超级计算机的故障间隔时间则以分钟为单位,因此,如果不提高超级计算机的可靠性,那么超级计算机要想长期运行并训练出一个可以持续数月的模型,实际上是不可能的。当然,可靠性会提高正常运行时间,而正常运行时间会直接影响成本。最后,解压缩引擎数据处理是公司必须做的最重要的事情之一,公司增加了数据压缩引擎和解压缩引擎,这样从存储中提取数据的速度就能比现在快 20 倍。图图1:Blackwell平台平台 资料来源:英伟达,招商证券 敬请阅读末页的重要说明 7 行业简评报告 这是世界上最复杂、最高性能的
23、计算机,这是 Grace CPU,是世界上最大的芯片,然后用每秒 10 TB 的链路把这两个连接在一起。图图2:Grace CPU 资料来源:英伟达,招商证券 Blackwell提高计算量同时降低成本。提高计算量同时降低成本。计算能力、运算能力、人工智能运算能力,每一代都在八年内增长了 1000 倍,摩尔定律在八年内的速度大概是 60 倍,而在过去的八年里,摩尔定律的发展速度要慢得多,即使摩尔定律在最好的时候也比不上 Blackwell 的能力,它的计算量是惊人的。只要公司提高计算量,成本就会降低,公司通过其计算能力训练一个 GPT4(2 万亿个参数、8 万亿个 tokens)的能耗下降了 3
24、50 倍,而 Pascal 则需要 1000 GWh,1000 GWh 意味着需要一个千兆瓦的数据中心,世界上还没有千兆瓦级的数据中心,但如果有一个千兆瓦级的数据中心,就需要一个月的时间,如果有 100 兆瓦的数据中心,则需要一年时间,这就是为什么这些大型语言模型 ChatGPT 在 8 年前无法实现的原因,公司在提高性能和能效的同时,不断降低能耗,提高效率。Blackwell算力平台:算力平台:现在,公司利用 Blackwell 节省能耗将过去 1000GWh 减到 3GWh,如果是 10000个 GPU,只需要 10 天左右,短短八年时间,进步之大令人难以置信,这是用于 inference
25、、token generation,公司的 token generation 性能有可能使每个令牌的能耗降低 45000 倍。Pascal 生成一个 token 需要 17000 焦耳,这有点像两个灯泡运行两天(200 瓦特的能量),运行两天才能产生一个 GPT4 token,生成一个单词大约需要三个 token,因此,Pascal 生成 GPT 4 并进行 ChatGPT 体验实际上是不可能的。但现在,生成每个 token 只需 0.4 焦耳,Blackwell 是一个巨大的飞跃,即便如此,它还不够大,公司必须建造更大的机器,制造它的方法叫做 DGX。敬请阅读末页的重要说明 8 行业简评报告
26、 图图3:Blackwell能耗节省能耗节省 资料来源:英伟达,招商证券 DGX Blackwell与与MGX:公司的 Blackwell 芯片被用于 DGX 系统,这是 DGX Blackwell,它是风冷的,内部有 8 个这样的 GPU,这个版本支持 X86,它将进入公司一直在出货的 Hoppers设备。不过,如果想使用液体冷却,公司有一个新系统,这个新系统基于这块电路板,公司称之为 MGX 模块化系统。MGX 系统,有两块黑色板,这个节点有四个 Blackwell 芯片,都是液冷的,其中72 个 GPU 通过新的 NVLink 连接在一起。这是 NVLink 交换机(第五代),这是世界上
27、最先进的交换机,它的数据传输率非常高,这些交换机将每一个Blackwells 都相互连接起来,这样就拥有了一个巨大的 72 GPU Blackwell。这一整个 GPU 有 72 个芯片,而上一代只有 8 个,因此,公司增加了九倍的带宽,增加了 45 倍的 AI flops,而功耗却只有 10 倍。图图4:DGX Blackwell与与DGX Hopper 资料来源:英伟达,招商证券 敬请阅读末页的重要说明 9 行业简评报告 图图5:DGX Blackwell实图实图 图图6:MGX系统实图系统实图 资料来源:英伟达,招商证券 资料来源:英伟达,招商证券 NVLink Chip:最神奇的是 N
28、VLink 芯片,它将所有这些不同的 GPU 连接在一起,因为大型语言模型非常庞大,一个 GPU 和一个节点都装不下,它需要整个机架的 GPU,就像这个新 DGX,它的大型语言模型有几十万亿个参数,大型 NVLink 交换机有500 亿个晶体管,72 个端口,每个端口 400GB,四个 Links,横截面带宽为每秒7.2TB,但其中重要的一点是,它在交换机内部集成了数学,这样就可以在芯片上进行还原,这在深度学习中非常重要。图图7:NVLink Switch芯片芯片 资料来源:英伟达,招商证券 这是一个 GPU,这是世界上最先进的 GPU 之一,但这是一个 gamer GPU。这是一个 DGX
29、GPU,GPU 的背面是 NVLink Spine,Spine 有 5000 根线,2 英里,它将两个 GPU 连接在一起,收发器让公司可以用铜线驱动整个长度。因此,NVLink交换机用铜线驱动Spine,可以在一个机架上节省20千瓦,这就是NVLink spine。敬请阅读末页的重要说明 10 行业简评报告 图图8:GPU机柜实图机柜实图 图图9:DGX GPU实图实图 资料来源:英伟达,招商证券 资料来源:英伟达,招商证券 IB与以太网:与以太网:即使是这个,对人工智能工厂来说也不够大。因此,公司必须用高速网络将其连接起来,有两种联网方式,1)Infinite Band,它已被用于世界各地
30、的超级计算和人工智能工厂,而且对公司来说,它的发展速度快得令人难以置信。但是,并不是每个数据中心都能处理 Infinite Band,因为他们已经在以太网上投资了太长时间,管理 Infinite Band 交换机和 Infinite Band 网络确实需要一些专业技能和专业知识。2)以太网,因此,公司所做的就是将 Infinite Band 的功能引入以太网架构,而这非常困难,其原因在于,以太网是为高平均吞吐量而设计的,因为每个节点、每台计算机都与互联网中的不同用户相连,而大部分通信都是数据中心与互联网另一端的某个人之间的通信。然而,深度学习和人工智能工厂、GPU 并不与互联网上的人通信,大部
31、分情况下,它们是在相互通信,之所以相互通信,是因为它们都在收集部分产品,它们必须将其还原,然后重新分配,大块的部分产品缩减再分配,重要的不是平均吞吐量,重要的是最后到达的时间。Spectrum X800:四种技术实现交换机通信。四种技术实现交换机通信。公司创建了一个端到端的架构,这样颈部和交换机就能进行通信,采用了四种不同的技术来实现这一点:1)Nvidia 拥有世界上最先进的 RDMA,因此,公司现在有能力为以太网提供网络级 RDMA;2)congestion control,交换机在任何时候都能以令人难以置信的速度进行遥测,每当 GPU 或下一个设备发送过多信息时,可以让它们停止发送,这样
32、就不会产生 hotspots;3)adaptive routing,以太网需要按顺序发送和接收信息,公司会看到拥堵或当前未使用的端口,无论排序如何,都会将其发送到可用的端口,而另一端的Bluefield 会重新排序,使其按顺序返回,这种 adaptive routing 功能非常强大;4)noise isolation,数据中心随时都有一个以上的模型在训练或发生一些事情,它们的噪音和流量可能会相互影响,从而导致抖动。因此,当一个训练模型出现噪音时,一个模型的训练会导致最后一个模型的到达时间过晚,从而拖慢整体训 敬请阅读末页的重要说明 11 行业简评报告 练进度。如果建立了一个价值 50 亿或
33、30 亿美元的数据中心并将其用于训练,如果利用率降低了 40%,结果培训时间就延长了 20%,50 亿美元的数据中心实际上就相当于 60 亿美元的数据中心,成本非常高,影响很大,使用 Spectral Max的以太网基本上可以大大提高性能,网络基本上是免费的,这是一项相当大的成就。公司有一整套以太网产品,这是 Spectrum X800,它的速度是每秒 51.2TB、256 radix,下一个产品是一年后的 512radix,Spectrum X800 Ultra,之后是 X 1600,但 X800 是为数以万计的 GPU 设计的,X800 Ultra 是为数十万 GPU 设计,而 X 160
34、0 则是为数百万 GPU 设计,数百万 GPU 数据中心的时代即将到来。图图10:Spectrum X800 资料来源:英伟达,招商证券 从从Blackwell到数据中心:到数据中心:图图11:从:从Blackwell到数据中心的发展到数据中心的发展 资料来源:英伟达,招商证券 敬请阅读末页的重要说明 12 行业简评报告 图图12:从:从Blackwell到数据中心的发展到数据中心的发展 资料来源:英伟达,招商证券 图图13:从:从Blackwell到数据中心的发展到数据中心的发展 资料来源:英伟达,招商证券 敬请阅读末页的重要说明 13 行业简评报告 图图14:从:从Blackwell到数据
35、中心的发展到数据中心的发展 资料来源:英伟达,招商证券 图图15:从:从Blackwell到数据中心的发展到数据中心的发展 资料来源:英伟达,招商证券 Rubin平台:平台:计算机中最重要的东西是当一台计算机能够向后兼容,并在架构上与所有已创建的软件兼容时,其进入市场的速度就会大大加快。明年是 Blackwell Ultra,就像H100 和 H200 一样,会看到 Blackwell Ultra 的一些令人兴奋的新一代产品,再次挑战极限,以及所提到的下一代 spectrum switches。公司的下一代平台叫 Rubin 平台,所有这些芯片 100%都在全面开发中,它们的节奏是一年内达到技
36、术极限,在架构上 100%兼容,这基本上就是 Nvidia 正在打造的产品,以及在其之上的所有丰富软件。敬请阅读末页的重要说明 14 行业简评报告 图图16:Rubin平台平台 资料来源:英伟达,招商证券 因此,从很多方面来看,从图像网络的那一刻起,从 2012 年之前的 G-Force 到今天的 NVIDIA,公司确实发生了巨大的转变。图图17:公司产品发展:公司产品发展 资料来源:英伟达,招商证券 (2)AMD:24H2将推出将推出CPU Turin与与GPU MI325X 数据中心数据中心EPYC产品高性能、低能耗,第五代产品高性能、低能耗,第五代EPYC产品产品Turin将于下半年推将
37、于下半年推出。出。公司 EPYC 产品拥有 900 多种云服务提供商案例,每天都有数以百万计的人们使用由EPYC驱动的云服务,包括Facebook、Instagram、Linkedln、Microsoft、Zoom、Netflix、Wechat、Whatsapp 等。2017 年推出 EPYC 产品,每一代产品都有越来越多的客户采用 EPYC,因为其具有领先的性能、效率,目前 EPYC 产品占据 33%的市场份额且还在增长。敬请阅读末页的重要说明 15 行业简评报告 图图18:数据中心:数据中心EPYC发展历程发展历程 资料来源:AMD,招商证券 第第四代四代EPYC CPU比同行快比同行快5
38、倍倍。公司最新一代服务器 CPU EPYC 比其他处理器运行速度快5倍,即便是与来自目前竞争者最先进的产品相比也要快1.5倍。图图19:最新:最新EPYC运行速度比较运行速度比较 资料来源:AMD,招商证券 更换更换第第四代四代EPYC可减少可减少80%的的rack空间,降低空间,降低65%的能源的能源消耗。消耗。现在越来越多的企业开始建造数据中心,增加新的 AI 能力,使用第四代 EPYC 产品更新数据中心可以做到一个服务器替换先前五个服务器,减少 80%的 rack 空间,减少 65%的能源消耗。现在很多企业想要将通用计算与 AI 结合而不增加 GPU 的数量,EPYC 依旧是最好的选择,
39、EPYC 运行 TPX AI Benchmark,通过使用不同的案例及算法测量端到端 AI pipeline 时快 1.7 倍。敬请阅读末页的重要说明 16 行业简评报告 图图20:EPYC数据中心数据比较数据中心数据比较 图图21:EPYC端到端端到端AI性能比较性能比较 资料来源:AMD,招商证券 资料来源:AMD,招商证券 第第五代五代EPYC处理器处理器Turin采用采用3纳米与纳米与6纳米制程,将于纳米制程,将于24H2推出。推出。第四代 EPYC 是最好的服务器 CPU,但公司不断追求最先进的性能,即将推出第五代 EPYC 处理器,叫做图灵(Turin),图灵有 192cores,
40、384threads,13chiplets(3 纳米与 6 纳米制程),支持所有最新的存储与 IO 标准。当模拟2千万个原子模型时,一个128核的Turin比竞争者最好的产品快3.1倍。当运行大语言模型时,Turin 也具有优秀的 AI 推理性能,将在今年下半年推出。图图22:第五代:第五代EPYC产品数据产品数据 图图23:第五代:第五代EPYC产品数据将于下半年推出产品数据将于下半年推出 资料来源:AMD,招商证券 资料来源:AMD,招商证券 2023-2026每年一代产品,每年一代产品,MI 325X与与MI 300X采用相同架构以便客户更快换采用相同架构以便客户更快换代。代。去年公司推
41、出 MI 300X,现在拓展 roadmap,每年一代产品,今年晚些时候公司计划推出 MI 325X,它具有更快的速度,更高的存储,2025 年将会推出 MI 350 系列产品,使用 CDNA 4 架构,但他们都会采用相同的行业 OCP 服务器设计标准,客户也会更快适用公司的新产品,到 2026 年,公司将会推出新的 CDNA架构去适配 MI 400 系列产品。敬请阅读末页的重要说明 17 行业简评报告 图图24:AMD GPU产品产品Roadmap 资料来源:AMD,招商证券 MI 325X:MI 325X比比H200具备更高存储与运算能力。具备更高存储与运算能力。MI 325X 达到 28
42、8GB 超快 HBM3E存储,6TB/S 带宽,与 MI 300X 使用相同架构,客户能够非常方便进行替换。与竞争者产品相比,MI 325X 提供高两倍的存储,1.3 倍更快存储带宽,1.3 倍更快运算性能。单个带有 8 颗 MI 325X 芯片的服务器可同时运行高达 1 万亿个参数,这是 H200 的两倍。到 2025 年,公司将介绍 CDNA 4 架构,将实现 AI性能大幅增加。图图25:MI 325X产品数据产品数据 资料来源:AMD,招商证券 图图26:MI 325X与与H200比较比较 资料来源:AMD,招商证券 敬请阅读末页的重要说明 18 行业简评报告 MI 350:MI 350
43、采用采用3纳米制程,纳米制程,比比B200性能高性能高1.2倍倍。MI 350 系列产品使用 3 纳米先进制程,支持 FP4 与 FP6 数据类型,同样与 MI 300、MI 325 具有相同架构。将 MI 350 与 B200 进行比较,MI 350 支持更高 1.5 倍的存储以及更快 1.2 倍的运算性能。图图27:MI 350系列产品数据系列产品数据 图图28:MI 350与与B200比较比较 资料来源:AMD,招商证券 资料来源:AMD,招商证券 Ultra Accelerator Link联盟包括联盟包括AMD、BROADCOM、CISCO、Google、HPE、Intel、Meta
44、、Microsoft。AI 网络架构需要支持高速交换率且低延迟,必须拓展连接大量加速器节点,上周许多大型芯片云与系统集成商共同宣布发展高性能架构开源标准计划,以连接大量加速器,该计划叫做 UA Link,UA Link 是扩大加速器规模最好的解决方案,UA Link 1.0 标准将会在今年晚些时候 on track。同时UEC(ultra ethernet Consortium)的建立能够更好的促进企业间数据交换,技术交流,创造更先进的 AI 与 HPC。图图29:UA Link合作伙伴合作伙伴 图图30:UEC合作伙伴合作伙伴 资料来源:AMD,招商证券 资料来源:AMD,招商证券 公司产品
45、组合:公司产品组合:公司展示了许多产品,从最新的 Ryzen 9000 电脑与第三代 Gen Ryzen AI 处理器,具有领先的 AI 计算能力,到单一路径 Versal Gen 2 系列,具有更多边缘 AI能力,到 EPYC 产品组合,这些都是革命性的创新。敬请阅读末页的重要说明 19 行业简评报告 图图31:AMD产品组合产品组合 资料来源:AMD,招商证券 (3)英特尔英特尔:推出新处理器推出新处理器Xeon 6,展示,展示Gaudi3兼具价格与性能兼具价格与性能优势优势 基于基于Xeon广泛的用户群,广泛的用户群,Xeon 6将大幅降低数据中心能耗、提高算力密度。将大幅降低数据中心能
46、耗、提高算力密度。公司推出新处理器 Xeon 6(144 核),是现代数据中心的重大升级,具有高核数量、每瓦高密度性能,使公司有更多选择去拓展服务器负载量,总体而言,它具有更高的性能、更低的能耗、更小的尺寸。在视频解码上,Xeon 6 比 Xeon 2(28 核)快 4.2 倍,每瓦性能比 Xeon 2 快 2.6 倍。相同算力情况下,3:1 的 rack consolidation 意味着一个 200racks(Xeon 2)的数据中心只需要 66racks(Xeon 6),能够节省 80k MWh 的能源,因为目前 Xeon产品使用遍布全球,如果有 500 个数据中心更新使用 Xeon 6
47、,那么将会节省 140万中国台湾家庭一年的用电量、370 万辆汽车一年的能耗量或中国台湾台北 101 500 年的能耗量。同时,一个 Xeon 6 有 144 核,两个就有 288 核,今年晚些时候公司将推出第二代 Xeon 6 带有 288 核,这会形成 6:1 的 rack consolidation ratio。图图32:Xeon6(右)与(右)与Xeon2(20个,左)比较个,左)比较 图图33:Xeon6服务器优势服务器优势 资料来源:Intel,招商证券 资料来源:Intel,招商证券 Xeon+RAG实时传输数据,高性价比实时传输数据,高性价比Gaudi2构建开源企业构建开源企业
48、AI平台。平台。如今超过 60%的负载在云上运行,而超过 80%的数据仍然在端侧,有很多数据是未受监测的,现在 Xeon+RAG 技术改变了这一局面,RAG 成为了一种重要的企业工作流程,它将数据和数据库结合在一起,一些大语言模型的训练可能基于一个月、敬请阅读末页的重要说明 20 行业简评报告 一年甚至几年前的数据,但是,将这些数据与实时时间序列嵌入相结合,就能形成一个非凡的组合,它不仅功能强大,比如 Xeon 第 6 代处理器,而且还通过公司的 AI 加速器,比如 Gaudi,得到了进一步的增强。客户也在寻找高性能、高性价比的 AI 训练推理解决方案,他们开始转向另一种选择例如 Gaudi,
49、他们想要开源的软硬件解决方案,低的 TCOs,这就是为什么转向 Gaudi2 的原因,公司把这些整合到一起,通过开源社区以及 Linux 创造开放的企业级 AI 平台。图图34:Xeon+RAG 图图35:Gaudi2 资料来源:Intel,招商证券 资料来源:Intel,招商证券 图图36:AI for Enterprise 资料来源:Intel,招商证券 Gaudi3具有比具有比H100更高的性能,更高的性能,TCO也更低。也更低。Gaudi3 拥有强大性能,比 H100 time-to-train 快 40%,Inference Throughout 比 H100 快 15%,Infer
50、encing 比H100 快 2.3 倍,客户能够花更少的价格获得更好的性能。它是可拓展的,使用公开行业标准,例如以太网,支持所有开源架构,例如 pytorch,适用成百上千种模型。Gaudi3 给客户带来巨大的市场机会,因为他们想要 TCO、想要更多选择、想要性能,Gaudi3 都能满足。敬请阅读末页的重要说明 21 行业简评报告 图图37:Gaudi3与与H100比较比较 图图38:Gaudi3合作生态合作生态 资料来源:Intel,招商证券 资料来源:Intel,招商证券 图图39:Gaudi3合作合作伙伴产品伙伴产品 资料来源:Intel,招商证券 (4)Supermicro:服务器可
51、搭载各家最新芯片产品,将推动服务器服务器可搭载各家最新芯片产品,将推动服务器液冷系统市占迅速提升液冷系统市占迅速提升 DLC液冷相比风冷具有更低成本。液冷相比风冷具有更低成本。公司液冷(DLC)已有 30 多年的历史,与需要大量电力运行的风冷不同,TLC 液冷能以更低的成本和更小的环境影响为服务器提供最佳冷却效果。公司的目标是让 DLC 迅速成为所有数据中心和人工智能工厂的主流解决方案,从而提高效率,降低运营成本。以下是 Supermicro DLC液冷解决方案,假设一个中等规模 LLM 的数据中心 GPT4,大约需要 8000 个 GPUs 或 1000 个 HGX 系统,DLC 集群可以节
52、省高达 3%的初始资本成本,由于减少了数据中心空间,节省了总成本,最终 DLC 可以做到免费。敬请阅读末页的重要说明 22 行业简评报告 图图40:DLC与与Air-Cooled比较比较 资料来源:Supermicro,招商证券 DLC优势凸显,近两年市场份额有望提升至优势凸显,近两年市场份额有望提升至30%。DLC 可节省 OPEX 达 40%,5 年内节省 6000 万美金,同样也能减少二氧化碳的排放,实现绿色计算。DLC减少能源需求,对于一个中等规模LLM的数据中心,Air-Cooled需要能源15MW,而 DLC 只需要 10MW。过去大家对 DLC 不敢兴趣,因为 1)DLC 有很长
53、的前置时间,可能需要 1 年的准备周期,2)DLC 也更贵,3)DLC 不支持数据中心,4)在过去 30 年 DLC市场份额小于 1%。现在公司 DLC 解决方案得到全面提升,1)公司能够把 DLC 前置时间缩短至 2-4周,2)公司 DLC 成本更低,3)公司 DLC 具有高性能、高可靠性,4)在接下来的一年内,公司目标将 DLC 在数据中心的市场份额提高到 15%,且在接下来的 1-2 年内提高至 30%。DLC 将会与 Air-Cooled 的成本相同甚至更低,降低二氧化碳的排放,保护数以百万计的树木。图图41:DLC与与Air-Cooled比较比较 资料来源:Supermicro,招商
54、证券 敬请阅读末页的重要说明 23 行业简评报告 图图42:过去过去DLC的缺陷的缺陷 图图43:公司现今公司现今DLC优点优点 资料来源:Supermicro,招商证券 资料来源:Supermicro,招商证券 DLC市场份额市场份额2024年提升至年提升至15%,机架价格约,机架价格约200万美元。万美元。公司现在一个月出货 1000 台机架,一台服务器机架 200 万美元左右,一台重量超过 3000 磅,公司目标是今年出货机架超过 1 万台。这台机架有 72 颗芯片,其他部分超过 60万个,72 颗芯片大概重 1 磅,其他部分重达 2999 磅,有很多其他科技都应用于其中。公司2024年
55、希望将DLC市场份额从1%提高到15%,节约大量能源以供给GPU。在未来,算力吞吐率就是营收,因为 token 生成是 dollars per million tokens,而能源是 dollar per kilowatt hour,公司现在发明了一种新的商品,越快的生成,越高的吞吐率,越大的产能利用率,就会带来越高的收入。在未来的大语言模型生成中,启动时间、吞吐率、产能利用率十分重要,都对营收影响很大。公司将整套系统放进一个机架,再叠加软件,将其连接上网络,就建造好了数据中心。当选择超威电脑进入客户的工厂,启动时间非常快,产能利用率与吞吐率也非常高,从而获得更多收入。图图44:Supermi
56、cro机架展示机架展示 图图45:Supermicro机架展示机架展示 资料来源:Supermicro、招商证券 资料来源:Supermicro、招商证券 下左图支持 H100/H200/B100,下右图支持 B200。产品均准备就绪,只待 NVIDIA 敬请阅读末页的重要说明 24 行业简评报告 Chip。图图46:Supermicro产品展示产品展示 图图47:Supermicro产品展示产品展示 资料来源:Supermicro、招商证券 资料来源:Supermicro、招商证券 图图48:Supermicro产品展示产品展示 资料来源:Supermicro、招商证券 产品交付时间短至两周
57、。产品交付时间短至两周。NVIDIA Blackwell 有液冷与风冷,有 X86 与 Garce,有 NVLink 2/8/36/72,很多的组成部分与型号,基于客户不同的产能利用率,不同的使用案例,可以选择不同的数据中心,超威电脑都可以立刻满足客户需求,在两周以内交付。在场产品在场产品100%软件兼容软件兼容。软件是 HPC 最复杂的部分,有三个非常重要的软件栈是一切的基础,第一个是 CUDA,第二个是网络连接,网络连接在今天不仅是连接,而是 computing fabric,400Gbps,800Gbps,下一代会达到 1600。目前为分布式计算网络连接的所有软件是基于两个软件栈,一个是
58、 DOCA,另一个是Nickel,这两个软件使得公司能够在网络之间高效分配工作量,考虑到以太网并非为高性能计算设计的。液冷机架级应用:液冷机架级应用:每天液冷机架出货量超每天液冷机架出货量超50个,液冷可节省个,液冷可节省33%电能。电能。中等规模的 LLM 数据中心可容纳 8000 个 H100 GPU 或 1000 个 HGX 系统。生成式 AI 工作负载对功耗的要求非常高。在采用了所有新的省电技术之后,数据中心的电力仍然不足,而建立一个新的数据中心可能需要数年时间。通过从传统的风冷配置直接转为液冷配置,公司的客户可以节省 33%的电能。公司在此宣布公司已经兑现了两周快速交付机架的承诺,这
59、种前所未有的速度和部署确保了数据中心能够快速扩展,满足不断增长的需求。此外,公司正在将两周交货的承诺扩展到大规模交付的液冷 敬请阅读末页的重要说明 25 行业简评报告 机架解决方案。现在,公司每天的液冷机架出货量已经超过 50 个。公司正在做的不仅是涉足液冷领域,而是主导机架规模的液冷解决方案。至今,超微已出货超过 50 万台 NVIDIA GPUs,这一新的计算量级远超当今世界前 20 大超级计算机的计算量总和。32 GPUs机架:机架:下图机架为多功能设计的 32 GPUs 机架,目前可支持 NVIDIA H200,AMD MI300X 与 Intel Gaudi 也可使用,并适配风冷与液
60、冷环境。图图49:Supermicro产品展示产品展示 资料来源:Supermicro、招商证券 256 GPUs集群:集群:下图为是 256 个 GPU 风冷集群的样图,液冷使公司能够以一半的计算机架完成部署,将 AI 数据中心扩展向新的规模。图图50:Supermicro 256 GPUs集群集群9 Rack SU 图图51:Supermicro 256 GPUs集群集群5 Rack SU 资料来源:Supermicro、招商证券 资料来源:Supermicro、招商证券 敬请阅读末页的重要说明 26 行业简评报告 SuperCloud Composer:公司的 SuperCloud Co
61、mposer 软件将对整个解决方案起补充作用,允许客户在一块面板上查看与监控整个数据中心,包括芯片、带传感器的 GPU 与液冷塔。图图52:SuperCloud Composer软件软件 资料来源:Supermicro、招商证券 DLC方案节能方案节能40%,计算密度提高一倍,计算密度提高一倍。公司的 DLC 解决方案可高效利用 45摄氏度的热瓦特,通过液冷系统将机架 90%的热量散失,这优化了热管理并提高硬件性能与计算吞吐量,显著节省高达 40%的能源,较风冷将计算密度提高一倍。目前产能目前产能每月每月5000个机架,马来西亚工厂个机架,马来西亚工厂24Q4上线。上线。公司近期在美国、中国台
62、湾以及海外其余地区均进行产能扩张,进一步供给全球数据中心部署。公司的新马来西亚厂区将扩充产能,公司目前产能可支持每月 5000 个机架的设计与交付。图图53:马来西亚工厂:马来西亚工厂24Q4上线上线 资料来源:Supermicro、招商证券 Edge AI:公司 20 多年一直注重边缘计算,利用 Building Blocks Solutions 来延伸设计know-how 从数据中心到紧凑型服务器,包括 2U Multi-node 系统与 Telco Virtualized RAN,在远程零售应用中使用系统支持数据中心、GPU 和 AI。公司最新的 Hyper-E 紧凑型系统通过集成 3
63、double-width GPUs 来支持推理。这种优化配置适用于加速 AI 在零售业的应用,如自动结账和防盗安全功能。公司的 敬请阅读末页的重要说明 27 行业简评报告 Telco and Outdoor Edge 系统解锁了更多机遇将边缘 AI 带到更多领域。公司的Outdoor Edge Systems 具有 IP65 评级,可在零下 47 摄氏度至 47 摄氏度的宽温环境下运行,防止水和灰尘的干扰,这些系统均采用高核数 CPU 与多个企业级 GPU。图图54:Supermicro边缘边缘AI推理产品组合推理产品组合 资料来源:Supermicro、招商证券 总结:总结:30 多年来 D
64、LC 的市场份额都是 0%,目前不到 1%,但公司希望能在一年内将DLC 的市场份额提升到 15%,两年内达到 30%。DLC 方案将获得免费的 TCO bonus,一个数据中心将节约 6000 万美元,并减少二氧化碳排放。目前公司每月出货 1000 个 DLC 机架,未来将达到 2000 个,随着积压订单越来越多,交付时间也将越来越长。图图55:Supermicro DLC份额规划份额规划 资料来源:Supermicro、招商证券 敬请阅读末页的重要说明 28 行业简评报告 2、AI端端:AI PC加速落地加速落地,关注,关注ARM架构架构或或带来带来PC处处理器理器市场市场格局变化格局变化
65、(1)高通高通:展示骁龙展示骁龙X系列和系列和Copilot+PC如何助力重塑如何助力重塑PC,6月月中可购买中可购买 高通总裁兼高通总裁兼CEO安蒙发表安蒙发表主题演讲,主题演讲,重点阐述了搭载骁龙重点阐述了搭载骁龙X系列的系列的Copilot+PC正如何赋能正如何赋能PC行业变革。首批超过行业变革。首批超过20款搭载骁龙款搭载骁龙X Elite和骁龙和骁龙X Plus的的Copilot+PC现已开启预售,现已开启预售,6月月18日起可通过主要零售渠道购买。日起可通过主要零售渠道购买。高通骁龙高通骁龙X系列平台赋能系列平台赋能Copilot+PC设备。设备。高通强调 NPU 作为关键的差异化
66、因素,使搭载骁龙 X 系列的 PC 具有卓越性能,并让 Copilot+体验成为可能。将 AI 工作负载从 CPU 和 GPU 转移到 NPU,可在显著提升性能的同时,降低功耗。搭载骁龙 X Elite 和骁龙 X Plus 的设备支持 Copilot+PC体验,拥有长达多天的电池续航、出色的每瓦特性能,NPU 算力达 45 TOPS,赋能终端侧 AI 体验。相比较 X86 电脑,ARM 电脑在架构上有着一定的优势,骁龙 X Elite 采用的领先 NPU 能够为笔记本电脑提供出色的 NPU 每瓦特性能,与 M3 相比高达其 2.6 倍,与酷睿 Ultra 7 相比高达其 5.4 倍。凭借领先
67、的高通 Oryon CPU,骁龙 X Elite 成为性能领先的 Windows 平台,在ISO 供电情况下,骁龙 X Elite 的 CPU 性能比竞品领先高达 51%,在 PC 达到相同 CPU 峰值性能时,功耗相比竞品低 65%。图图56:高通高通X Elite拥有拥有出色的每瓦特性能出色的每瓦特性能 图图57:高通高通X Elite CPU性能领先性能领先 资料来源:高通,招商证券 资料来源:高通,招商证券 高通携手高通携手合作伙伴合作伙伴宏宏碁碁、华硕、戴尔、惠普、联想、微软和三星、华硕、戴尔、惠普、联想、微软和三星等等,重点,重点阐述了搭载骁龙阐述了搭载骁龙X系列的系列的Copil
68、ot+PC正如何赋能正如何赋能PC行业变革。行业变革。高通与微软合作,搭载骁龙 X Elite 和骁龙 X Plus 的设备目前独家支持 Copilot+PC体验。此外,宏碁、华硕、戴尔、惠普、联想和三星等合作伙伴推出了一系列基于 Snapdragon X Elite 平台的 AI PC。敬请阅读末页的重要说明 29 行业简评报告 图图58:高通骁龙:高通骁龙X系列平台赋能的系列平台赋能的Copilot+设备设备 资料来源:高通,招商证券 图图59:高通:高通合作伙伴引言合作伙伴引言 资料来源:高通,招商证券 AI应用开发:应用开发:除硬件之外,安蒙还介绍了高通技术公司用于创建下一代 AI应用
69、的行业领先的开发工具。高通 AI Hub 让开发者能够在五分钟内在搭载骁龙平台的设备上部署模型,无论是自有模型,还是来自高通技术公司持续增长的模型库中的预优化即用型 AI 模型。全新面向 Windows 的骁龙开发套件为开发者提供了理想的硬件平台,配备特别加速开发者版骁龙 X Elite 芯片组和广受欢迎的可堆叠外观设计。高通表示目前骁龙 X Elite 已经可以运厂商引言宏碁宏碁董事长兼执行长Jason Chen表示:我们很高兴将宏碁与高通技术公司的合作关系扩展至Copilot+PC,利用最新骁龙X系列平台打造全新笔记本电脑宏碁Swift 14 AI。我们期待上述全新PC带来的崭新AI体验,
70、将开启计算技术新时代。华硕华硕电脑共同执行长许先越表示:随着AI PC时代的到来,华硕很高兴与高通技术公司合作,为用户带来突破性创新。华硕Vivobook S 15搭载骁龙X Elite,它的推出是个人计算领域的重要里程碑。AI赋能的Copilot+PC凭借先进特性提高生产力、创造力和用户体验。与高通技术公司的合作,彰显了我们致力于不断追求技术突破的承诺。双方将继续合作推出更多创新AI PC,用前沿技术赋能用户体验。戴尔戴尔客户端解决方案事业部总裁Sam Burd表示:AI PC的变革无疑已经到来,有望将生产力和效率提升至全新水平。戴尔全面拥抱AI PC时代,我们完整的AI PC产品组合就是强
71、有力的证明,这其中就包括搭载骁龙X系列的设备。得益于出色的性能、电池续航和全新AI体验,用户将更好地掌握时间,专注于最重要的任务。惠普惠普公司总裁兼CEO恩里克洛雷斯表示:AI PC的出现为行业创造了重要机遇,惠普很高兴能够在这一全新品类诞生之时与高通技术公司展开合作。Elitebook Ultra和OmniBook X的发布体现了双方重新构想AI时代可能性的共同承诺。我们将借助骁龙X系列,为客户提供行业领先的安全性和强劲的性能体验。联想联想智能设备业务集团(IDG)总裁Luca Rossi表示:在联想,创新从未停止,我们提供最佳计算体验、设计和工程技术,创造技术更加智能的未来,让人工智能惠及
72、每一个人。我们一直与高通技术公司保持合作,努力将这一愿景变为现实。得益于骁龙X Elite平台,最新联想ThinkPad T14s Gen 6和Yoga Slim 7x Copilot+PC将为企业用户和消费者带来令人惊叹的性能、卓越能效和开创性的AI功能。微软微软董事长兼CEO萨提亚纳德拉表示:PC正在被重塑,改变消费者对设备在生产力、创造力、沟通和娱乐方面的期待。上个月,我们宣布推出Copilot+PC迄今为止最快、最智能的Windows PC。这标志着整个行业的转折点,而这一切都离不开与高通技术公司的合作。三星三星移动业务执行副总裁兼研发负责人Won-joon Choi表示:几十年来,三
73、星与高通技术公司保持合作,为整个Galaxy生态系统打造出色的移动体验。凭借搭载骁龙X Elite的Galaxy Book4 Edge,三星重新定义了AI PC品类,并将展示下一代AI PC的可能性。我们很高兴看到Galaxy Book4 Edge用户将如何利用互联的Galaxy AI体验和强大的骁龙X Elite提升生活品质,最大限度提高生产力并释放创造力。敬请阅读末页的重要说明 30 行业简评报告 行超过 1200 款游戏,并且高通也和动视暴雪、Epic Games、Remedy、育碧、EA 等厂商合作,实现更多游戏的兼容。图图60:高通:高通AI Hub 图图61:高通:高通X Elit
74、e可运行超过可运行超过1200款游戏款游戏 资料来源:高通,招商证券 资料来源:高通,招商证券 (2)ARM:25年年Arm设备将达设备将达1000多亿台多亿台,5年内获得年内获得Windows PC市场超过市场超过50%份额份额 Arm首席执行官首席执行官Rene Haas分享了凭借分享了凭借Kleidi AI和和Arm CSS等创新,公司等创新,公司预计预计到到2025年年Arm设备设备将将超过超过1000亿台亿台,公司,公司目标是在五年内获得目标是在五年内获得Windows PC市场超过市场超过50%的份额。的份额。Kleidi AI:哈斯指出 Arm 已成为全球所有主要操作系统的实际选
75、择,例如微软最近发布的 AI PC,其中最常用的应用程序现在 Arm 上的 Windows 上原生运行。事实上,在拥有 1800 万软件开发人员的生态系统中,使用 Arm CPU 进行设计的开发人员比当今任何其他处理器都多。为了确保这一点在Arm 计算平台上实现,推出了 Arm KleidiAI,它是一套新的 AI 计算库的一部分,可让开发人员更轻松地在 Arm 上运行他们的 AI 应用程序。例如,当开发人员在 TensorFlow、PyTorch、Llama 3 和 MediaPipe 等框架中处理他们的模型时,KleidiAI 使他们能够进入抽象层并利用 AI 工作负载的底层硬件功能来充分
76、发挥其性能潜力。Arm CSS:Arm 除了为支持 AI 开发者生态系统所做的所有出色工作之外,还需要继续提供性能更高、能效更高的产品。为了进一步分享这一点,Arm介绍了最近宣布的用于客户端设备的 Arm 计算子系统(CSS)。这是 Arm首次在领先的3纳米节点上推出其CPU和GPU的物理实现。CSS for Client 使芯片制造商能够专注于平台的差异化以及 Armv9 架构能为他们的下一代产品带来什么。将其与 KIeidiAI 结合使用时,开发人员拥有充分利用这些下一代硬件技术所需的工具。敬请阅读末页的重要说明 31 行业简评报告 图图62:ARM Kleidi AI介绍介绍 图图63:
77、ARM CSS介绍介绍 资料来源:Arm,招商证券 资料来源:Arm,招商证券 图图64:Arm预计到预计到25年年Arm设备将达设备将达1000多亿台多亿台 资料来源:Arm,招商证券 (3)联发科联发科:加入加入Arm全面设计全面设计,新一代新一代Chromebook、智能电视、智能电视和显示设备芯片亮相和显示设备芯片亮相 COMPUTEX 2024 期间,联发科展示了 AI 在广泛领域的创新应用,推出两款芯片产品。同时,副董事长暨执行长蔡力行博士于发表主题演讲,畅谈 MediaTek的技术如何赋能 AI 时代,持续改变移动通信、交通、智能家居、企业和工业环境,介绍了其在移动 SoC 领域
78、的技术进步,并宣布加入 Arm 全面设计生态项目。此外,联发科宣布与 NVIDIA 合作通过 AI 和加速计算改变汽车行业。MediaTek加入加入Arm全面设计:全面设计:MediaTek 于 COMPUTEX 2024 宣布加入 Arm全面设计(Arm Total Design)生态项目。Arm 全面设计基于 Arm Neoverse 计算子系统,可满足数据中心、基础设施系统、电信等领域的 AI 应用性能和效率需求,并加速和简化产品开发。MediaTek 拥有强大的 SoC 整合设计能力,可提供差异化的解决方案,通过已获验证的 Arm Neoverse CSS 可加速产品的上市进程,并可针
79、对特定应用领域的复杂 AI 计算需求提供卓越的解决方案。敬请阅读末页的重要说明 32 行业简评报告 图图65:联发科:联发科加入加入Arm全面设计全面设计 资料来源:联发科,招商证券 MediaTek推出两款芯片产品,推出两款芯片产品,面向高阶 Chromebook 的 Kompanio 838 移动计算芯片,以及面向 4K 高阶智能电视和显示设备的 Pentonic 800 智能电视芯片,两款产品具有较强的性能和 AI 运算能力。Kompanio 838:搭载高效的八核 CPU,拥有出色性能和多任务处理能力,可为轻薄的 Chromebook 产品提供全天电池续航时间,并且集成 AI 处理器
80、NPU 650,以高能效特性支持 AI 功能,支持 DDR4 和 LPDDR4X 内存。与前代产品相比,内存带宽增加了一倍,数据吞吐量大幅提升。内置 Imagiq 7系 ISP 影像处理器,支持 AV1 硬件视频解码,以及双 4K 显示。此外,还支持 Filogic Wi-Fi 6 和 Wi-Fi 6E 无线连接技术,可为 Chromebook 带来高达1.9 Gbps 的网络连接速率,同时支持 2x2 天线和 WPA 3,提供稳定、可靠的连接和安全性。Pentonic 800智能电视:智能电视:该平台适用于各类 4K 显示设备,包括智能电视、智能监视器、商用显示等大屏应用。与上代产品相比,内
81、置 AI 处理器性能提升 50%,内存带宽占用至高可降低 60%。AI 处理器支持多种 AI 画质增强技术,包括 AI 超分辨率、AI-Contrast 2.0、AI 场景识别画质监测和 AI 物体识别画质增强。为进一步优化游戏体验,Pentonic 800 支持 4K 或 2K 165Hz 的可变刷新率。硬件视频解码引擎支持 HEVC、AV1、AVS3 高画质规范和 VVC 等主流格式,提供高品质 4K 视频播放效果。该芯片还支持MEMC、TCON 和高解析度音频方案。图图66:联发科:联发科AI具备领先的具备领先的加速器能力加速器能力 图图67:联发科:联发科838 Kompanio 83
82、8产品展示产品展示 资料来源:联发科,招商证券 资料来源:联发科,招商证券 敬请阅读末页的重要说明 33 行业简评报告 (4)AMD:搭载搭载Ryzen AI 300系列的系列的AI PC将于将于7月上市月上市,NPU性能业内领先性能业内领先 在 Computex 2024 主题演讲中,AMD 详细介绍了新的领先 CPU、NPU 和 GPU 架构,为从数据中心到 PC 的端到端 AI 基础架构提供支持。AMD 公布了扩展的 AMD Instinct 加速器路线图,介绍了每年推出的领先 AI 加速器,包括具有业界领先内存容量的新型 Instinct MI325X 加速器,计划于 24Q4 上市。
83、AMD 宣布推出 Ryzen AI 300 系列和分别用于笔记本电脑和台式电脑的 Ryzen 9000 系列处理器。AMD 表示搭载 AI 300 系列的首批笔记本电脑将于 7 月上市,已与宏碁、华硕、惠普、联想、微星等公司签订了 100 多个消费和商用笔记本电脑设计合同。重新构想重新构想PC以实现智能、个性化体验以实现智能、个性化体验。AMD 与微软、惠普、联想和华硕的高管一起揭晓了由第三代 Ryzen AI 300 系列处理器和 Ryzen 9000 系列台式机处理器提供支持的全新 PC 体验。Ryzen AI 300系列:系列:AMD 详细介绍了其下一代“Zen 5”CPU,专为在超级计
84、算机、云端和 PC 领域实现领先的性能和能效而构建。AMD 还推出了 AMD XDNA NPU 核心架构,与上一代产品相比,该架构可提供 50 TOPs的 AI 处理性能,并且生成性 AI 工作负载的预计能效比提高 2 倍。基于 AMD XDNA 2架构的NPU是业界第一个也是唯一一个支持高级Block FP16数据类型的 NPU,与竞争性 NPU 使用的低精度数据类型相比,它可提供更高的准确性,且不会牺牲性能。“Zen 5”、AMD XDNA 2 和 AMD RDNA 3.5 显卡共同为搭载 Ryzen AI 300 系列处理器的笔记本电脑带来下一代 AI 体验。Ryzen 9000系列:系
85、列:AMD 还发布了基于“Zen 5”架构的锐龙 9000 系列台式机处理器,在游戏、生产力和内容创作方面均提供领先性能。AMD 称锐龙 9 9950X 处理器是全球最快的消费级台式机处理器。生态系统合作伙伴展示了与生态系统合作伙伴展示了与AMD关于关于AI PC的合作。的合作。微软强调了其与 AMD 的长期合作伙伴关系,并宣布 Ryzen AI 300 系列处理器超出了微软 Copilot+PC 的要求;惠普推出了搭载 AMD 的新型 Copilot+PC,包括 HP Pavilion Aero,并演示了在搭载 Ryzen AI 300 系列处理器的惠普笔记本电脑上本地运行的图像生成器 St
86、able Diffusion XL Turbo;联想发布了即将推出的搭载 Ryzen AI 300 系列处理器的消费级和商用级笔记本电脑,并重点介绍了如何利用Ryzen AI支持新的联想AI软件;华硕展示了搭载 Ryzen AI 300 系列处理器的面向商业用户、消费者、内容创作者和游戏玩家的广泛AI PC 产品组合。图图68:ARM下一代“下一代“Zen 5”CPU 图图69:ARM新的新的NPU性能领先性能领先 资料来源:AMD,招商证券 资料来源:AMD,招商证券 敬请阅读末页的重要说明 34 行业简评报告 图图70:AMD AI PC合作伙伴合作伙伴 资料来源:AMD,招商证券 为下一
87、波边缘为下一波边缘AI创新提供动力创新提供动力。AMD 展示了其 AI 和自适应计算技术如何为下一波边缘 AI 创新提供动力。AMD 整合了整个边缘 AI 应用加速所需的 IP。全新 AMD Versal AI Edge 系列 Gen 2 整合了用于实时预处理的 FPGA 可编程逻辑、由XDNA技术支持的用于高效AI推理的下一代AI引擎以及用于后处理的嵌入式 CPU,为边缘 AI 提供性能最高的单芯片自适应解决方案。AMD Versal AI Edge Gen 2 设备现已可供抢先体验,目前有超过 30 个主要合作伙伴正在开发中。AMD 展示了如何在各个垂直领域实现边缘人工智能,其中包括:展示
88、了如何在各个垂直领域实现边缘人工智能,其中包括:Illumina 正在利用先进的 AMD 技术来释放基因组测序的力量;斯巴鲁正在使用 AMD Versal AI Edge Gen 2 设备为其 EyeSight ADAS 平台提供支持;佳能将 Versal AI Core 系列用于其自由视点视频系统,彻底改变了体育赛事直播和网络直播的观看体验;日立能源的HVDC保护继电器使用AMD自适应计算技术进行实时处理来预测电气过电压。(5)英特尔英特尔:公布公布Lunar Lake处理器架构细节处理器架构细节,将于将于24Q3为为80多种新型多种新型AI PC设计提供支持设计提供支持 在在Compute
89、x 2024期间,英特尔公布了最新技术,旨在大幅加速期间,英特尔公布了最新技术,旨在大幅加速AI生态系统生态系统的发展的发展从数据中心、云和网络到边缘和从数据中心、云和网络到边缘和PC,推出推出 Lunar Lake 客户端处客户端处理器架构,继续扩大理器架构,继续扩大AI PC品类。品类。Lunar Lake:英特尔公布了即将推出的 Lunar Lake 客户端计算处理器的架构细节,该处理器经过重新设计,为 x86 能效树立了新标杆,并通过无与伦比的 AI 提供领先的核心和图形性能。与上一代相比,新的性能核心 P 核心和高效核心 E 核心可提供惊人的性能,而系统级芯片功耗降低了 40%。与上
90、一代相比,新的神经处理单元速度提高了 4 倍,从而实现了生成 AI 的相应改进。而新的 Xe2 图形处理单元核心将游戏和图形性能提高了 1.5 倍。从 2024 年第三季度开始,Lunar Lake 将为来自 20 多个合作伙伴的 80 多种新型 AI PC 设计提供支持。敬请阅读末页的重要说明 35 行业简评报告 Gaudi 2 和和Gaudi 3:宣布英特尔 Gaudi 2 和 Gaudi3 人工智能加速器套件的定价,与竞争平台相比,它们可提供高性能,且成本可降低三分之。系统中 Xeon 处理器与 Gaudi 人工智能加速器的组合提供了强大的解决方案,可使人工智能更快、更便宜、更易于访问。
91、图图71:英特尔:英特尔Lunar Lake处理器亮点处理器亮点 资料来源:英特尔,招商证券(6)英伟达英伟达:AI下一波浪潮是下一波浪潮是Physical AI,关注机器人等热门应用,关注机器人等热门应用领域领域 在在AI端侧,英伟达认为端侧,英伟达认为AI下一波浪潮是下一波浪潮是Physical AI,重点阐述了机器人等相,重点阐述了机器人等相关应用关应用。公司机器人合作伙伴众多,包括西门子、ArcBest、比亚迪电子、Idealworks 等,均将 Isaac Manipulator 与 Perceptor 集成进自身 AI 流程中用于加速智能机器人,如西门子的 SIMATIC Pick
92、 AI 集成了 Isaac Manipulato,在 ABB、库卡、安川、等广泛运行。NVIDIA 目前有两个高质量机器人产品:1)自动驾驶汽车。NVIDIA 明年将于梅赛德斯车队共同投入生产,2026 年 JLR 车队投入生产,向世界提供完整堆栈。2)人型机器人。人型机器人基于基础模型与 NVIDIA正在开发的世界理解能力取得大幅进步,通过演示与视频能力可为其提供大量训练数据。图图72:机器人方面的应用:机器人方面的应用 资料来源:英伟达,招商证券 敬请阅读末页的重要说明 36 行业简评报告 图图73:机器人实图:机器人实图 资料来源:英伟达,招商证券 新款新款RTX AI电脑:电脑:这些
93、ACE 在云中也在 PC 中运行,公司在所有 RTX 里加入 Tensor core GPUs,公司为出货 AI GPUs 做准备,原因很简单,为了建造计算平台,首先需要硬件,最终应用能给运行,如果没有硬件,这些应用怎么能够运行,所以公司每一个RTX GPU 都带有 Tensor core processing,现在公司在全球有数以百万计的G-Force RTX AI PCs,出货 200 多款,这次大会上公司选出四款独特的电脑,他们都能运行 AI。未来的电脑会变成 AI,成为用户助手,所有运行的软件都会被 AI 加强,例如照片编辑、写作、所有使用的工具,电脑也能过通过数字人管理运行程序,PC
94、s 成为将会成为重要的 AI 平台。图图74:新款:新款RTX AI电脑电脑 资料来源:英伟达,招商证券 敬请阅读末页的重要说明 37 行业简评报告 分析师分析师承诺承诺 负责本研究报告的每一位证券分析师,在此申明,本报告清晰、准确地反映了分析师本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与,未来也将不会与本报告中的具体推荐或观点直接或间接相关。评级评级说明说明 报告中所涉及的投资评级采用相对评级体系,基于报告发布日后 6-12 个月内公司股价(或行业指数)相对同期当地市场基准指数的市场表现预期。其中,A 股市场以沪深 300 指数为基准;香港市场以恒生指数为基准;美国市场以标普 50
95、0 指数为基准。具体标准如下:股票股票评级评级 强烈推荐:预期公司股价涨幅超越基准指数 20%以上 增持:预期公司股价涨幅超越基准指数 5-20%之间 中性:预期公司股价变动幅度相对基准指数介于5%之间 减持:预期公司股价表现弱于基准指数 5%以上 行业评级行业评级 推荐:行业基本面向好,预期行业指数超越基准指数 中性:行业基本面稳定,预期行业指数跟随基准指数 回避:行业基本面转弱,预期行业指数弱于基准指数 重要重要声明声明 本报告由招商证券股份有限公司(以下简称“本公司”)编制。本公司具有中国证监会许可的证券投资咨询业务资格。本报告基于合法取得的信息,但本公司对这些信息的准确性和完整性不作任
96、何保证。本报告所包含的分析基于各种假设,不同假设可能导致分析结果出现重大不同。报告中的内容和意见仅供参考,并不构成对所述证券买卖的出价,在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。除法律或规则规定必须承担的责任外,本公司及其雇员不对使用本报告及其内容所引发的任何直接或间接损失负任何责任。本公司或关联机构可能会持有报告中所提到的公司所发行的证券头寸并进行交易,还可能为这些公司提供或争取提供投资银行业务服务。客户应当考虑到本公司可能存在可能影响本报告客观性的利益冲突。本报告版权归本公司所有。本公司保留所有权利。未经本公司事先书面许可,任何机构和个人均不得以任何形式翻版、复制、引用或转载,否则,本公司将保留随时追究其法律责任的权利。