《通信行业:边缘计算始于AI赋能应用-230521(29页).pdf》由会员分享,可在线阅读,更多相关《通信行业:边缘计算始于AI赋能应用-230521(29页).pdf(29页珍藏版)》请在三个皮匠报告上搜索。
1、请仔细阅读本报告末页声明请仔细阅读本报告末页声明 证券研究报告|行业深度 2023 年 05 月 21 日 通信通信 边缘计算边缘计算始于始于 AI,赋能应用,赋能应用 边缘侧是边缘侧是 AI生态中最重要的组成部分之一。生态中最重要的组成部分之一。AI 飞轮发展滚滚向前,从今年初 GPT-3.5 惊艳世界,到 5 月 14 日 OpenAI 正式开启插件功能,我们见证了云端大模型的快速迭代与演化。当前时点,AI 大模型已经站在了从“玩具”向“工具”快速演化的关键迭代期。如何让大模型渗透进入各类垂直场景,如何更低成本的使用大模型,如何让更多场景与用户接触 AI,成为了发展的下一个重点。在 AI
2、向实际场景落地时,边缘算力的重要性加速凸显,边缘算力在成本、时延、隐私上具有天然优势,也可以作为桥梁,预处理海量复杂需求,并将其导向大模型。边缘算力作为 AI 触及万千场景的血管地位加速明晰。之前,边缘侧设备以部署通信能力为主,当下,在以高通为代表的边缘巨头推动下,算力、AI 能力等边缘基建正在加速推动,同时三大运营商的算力网络与边缘资源池体系,也为我国算力梯度分布奠定了雏形。展望未来,边缘算力将始于 AI 带来的需求提升,同时也将赋能应用,连接更多用户,加速 AI 发展与迭代。边缘算力的三大优势。边缘算力的三大优势。边缘算力,通常指部署在设备本地的算力或者离用户距离较近的数据中心中的算力。边
3、缘算力相较于云端算力,拥有低成本、低时延、高隐私三大特性。(1)低成本:当前主流的边缘算力平台主要采用高通主导下的 ARM架构,相比于英伟达的复杂架构,ARM 架构在小算力时拥有极低的单位成本,是降低开发与用户成本的必然选择。(2)低时延:边缘算力一般搭载在本地,无需将数据发送至云端并等待回传的时间,可以满足如自动驾驶,快速对话等对时延要求高的场景。(3)高隐私:边缘算力依靠设备本身搭载的算力或在用户自有服务器上的算力进行推理,可以实现数据不出用户管辖范围,对隐私的保护更好。边缘算力的存在形式。边缘算力的存在形式。当下边缘算力主要有两种存在模式,一种是设备本身搭载的算力,这类算力通常依托边缘处
4、理芯片存在,边缘处理芯片包括了手机终端上的骁龙与苹果 M 平台,面向 IOT 设备的如高通 8155 芯片或者专为 AI 优化的QCM8550 芯片。通常,大单品采用直采芯片+定制 PCB 的形式进行开发,而中小厂商与细分垂直领域往往采购模组来满足算力需求。第二种算力存在形式是边缘资源池,通常由离用户较近的核心城市内的数据中心构成,或者由厂区,道路旁的小机柜、算力盒子提供算力。边缘算力赋能万千应用。边缘算力赋能万千应用。在生成式 AI 爆发前,边缘算力已经逐渐渗透进了部分商用场景,如手机云游戏、无人设备驾驶、自动视频识别等。如今随着 MLC-LLM,谷歌模型体系等软件基建加速,特斯拉机器人为具
5、身智能完成物理基建,在终端设备上推理生成式模型,甚至让智能设备同物理世界自主交互的条件已经具备,未来,随着应用加速渗透、预处理模型需求爆发,以及边缘小模型推理,智能设备物理交互需求爆发。“云“云边”一体边”一体,共筑共筑 AI 飞轮模型。飞轮模型。“云边”一体指云计算和边缘计算的有机结合。此前市场担心小模型对算力需求下降,但我们却认为这正是 AI 应用闭环的必由之路。类似于交通网络,光有干线是不够的,还需要无数省道、乡村小路通往千家万户,汇聚而来的流量才能驱动干线不断升级。边缘侧需求的释放将开启“真 AIOT”时代,或许这才能开启 5G 当初所提万物互联、算网一体的黄金时代。投资建议:抓住边缘
6、算力芯片与边缘算力承载平台两条主线投资建议:抓住边缘算力芯片与边缘算力承载平台两条主线。边缘算力芯边缘算力芯片:片:瑞芯微瑞芯微/全志科技全志科技/晶晨股份晶晨股份/翱翱捷捷科技科技/乐鑫科技乐鑫科技。边缘算力承载平台边缘算力承载平台:美格智能美格智能/广和通广和通/超讯通信超讯通信/龙宇股份龙宇股份/移远通信移远通信/网宿科技网宿科技。边缘算力运营商:中国移动边缘算力运营商:中国移动/中国电信中国电信/中国联通中国联通。风险提示风险提示:小模型推进不及预期,边缘算力发展不及预期小模型推进不及预期,边缘算力发展不及预期。增持增持(维持维持)行业行业走势走势 作者作者分析师分析师 宋嘉吉宋嘉吉
7、执业证书编号:S0680519010002 邮箱: 分析师分析师 黄瀚黄瀚 执业证书编号:S0680519050002 邮箱: 分析师分析师 邵帅邵帅 执业证书编号:S0680522120003 邮箱: 相关研究相关研究 1、通信:具身智能下一波人工智能浪潮2023-05-192、通信:800G LPO:AI 时代最具潜力的技术路线2023-05-16 3、通信:算力AI 从玩具向工具的使能者2023-05-14-32%-16%0%16%32%48%64%2022-052022-092023-012023-05通信沪深3002023 年 05 月 21 日 P.2 请仔细阅读本报告末页声明请仔
8、细阅读本报告末页声明 内容目录内容目录 1.投资要件.4 2.模型由大到小,AI 走向应用的快速路.5 3.梯度分布,算力的终极呈现形式.9 4.边缘算力,连接 AI 与用户的纽带.16 5.应用曙光已现,期待 AI 飞轮下的百花齐放.21 6.投资建议.26 7.风险提示.28 图表目录图表目录 图表 2:DeepSpeed 训练花费.5 图表 2:MLC 项目概览.6 图表 3:Lora 模型.6 图表 4:高通在手机上运行 StableDiffusion.7 图表 5:高通全栈 AI 优化.7 图表 6:谷歌基于 PaLM2 的模型体系.8 图表 7:中科创达 Rubik 大模型.8 图
9、表 8:不同制程手机芯片成本(单位:美元).9 图表 9:核心数与算力关系曲线.10 图表 10:算力与网络的供需错配.11 图表 11:算力发展的驱动原因.12 图表 12:四类关键技术对算力的具体要求.12 图表 13:东数西算.14 图表 14:东数西算布局图.14 图表 15:中国移动算力网络.15 图表 16:英伟达自动驾驶平台.16 图表 17:苹果 M2 芯片.16 图表 18:高通 8550 物联网芯片性能.17 图表 19:高通 8550 物联网芯片架构.17 图表 20:瑞芯微边缘芯片产品.17 图表 21:翱捷科技蜂窝基带芯片.17 图表 22:石头扫地机器人搭载全志科技
10、芯片.18 图表 23:MAXHUB 视频会议采用瑞芯微芯片.18 图表 24:智能模组的发展历程.18 图表 25:美格智能 SNM970 模组.19 图表 26:兰州 110 千伏砂坪变多站融合数据中心.20 图表 27:自动驾驶芯片每秒识别帧率对比.21 图表 28:美格车规模组.21 图表 29:美格智能模组赋能“虎鲸”无人机.22 图表 30:美格智能智能零售解决方案.22 图表 31:启朔科技产品细节.23 图表 32:启朔科技合作伙伴.23 图表 33:斑马智行接入通义千问.24 图表 34:问界 M9 接入大模型.24 VXfWtXjWnVsQtRmR6M8Q8OoMrRmOm
11、PfQpPnQjMmOoM8OpOnNwMmRoQNZrMnM2023 年 05 月 21 日 P.3 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 图表 35:手机上的“ChatGPT”.24 图表 36:Rewind 应用.25 图表 37:特斯拉机器人最新进展.26 图表 38:边缘计算投资标的(Wind 一致预期,除高通为亿美元外,其他总市值、净利润单位均为亿人民币).27 2023 年 05 月 21 日 P.4 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 1.投资要件投资要件 当前市场普遍聚焦于云端算力发展,忽视了边缘算力在 AI 乃至社会数字化发展中的重要地位。随着 A
12、I 大模型应用逐渐渗透进入千行百业和各类垂直细分场景,单纯的大规模计算中心提供的算力将不能满足多样化的 AI 运算需求。基于几点判断,我们认为边缘算力具备不可或缺性:第一,未来随着计算芯片加速发展,单位算力成本中,电费与土地费用占比将愈发提升,算力成本将取决于智算中心的地理位置,以我国举例,未来算力成本较低的西部将是云端算力主要部署地。因此,大算力与低时延需求将出现错配。第二,AI 模型推理 Token 费用较贵,如果需要成熟商用,边缘预处理将是必须选项。通过边缘部署的算力,将用户的多样化需求进行本地的预处理,简单的需求直接利用本地模型和算力推理,复杂需求通过边缘算力预处理后,精简成最少的 T
13、OKEN 发送至云端,从而能够最低成本的实现应用功能,加速商业化。同时,面向小算力时,ARM 架构由于其架构简单,比英伟达复杂架构计算卡更具成本优势,也将加速边缘小算力的渗透速度。最后,无论是对用户个人敏感数据进行推理,还是推理设计商业敏感数据,完全与云端隔绝的边缘算力,能为用户提供最好的数据安全保护。因此,从时延、成本、隐私三大方面来看,边缘算力未来算力体系的重要构成部分,也是 AI 需求连接万物的毛细血管。当前市场普遍聚焦于边缘场景中的大单品逻辑,忽视了边缘生态的多样性。当前市场聚焦于智能音响,智能耳机等大单品及其部件,主要是其作为 AI 入口的逻辑更具备直接性。但我们认为,随着 AI 加
14、速向边缘渗透,应用的形式将愈发多样,越来越多的中小厂商将参与到不同场景,不同细分领域的 AI 智能硬件开发中来。随着应用形式愈发多样,如何在海量不同设备上部署标准化的 AI 边缘算力将成为一个重要问题。我们判断,物联网模组将成为承载这类算力的重要形式。物联网模组集成了通信芯片与全球大厂的算力芯片,能为海量场景和中小厂商提供稳定的边缘通信能力和边缘算力,大大降低了中小开发者部署边缘算力的门槛和难度。AI 时代,是万众创新的年代,海量的开发将来自中小开发者,而模组提供的算力,将成为边缘算力中的重要部分。行业催化因素:1.边缘小模型以及解决方案加速推进,模型蒸馏加速简化。2.搭载边缘模型与边缘算力的
15、智能设备快速放量。投资建议:抓住边缘算力芯片与边缘算力承载平台两条主线。边缘算力芯片:高通/瑞芯微/全志科技/晶晨股份/翱捷科技。边缘算力承载平台:美格智能/广和通/龙宇股份/网宿科技。边缘算力运营商:中国移动/中国电信/中国联通。风险提示:1.小模型推进不及预期。2.边缘计算不及预期。2023 年 05 月 21 日 P.5 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 2.模型由大到小模型由大到小,AI 走上走上应用的快速路应用的快速路 今年年初,随着Chatgpt的发布,以LLM模型为主导的生成式大模型高速发展。在Chatgpt之前,AI 发展通常以面向细分行业的小模型为主,追求较小
16、运行成本下的较快商业化。Chatgpt 问世之后,证明了“野蛮”堆砌参数与算力的生成式模型之路是可以走通的,因此,短期内全球 AI 模型开发的风向转向了堆砌参数与算力的模式。随着 GPT-4 的发布,标志大语言模型正式迈入了多模态时代,参数量近一步膨胀。4 月份,OPENAI 创始人 SAM Altman 在一场 MIT 举办的活动上表示,“未来的“未来的 AI 进展不会进展不会来自于让模型变得更大”来自于让模型变得更大”,我们认为,这代表着 OPENAI 之后的努力将会更多的转向如何让现有的大模型更好用,渗透进更多的场景。从北美的趋势来看,当下,在大模型基础上,快速建立小模型生态,正是许多大
17、模型龙头正在高速推进的发展方向。如何推动模型实现“人人可训,人人可用”“人人可训,人人可用”已经成了海外大厂争相布局的方向。4 月 12 日,微软正式开源 DeepSpeedchat 训练模型,这个训练方式拥有三大核心优势,第一,简化 ChatGPT 类型模型的训练和强化推理体验,第二,DeepSpeed-RLHF 模块,第三,DeepSpeed-RLHF 系统。基于这三大特性,DeepSpeed-HE 比现有系统快 15 倍以上,使 RLHF 训练快速且经济实惠。例如,DeepSpeed-HE 在 Azure 云上只需 9 小时即可训练一个 OPT-13B 模型,只需18 小时即可训练一个
18、OPT-30B 模型。这两种训练分别花费不到 300 美元和 600 美元。此外,该系统可以支持超千亿参数的模型训练,并且增强了对于单张显卡的训练支持,仅凭单个 GPU,DeepSpeed-HE 就能支持训练超过 130 亿参数的模型。图表 1:DeepSpeed 训练花费 GPUs OPT-67B OPT-13B OPT-30B OPT-66B 8x A100-40GB 5.7 hours 10.8 hours 1.85 days NA 8x A100-80GB 4.1 hours 9 hours($290)18 hours($580)2.1 days($1620)资料来源:微软,国盛证券研
19、究所 如果说如果说 DeepSpeedchat 是模型界迈向应用与生态建设的第一步,那么在五月初的是模型界迈向应用与生态建设的第一步,那么在五月初的几几大大变化,让我们更加坚信了,万物搭载模型,模型赋能万物的时代正在加速到来。变化,让我们更加坚信了,万物搭载模型,模型赋能万物的时代正在加速到来。首先,便是知名华人 AI 研究者陈天奇牵头开发的 MLC-LLM 解决方案,MLC LLM 为用户在各类硬件上原生部署任意大型语言模型提供了解决方案,可将大模型应用于移动端(例如 iPhone)、消费级电脑端(例如 Mac)和 Web 浏览器。MLC 的主要功能包括了:(1)支持不同型号的 CPU、GP
20、U 以及其他可能的协处理器和加速器。(2)部署在用户设备的本地环境中,这些环境可能没有 python 或其他可用的必要依赖项;通过仔细规划分配和积极压缩模型参数来解决内存限制。(3)MLC LLM 提供可重复、系统化和可定制的工作流,使开发人员和 AI 系统研究人员能够以 Python 优先的方法实现模型并进行优化。MLC LLM 可以让研究人员们快速试验新模型、新想法和新的编译器 pass,并进行本地部署。2023 年 05 月 21 日 P.6 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 图表 2:MLC 项目概览 资料来源:机器之心,国盛证券研究所 其次,我们看到了随着 Meta
21、开源 LLaMA,整个北美 AI 开发者中,正在快速兴起基于LLaMA 的训练风潮,同时随着 Lora 等训练方法的加速渗透,我们判断,中小开发者蒸馏,训练,部署自由模型的成本正在快速降低,整个开源生态下,模型梯度分布的格局正在加速建立。Lora 训练法通过冻结预训练的模型权重,并将可训练的秩分解成矩阵注入到Transformaer 架构的每一层,极大的减少了下游任务的可训练参数的数量,有效提升了预训练模型在下游任务的 finetune 效率。图表 3:Lora 模型 资料来源:arXiv,微软,国盛证券研究所 上述的三种模型或解决方案,DeepspeedChat,MLC-LLM,Lora 模
22、型,其中 Deepspeed与 Lora 模型给中小开发者提供了低成本,快速训练专属于自己的小模型的完整工具,而MLC-LLM 则为中小开发者在算力较低的环境或者边缘进行模型的推理搭建了基础,三大工具,我们认为已经形成了我们认为已经形成了 AI 走向边缘的“基建雏形”走向边缘的“基建雏形”。上文阐述了来自开源社区或者中小开发者参与的模型应用变化,在 Chatgpt 面世以来,大厂也在加速边缘推理能力,小模型的开发。2023 年 05 月 21 日 P.7 请仔细阅读本报告末页声明请仔细阅读本报告末页声明 2 月,全球手机与 IOT 芯片龙头高通,展示了其在搭载 8Gen2 的手机平台生利用St
23、ableDiffusion 生成了图片,耗时小于 15 秒。在 5 月,高通通过持续优化,将生成图片的时间缩短至 12 秒。图表 4:高通在手机上运行 StableDiffusion 资料来源:高通,国盛证券研究所 高通通过与其芯片配套的全栈AI优化方案,将stable diffusion模型从FP32压缩至INT8,显著的降低了运行时延和能耗,从而实现了模型在手机算力上的安全高效推理。高通发布的全栈 AI 工具,包括了 INT8 转化,最小化内存溢出,适配 Hexagon 处理器的 AI 加速等功能,能够让 OEM 厂商快速在高通的算力环境中部署其 AI 应用。图表 5:高通全栈 AI 优化
24、 资料来源:高通,国盛证券研究所 在 5 月,谷歌也发布了其全新的语言大模型 PaLM2,并作为发布会中大部分 AI 功能的基础模型,值得注意的是,PaLM2 是一个拥有众多版本和参数量的模型体系,其包含了4 个不同参数的模型,包括壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据上进行了微调,为企业客户执行某些任务。其中 PaLM 2 的最轻版本 Gecko 足够小,可以在手机上运行,每秒处理 20 个 tokens,大约相当于 16 或 17 个英文单词,谷歌在模型梯度分布上的重视程度,也进一步验证了小模型作为 AI 渗透进入万千场景的
昱能科技-公司首次覆盖报告:光伏组件级电力电子领域开拓者-230221(37页).pdf
港股研究-房地产行业:中国新屋开工面积同比上升-230221(28页).pdf
城建发展-公司研究报告-北京禀赋续成长集团资源助未来-230221(15页).pdf
豪鹏科技-公司研究报告-深耕镍氢电池发力锂电池开拓新增长极-230221(17页).pdf
鸿泉物联-公司研究报告-重卡网联龙头三击共振蓄势待发-230221(15页).pdf
金科服务-港股公司首次覆盖报告:雪暖金花立及时宜自强-230221(33页).pdf
金山办公-公司深度研究:国产办公软件龙头订阅和信创打开长期增长空间-230221(21页).pdf
羚锐制药-公司深度报告:改革弹性体现骨科贴膏龙头-230220(20页).pdf
麦格米特-公司深度报告:电力电子领域平台型企业多极发展打开增长空间-230221(33页).pdf
【公司研究】通信行业:边缘计算、智能集成赋能智能制造软硬件融合-20200816(15页).pdf
边缘计算赋能智能制造-阿里云IoT物联网专场(9页).pdf
计算机行业专题研究:AI应用SAM实现CV底层技术颠覆式创新或将赋能多场景应用-230412(17页).pdf
【研报】金融行业保险科技专题研究(一):始于线上化向前后端赋能迈进-20201115(29页).pdf
传媒行业AI系列:AI赋能数字人变数智人丰富应用场景加速落地-230426(23页).pdf
Open Horizon开源技术赋能行业边缘应用(12页).pdf
计算机行业全行业AI赋能系列深度之四:Wintel生态壁垒是否会在AI芯片领域重演-210906(37页).pdf
【研报】计算机行业:全行业AI赋能系列深度之一AI产业化2021高景气主线-20201231.pdf
【研报】计算机行业全行业AI赋能系列深度之二:明星AI企业评价体系与未来展望-20210104(28页).pdf
化工行业深度报告:AI赋能化工之二AI赋能助力化工行业转型升级-230419(56页).pdf
蜜雪冰城招股说明书-连锁茶饮第一股(724页).pdf
麦肯锡:2023中国消费者报告:韧性时代(33页).pdf
线上健身第一股-keep招股说明书(463页).pdf
罗振宇2023“时间的朋友”跨年演讲完整PDF.pdf
QuestMobile:2022新中产人群洞察报告(37页).pdf
小红书:2023年度生活趋势报告(34页).pdf
QuestMobile:2022年中国短视频直播电商发展洞察报告(30页).pdf
工业4.0俱乐部:ChatGPT认知白皮书(151页).pdf
町芒:2022现制茶饮行业研究报告(47页).pdf
哈尔滨工业大学:ChatGPT调研报告(94页).pdf