《汽车行业智驾系列深度:端到端革命开启强者愈强时代即将来临-240829(36页).pdf》由会员分享,可在线阅读,更多相关《汽车行业智驾系列深度:端到端革命开启强者愈强时代即将来临-240829(36页).pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、 智驾系列深度:端到端革命开启,强者愈强时代即将来临 Table_Industry 汽车行业 Table_ReportDate2024 年 8 月 29 日 请阅读最后一页免责声明及信息披露 2 证券研究报告 行业研究 行业专题研究(深度)行业数据点评 汽车汽车 投资评级投资评级 看好看好 上次评级上次评级 看好看好 Table_Author 陆嘉敏 汽车行业首席分析师 执业编号:S1500522060001 联系电话:13816900611 邮 箱: 徐国铨 汽车行业研究助理 邮 箱: 信达证券股份有限公司 CINDA SECURITIES CO.,LTD 北 京 市 西 城 区 宣 武 门
2、 西 大 街 甲 127 号 金 隅 大 厦B座 邮编:100031 智驾系列深度智驾系列深度:端到端革命端到端革命开启开启,强者愈强,强者愈强时代时代即将即将来临来临 Table_ReportDate 2024 年 8 月 29 日 本期内容提要本期内容提要:智能化时代,自动驾驶能力智能化时代,自动驾驶能力将将重新构筑车企竞争壁垒重新构筑车企竞争壁垒,核心竞争要素,核心竞争要素在于“数据”在于“数据”+“算力”“算力”。背后原因在于:对消费者而言,智能化在消费者选购汽车中的重要性正日益提升。对于车企而言,实现高阶智驾需要大量投入,中小车企将难以持续投入。特别是当智能驾驶算法层面逐渐收敛至“端
3、到端”架构后,数据+算力将成为核心竞争要素,头部车企或供应商能掌握更多更优的“数据”,以及更强更快的“算力”,而优秀的智驾能力有望加强销量转化,最终强化车企马太效应,令智驾强者愈强。相较传统分模块架构,相较传统分模块架构,端到端端到端架构优势显著架构优势显著,核心核心是是“数据驱动”而“数据驱动”而非“规则驱动”,非“规则驱动”,有望有望显著提升智驾上限显著提升智驾上限。所谓“端到端”是指一端输入图像等环境数据信息,中间经历类似“黑箱”的多层神经网络模型,另一端直接输出转向、制动、加速等驾驶指令。与传统规则驱动的分模块架构相比,端到端的实现将带来一系列优势:完全基于数据驱动完全基于数据驱动进行
4、全局任务优化,具备更好、更快的纠错能力;能进一步减少模进行全局任务优化,具备更好、更快的纠错能力;能进一步减少模块间信息的有损传递、延迟和冗余,避免误差累积,提升计算效率;块间信息的有损传递、延迟和冗余,避免误差累积,提升计算效率;泛化能力更强,由泛化能力更强,由 Rule-based 算法转向算法转向 Learning-based,具备零,具备零样本学习能力,面对未知场景样本学习能力,面对未知场景具备更强具备更强决策决策能力能力。端到端发展路径探析:从分模块到端到端发展路径探析:从分模块到一体化一体化。端到端可以简单分为狭义端到端(前端传感器输入、后端控制输出)和广义端到端(信息无损传递、数
5、据驱动整体优化)2 种定义。从端到端的最终实现上,我们认为通过感知“端到端”,模块化“端到端”,再到One Model/单一模型“端到端”是一种相对平滑的过渡形式。而当前感知层“端到端”已经是主流的感知模型,展望后续技术发展,我们认为决策与规控层自动驾驶算法向“端到端”收敛,有望成为行业的一大趋势。“数据“数据+算力”算力”构筑构筑智能智能驾驶驾驶核心核心竞争要素,进入强者竞争要素,进入强者愈愈强强阶段阶段。端到端自动驾驶是数据驱动的模型,因此,训练数据的重要性越来越高。端到端对数据的要求体现在数据量、数据标注、数据质量和数据分布等方面。除了海量高质量数据之外,还需要强大的算力来支撑模型的训练
6、,大部分研发端到端自动驾驶的公司目前的训练算力规模在千卡级别。我们认为领先我们认为领先竞争者竞争者有望通过数据、算力的领先转化为端到端的有望通过数据、算力的领先转化为端到端的算法优势。算法优势。特斯拉特斯拉先行先行,国内外企业加速,国内外企业加速跟进跟进,端到端量产推广在即端到端量产推广在即。端到端主要参与者涵盖了车企、人工智能企业、自动驾驶技术公司机器人公司以及自动驾驶芯片制造商。特斯拉作为先行者,于 24 年初推送端到端版本的 FSD,从实际体验来看,端到端的 FSD 操作更拟人、丝滑。国内主机厂如华为、小鹏、理想、元戎启行、商汤绝影等纷纷跟进,其中9WeZfVeU8XbUeUeUbRdN
7、bRsQrRoMsOfQpPyReRoOmO8OrRzQMYpPqOvPmPoM 请阅读最后一页免责声明及信息披露 3 华为、小鹏端到端进度相对领先。我们认为我们认为因各车企战略选择有差异,因各车企战略选择有差异,端到端路线尚处在百花齐放的阶段,但随着数据、算力等竞争要素逐端到端路线尚处在百花齐放的阶段,但随着数据、算力等竞争要素逐渐赶上,端到端路线有望逐渐收敛至一体化结构,并会结合多模态大渐赶上,端到端路线有望逐渐收敛至一体化结构,并会结合多模态大模型、世界模型等模型、世界模型等,不断,不断加强感知、认知、决策能力。加强感知、认知、决策能力。投资建议投资建议:我们认为以特斯拉为代表的端到端快
8、速迭代有望带来智能驾驶新一轮产业革命,自动驾驶能力将重新构筑车企竞争壁垒,数据+算力将成为核心竞争要素,头部车企或供应商能掌握更多更优的“数据”,以及更强更快的“算力”,而优秀的智驾能力有望加强销量转化,最终强化车企马太效应,头部车企强者愈强时代即将来临。整车整车板块重点关注:1)受益于华为强大智驾能力赋能的鸿蒙智行合作车企以及相关合作伙伴【赛力斯、北汽蓝谷、长安汽车、江淮汽车】;【赛力斯、北汽蓝谷、长安汽车、江淮汽车】;2)汽车保有量大且品牌积淀深厚,智能电动技术布局有望逐步赶上的自主品牌龙头车企【比亚迪、长城汽车】【比亚迪、长城汽车】;3)智能驾驶技术领先的造车新势力【理想汽车、理想汽车、
9、蔚来、蔚来、小鹏汽车】小鹏汽车】;4)全球化布局提速、有望迎来新一轮产品周期、同时在智能驾驶、能源、人形机器人多线并进的全球新能源汽车龙头【特斯拉】。【特斯拉】。零部件零部件板块建议重点关注智能化产业链核心零部件:1)感知层【德赛【德赛西威、保隆科技、华域汽车】西威、保隆科技、华域汽车】等。2)决策层【经纬恒润、均胜电子、【经纬恒润、均胜电子、华阳集团】华阳集团】等。3)执行层【伯特利、中鼎股份、拓普集团、亚太股份、【伯特利、中鼎股份、拓普集团、亚太股份、耐世特、浙江世宝】耐世特、浙江世宝】等。风险因素:风险因素:智能化零部件降本不及预期、智能驾驶利好政策落地不及预期、消费者体验不及预期、技术
10、迭代不及预期、外部宏观环境恶化等。请阅读最后一页免责声明及信息披露 4 目 录 1.总论:端到端有望引领新一轮智能驾驶产业革命.6 1.1 电动智能时代,车企竞争壁垒发生重大迁移.6 1.2 自动驾驶能力将构筑车企新壁垒,核心竞争要素包括数据+算法+算力.6 2.什么是“端到端”?.8 2.1 数据、算力+底层 AI 技术的进一步发展有望助力端到端快速发展与普及.8 2.2 深度神经网络驱动端到端实现“数据驱动”,取代传统“规则驱动”算法.9 2.3 目前的“端到端”自动驾驶包含狭义与广义两种定义.12 2.4 端到端迭代有望实现从“感知”到“决策”到“One Model”平滑过渡.13 3.
11、数据、算力、算法既是端到端落地驱动力,也是落地挑战.14 3.1 数据挑战:获取成本和难度较高,特斯拉目前处于领先.14 3.2 算力挑战:算力竞争重点由车端转向云端,算力需求水涨船高.15 3.3 算法挑战:黑盒算法局限性、验证测试与世界模型.17 4.特斯拉引领端到端智驾算法迭代,国内参与者多点开花.21 4.1 端到端主要参与者包括主机厂、自动驾驶公司与人工智能公司等.21 4.2 特斯拉 FSD V12 落地引领端到端变革.21 4.3 华为、小鹏、理想等车企与供应商纷纷跟进,技术路线有望向“端到端”收敛.24 5.投资建议.33 6.风险因素.34 表 目 录 表 1:2023 年各
12、车企与智驾供应商智能驾驶方案与感知模型应用情况,BEV 全面上车.7 表 2:主流车企、供应商“端到端”量产上车时间规划.8 表 3:各车企辅助驾驶里程累计情况.15 表 4:各车企、智驾供应商智算中心算力布局情况.17 表 5:特斯拉智能驾驶硬件迭代历程(HW1.0-HW4.0).21 表 6:Autopilot/EAP/FSD 主要功能与收费情况.22 表 7:Autopilot/FSD 重要升级内容.22 表 8:HUAWEI ADS 迭代历程.25 图 目 录 图 1:不同汽车时代车企竞争力壁垒变迁.6 图 2:数据+算法+算力构筑起车企自动驾驶能力壁垒.6 图 3:AI 驱动数据闭环
13、逐渐形成.7 图 4:传统自动驾驶架构(Apollo 6.0).10 图 5:神经网络结构(输入层、多个隐藏层、输出层).11 图 6:端到端的主要优势.11 图 7:狭义端到端自动驾驶架构(单一神经网络模型实现感知、决策规划、控制).12 图 8:广义端到端自动驾驶架构(神经网络模型实现感知与决策规划,不包括控制模块).12 图 9:广义端到端自动驾驶架构(感知和决策规划使用神经网络,模块之间仍有人工设计的数据接口).13 图 10:端到端自动驾驶架构演进示意图.14 图 11:端到端对数据的要求.14 图 12:英伟达 H100、H800、A100、A800 与 4090 显卡参数对比.1
14、6 图 13:多种方式增强模型设计的可解释性.17 图 14:小鹏模块化端到端算法架构.18 图 15:理想端到端算法架构.18 图 16:在线/闭环测试与离线/开环测试的主要特点与优缺点.19 请阅读最后一页免责声明及信息披露 5 图 17:2D/3D 检测、BEV、OCC、世界模型空间理解能力与真实世界的对比.20 图 18:端到端主要参与者与技术路线.21 图 19:特斯拉自动驾驶算法结构迭代历程.22 图 20:特斯拉通过影子模式、数据标注、数据挖掘与训练等环节实现数据闭环.23 图 21:百度与特斯拉达成地图合作.24 图 22:FSD Beta 累计行驶里程(十亿英里).24 图
15、23:华为 ADS 2.0 BEV+GOD+RCR 网络.25 图 24:华为 ADS 3.0 GOD+PDP 网络.26 图 25:小鹏智驾端到端大模型架构.27 图 26:2024 年小鹏智驾推送规划.27 图 27:理想 4D One Model 端到端架构图.28 图 28:理想 VLM(Visual Language Model,视觉语言模型)架构图.29 图 29:理想汽车的自动驾驶系统考试方案:重建+生成的世界模型.29 图 30:常规端到端与蔚来世界模型 NWM 的对比.30 图 31:蔚来智能驾驶架构 NADArch 2.0.31 图 32:百度 Apollo ADFM 端到
16、端大模型.31 图 33:商汤绝影 UniAD 架构演进历程.32 图 34:商汤绝影多模态场景大脑 DriveAGI.32 图 35:元戎启行端到端模型技术变迁.33 请阅读最后一页免责声明及信息披露 6 1.总论:端到端有望引领新一轮智能驾驶产业革命 1.1 电动智能时代,车企竞争壁垒发生重大迁移 燃油车时代,车企壁垒在于自研燃油车时代,车企壁垒在于自研三大件(发动机三大件(发动机+变速箱变速箱+底盘),由于机械结构复杂且外资车底盘),由于机械结构复杂且外资车企经过百年积淀,技术及专利储备雄厚,自主品牌较难逾越技术壁垒,更难以实现品牌跃升,企经过百年积淀,技术及专利储备雄厚,自主品牌较难逾
17、越技术壁垒,更难以实现品牌跃升,因此燃油车造车门槛高、因此燃油车造车门槛高、参与者参与者相对较少、市场份额为外资相对较少、市场份额为外资/合资品牌把控。合资品牌把控。电动化时代,汽车结构大幅简化,且电动车核心三电(电池电动化时代,汽车结构大幅简化,且电动车核心三电(电池+电机电机+电控)均有成熟供应商方案电控)均有成熟供应商方案可供采购,因此可供采购,因此在电动化初期,在电动化初期,造车门槛大幅下降,行业进入百家争鸣时代。造车门槛大幅下降,行业进入百家争鸣时代。智能化时代,智能化时代,我们认为我们认为自动驾驶能力自动驾驶能力将将重新构筑车企竞争壁垒。重新构筑车企竞争壁垒。核心原因如下:智能化在
18、消费者选购汽车中的重要性日益提升。实现高阶智驾需要在数据、算力层面的大量投入,中小车企或难以承受。当算法层面逐渐收敛至“端到端”,数据+算力将成为核心竞争要素,有望“强者愈强”。图图 1:不同汽车时代车企竞争力壁垒变迁不同汽车时代车企竞争力壁垒变迁 资料来源:信达证券研发中心整理 1.2 自动驾驶能力将构筑车企新壁垒,核心竞争要素包括数据+算法+算力 自动驾驶与自动驾驶与 AI 应用类似,应用类似,算法、算力和数据是三大算法、算力和数据是三大核心竞争核心竞争要素要素。我们认为把握数据、算力、算法三大核心竞争要素的车企有望率先取得智驾层面的领先优势。图图 2:数据数据+算法算法+算力构筑起车企自
19、动驾驶能力壁垒算力构筑起车企自动驾驶能力壁垒 资料来源:信达证券研发中心整理 数据:数据:AI 驱动数据闭环逐渐形成驱动数据闭环逐渐形成,数据体量、质量要求日益提升,数据体量、质量要求日益提升。自动驾驶概念中的数据主要包括视觉传感器采集的数据,以及车辆状态信息、油门、刹车等数据,经过各类元件与电路处理后得到有用的电信号,最后用于云端存储、数据标注、模型训练、仿真测试等环节。在在端到端到端等端等人工智能技术加持下,数据筛选、标注、训练、验证逐渐形成全链路闭环,加速智能驾驶人工智能技术加持下,数据筛选、标注、训练、验证逐渐形成全链路闭环,加速智能驾驶解决方案解决方案迭代。迭代。随着技术迭代,对于智
20、驾数据体量、质量的需求随着技术迭代,对于智驾数据体量、质量的需求也在也在持续提升,持续提升,目前目前以特斯拉以特斯拉、鸿蒙鸿蒙智行智行等等为代表的各家车企为代表的各家车企开始开始使用使用智能驾驶累计智能驾驶累计使用使用里程里程来反映各自在自动驾驶领域的来反映各自在自动驾驶领域的 请阅读最后一页免责声明及信息披露 7 数据收集与测试能力。数据收集与测试能力。图图 3:AI 驱动数据闭环逐渐形成驱动数据闭环逐渐形成 资料来源:甲子光年微信公众号,信达证券研发中心 算力:端到端模型更加依赖规模法则(算力:端到端模型更加依赖规模法则(Scaling Law),新一轮算力军备竞赛在),新一轮算力军备竞赛
21、在车端与云端共车端与云端共同同展开。展开。Scaling Law 认为通过更多数据量训练、扩大模型规模以及延长训练时间,大模型性能可以持续提升,端到端模型与大模型高度相似,数据驱动的开发形式让模型高度依赖算力规模来提升迭代速率。车端算力车端算力主要的特点是低延迟、高可靠性,当前主流方案为单/双 Nvidia Orin X 芯片,算力为 254/508TOPS;下一代 Thor 芯片算力或提升至 2000TOPS,近日联想已发布基于 Thor 的域控解决方案,更高车端算力平台的落地进程有望逐步加快。云端算力云端算力需要承担复杂的训练任务和海量的数据处理,对功耗和成本的要求相对车端宽松,但算力更高
22、,目前众多车企通过自建算力中心或购买智能计算云服务来实现云端算力布局。算法:算法从规则走向神经网络,从模块化走向端到端。算法:算法从规则走向神经网络,从模块化走向端到端。自动驾驶诞生以来,伴随着算法架构的不断进化,自动驾驶算法也几经迭代。2021 年开始,特斯拉展示了基于 BEV+Transformer的自动驾驶感知新范式,国内众多车企也纷纷跟进,进一步加速了城市 NOA 落地进程。2023年 12 月特斯拉发布 FSD Beta V12 引入端到端概念之后,众多车企和智驾公司也开始转向端到端技术的研发和量产工作,以大量人类驾驶数据+深度神经网络为基础,未来智能驾驶体验逐步向着更加拟人化的方向
23、迈进。表表 1 1:20232023 年各车企与智驾供应商智能驾驶方案与感知模型应用情况年各车企与智驾供应商智能驾驶方案与感知模型应用情况,BEVBEV 全面上车全面上车 车企车企 智能驾驶系统智能驾驶系统 数据融合方案数据融合方案 感知模型感知模型 传感器传感器 芯片供芯片供应商应商 芯片芯片 算力算力 特斯拉特斯拉 FSD(HW4.0)数据级融合 BEV+Transformer+Occupancy 7V 自研 FSD 芯片 720TOPS 比亚迪比亚迪 DNP 特征级融合 BEV+Transformer 11V5R 地平线 征程 5 128TOPS 小鹏小鹏 XNGP/Xpilot 特征级
24、融合 Xnet(BEV+Transformer)11V12U5R(高配 2L)英伟达 Orin-X 254TOPS 理想理想 AD MAX 3.0 特征级融合 静态 BEV+动态BEV+Transformer+NPN+TIN 11V12U1R1L 英伟达 Orin-X 254TOPS 蔚来蔚来 NAD/NOP+-BEV+Occupancy 11V12U5R1L 英伟达 Orin-X 254TOPS 哪吒哪吒 NETA PILOT4.0-BEV 11V12U5R2L 华为 MDC610 200TOPS 飞凡飞凡 PP-CEM 2.0 数据级融合+目标级融合 BEV 11V12U4R1L 英伟达
25、Orin-X 254TOPS 华为华为 ADS2.0-BEV+Transformer+GOD 网络-自研 MDC610 预估200TOPS 请阅读最后一页免责声明及信息披露 8 毫末智行毫末智行 Hpilot3.0-BEV+Transformer+Drive GPT-可适配多种芯片 百度百度 Apollo ANP3.0 目标级融合 BEV 环视三维感知+文心大模型+UniBEV 车路一体解决方案-英伟达 Orin-X 254TOPS 商汤商汤 SenseAuto ADAS Pilot-环视感知算法 BEV Former-可适配多种芯片 地平线地平线-BEV-自研 征程 5 128TOPS 元戎
26、启行元戎启行 D-Pro 数据级融合 BEV-英伟达 Orin-X 254TOPS 觉非科技觉非科技 数据闭环融合智驾解决方案 数据级融合 BEV-可适配多种芯片 小马智行小马智行 第六代 L4 智能驾驶软硬件系统-BEV-可适配多种芯片 资料来源:亿欧汽车微信公众号,电车通微信公众号,信达证券研发中心 总体而言,我们认为从基于规则逐步转向基于神经网络,从小规模、模块化的算法走向基于大总体而言,我们认为从基于规则逐步转向基于神经网络,从小规模、模块化的算法走向基于大规模神经网络、端到端的自动驾驶算法架构为未来智能驾驶算法主要的发展路径。规模神经网络、端到端的自动驾驶算法架构为未来智能驾驶算法主
27、要的发展路径。在算法演进在算法演进路径逐步收敛之后,工程化落地能力或将逐步成为车企智能驾驶软实力的重要组成部分。路径逐步收敛之后,工程化落地能力或将逐步成为车企智能驾驶软实力的重要组成部分。2.什么是“端到端”?2.1 数据、算力+底层 AI 技术的进一步发展有望助力端到端快速发展与普及 端到端概念端到端概念最早源于通信领域最早源于通信领域。其基本含义是网络只负责为终端之间提供连接,无论终端之间的连接距离、连接机器数量、连接系统与路线是怎样的,两端之间一定要建立联系,连接建立后即表示端到端的连接已完成。底层底层 AI 技术技术的的逐渐成熟,有望逐渐成熟,有望带来自动驾驶技术带来自动驾驶技术新一
28、轮发展与普及新一轮发展与普及。在人工智能领域,基于深度神经网络的端到端是普遍使用的方法。深度学习具有出色的模式识别和特征提取能力,主要用于图像分类、目标检测、人脸识别、图像分割、视频分析等场景。在各种 AI 翻译、语音转文字等 AI 应用中,基本都使用了端到端的思想,原始数据被送进一张神经网络中,经过一系列运算后给出最终结果。除了以上场景,除了以上场景,我们认为智能驾驶我们认为智能驾驶也也是是 AI 技术中重要的应用场景,技术中重要的应用场景,并并且且出于出于安全性、稳定性等要求,安全性、稳定性等要求,在底层在底层 AI 技术逐渐技术逐渐趋于趋于成熟之成熟之时时,端到端赋能的端到端赋能的自动驾
29、驶技自动驾驶技术有望新一轮发展与普及。术有望新一轮发展与普及。2023 年以来,端到端在年以来,端到端在自动驾驶自动驾驶学界学界与与产业界的热度快速提升。学术研究方面产业界的热度快速提升。学术研究方面,2023 年 6 月,上海人工智能实验室提出的 UniAD(Unified Autonomous Driving)获 CVPR 2023 最佳论文,行业对于端到端的关注度开始提升。产业落地方面产业落地方面,特斯拉特斯拉 FSD(Full Self Driving)V12 全面升级端到端技术架构,国内以鸿蒙智行、小鹏汽车、理想汽车鸿蒙智行、小鹏汽车、理想汽车为代表的主机厂以及华为、元戎华为、元戎启
30、行、商汤绝影、百度启行、商汤绝影、百度等为代表的智能驾驶技术公司纷纷投入端到端系统研发,量产上车规划也陆续对外披露。表表 2 2:主流车企、供应商主流车企、供应商“端到端”量产上车时间规划“端到端”量产上车时间规划 车企车企/供应商供应商 时间时间 主要事件主要事件 特斯拉特斯拉 2024 年 1 月下旬 特斯拉面向普通用户正式推送了 FSD V12 的测试版本 2024 年 3 月 特斯拉发布 FSD V12 版本 2024 年 3 月 18 日 FSD V12.3 版本美地区更新推送 2024Q1 公司已经有 35000 张 H100 GPU 2024 年 4 月底 马斯克“闪电式”访华推
31、动特斯拉 FSD 进入中国市场 2024 年 10 月 总算力将达到 100EFLOPs 请阅读最后一页免责声明及信息披露 9 华为华为 2024 年 4 月 24 日 华为乾崑发布,算力已达到 3.5EFLOPS 2024 年 8 月 ADS 3.0 端到端架构于 8 月随享界 S9 正式上市,云端算力大 5EFLOPS 小鹏小鹏 2024 年 5 月 端到端模型已于 5 月开始推送 2024 年 7 月 4 日 小鹏 XNGP 智驾 XOS 5.2.0 公测版本已开启推送 2024 年 Q3 实现“全国都能开,每条路都能开”2024 年 与阿里云共建了扶摇智算中心,算力可达 600PFLO
32、PS,今年投入 1 亿美元用于算力建设 2025 年 实现城区智驾比肩高速智驾体验 2025 年 在中国实现类 L4 级智驾体验 未来 18 个月内 智驾能力提升 30 倍 理想理想 2024 年 7 月 5 日 召开智驾发布会,NOA 功能等将在本月内(7 月)全面推送 2024 年 8 月 云端算力已达到 4.5EFLOPS 2024 年 Q3 向所有用户推送全国无图 NOA(导航辅助驾驶)功能 2024 年底-2025 年初 推出更完善的自动驾驶体系,提供监督型 L3 级自动驾驶体验 元戎启行元戎启行 2024 年 3 月 17 日 已经成功将端到端模型适配到量产车上 2024 年 3
33、月 20 日 与 NVIDIA 达成合作,是业内首批能用 DRIVE Thor 芯片适配端到端模型的企业。2024 年 3 月 元戎启行端到端自动驾驶方案已经获得长城汽车的定点项目,并与英伟达开展合作 2024 年 4 月 25 日 对外展示了即将量产的高阶智驾平台 DeepRoute IO 以及基于 DeepRoute IO 的端到端解决方案 2024 年 将有万辆级别搭载元戎启行系统的量产车进入消费者市场 2025 年 将于 2025 年采用英伟达的 DRIVE Thor 芯片适配公司的端到端智能驾驶模型 商汤绝影商汤绝影 2024 年 4 月 25 日 面向量产的真端到端自动驾驶解决方案
34、 UniAD 在北京车展上完成上车演示首秀 2024 年底 算力达到 18000PFLOPS 2025 年 端到端大模型上车 零一汽车零一汽车 2024 年 端到端自动驾驶系统今年会搭载旗下车型量产 2024 年底 实现端到端自动驾驶的部署上车 2025 年 在商用车与乘用车平台上同时实现量产 2026 年 实现高阶自动驾驶的大规模商业化运营 wayvewayve 2024 年 5 月 获得 10.5 亿美元融资,已完成三轮融资,累计融资金额超过 13 亿美元 2024 年 5 月后 Wayve 将加速推出首款用于量产车辆的自动驾驶软件 2024 年 Wayve 已经在全球 100 多个城市开
35、始了系统测试 2024 年 对互联网规模的文本和其他来源进行训练 行业预测行业预测 20252025 年年 国内自动驾驶公司的模块化端到端方案上车量产时间可能会在国内自动驾驶公司的模块化端到端方案上车量产时间可能会在 20252025 年年 20262026-20272027 年年 One One ModelModel 端到端系统中性预期落地时间会晚于模块化端到端端到端系统中性预期落地时间会晚于模块化端到端 1212 年时间,从年时间,从 20262026 年至年至 20272027 年开年开始上车量产。始上车量产。20302030 年前后年前后 逐步走向普及的阶段逐步走向普及的阶段 资料来源
36、:每日经济新闻,42 号车库微信公众号,中国基金报微信公众号,赛博汽车微信公众号,My 车轱辘微信公众号,汽车之心微信公众号,电动汽车观察家微信公众号,NE 时代智能车微信公众号,盖世汽车社区微信公众号,财联社,中国经济网,电车通微信公众号,36 氪微信公众号,钛度车库微信公众号,界面新闻,经济观察报,佐思汽车研究微信公众号,绝影智能 SenseAuto 微信公众号,36 氪汽车微信公众号,高工智能汽车微信公众号,HiEV 大蒜粒车研所微信公众号,信达证券研发中心 2.2 深度神经网络驱动端到端实现“数据驱动”,取代传统“规则驱动”算法 传统的自动驾驶架构可以理解为分模块架构,包含感知(传统的
37、自动驾驶架构可以理解为分模块架构,包含感知(Perception)、定位()、定位(Localization)、)、预测(预测(Prediction)、决策与规划()、决策与规划(Decision and Planning)、控制()、控制(Control)等。)等。感知端感知端输入摄像头、激光雷达等传感器信息,能够感知到车辆周围的障碍物、车辆、车道线、红绿灯等元素;然后感知信息会进一步汇总传递给规划模型,规划模型规划出车辆最佳行驶路线;再交给控制模块,实现车辆最终的控制。请阅读最后一页免责声明及信息披露 10 传统的模块化架构将自动驾驶分为多个子模块传统的模块化架构将自动驾驶分为多个子模块,
38、具有较高的稳定性与可解释性具有较高的稳定性与可解释性。传统自动驾驶架构各模块有独立的算法,例如目前市面上大部分智驾系统中的感知模块使用的是神经网络,处于下游的规划模型需要依赖工程师编写大量代码去制定行驶规则。这种架构的这种架构的优优势在于势在于独立独立开发开发利于分工利于分工,出现问题出现问题时时便于分模块检查与解决便于分模块检查与解决,具有较高的稳定性与可解释性,具有较高的稳定性与可解释性。分模块的分模块的局限性在于局限性在于:首先首先,基于基于人为制定人为制定规则的方式无法穷尽所有的道路状况,特别是极端规则的方式无法穷尽所有的道路状况,特别是极端状况状况(corner case)下下,会提
39、升决策规划控制的难度。其次,分模块方案的会提升决策规划控制的难度。其次,分模块方案的信信息流转的层级息流转的层级较较多、传递的链路多、传递的链路较较长,长,所以信息所以信息失真情况失真情况会更会更严重,各模块之间传递的信息会出现有损压缩,严重,各模块之间传递的信息会出现有损压缩,传递时会累计误差,还会面临并行模块信息相互干扰的问题。传递时会累计误差,还会面临并行模块信息相互干扰的问题。图图 4:传统自动驾驶架构(传统自动驾驶架构(Apollo 6.0)资料来源:Apollo Auto,辰韬资本端到端自动驾驶行业研究报告,信达证券研发中心 与传统自动驾驶算法结构相比,端到端与传统自动驾驶算法结构
40、相比,端到端定义尚未统一定义尚未统一,其主要特点在于深度其主要特点在于深度学习学习的全面使用与的全面使用与数据驱动。数据驱动。深度学习是一种机器学习方法,其目标是通过构建多层神经网络来模拟人脑的工作原理,让机深度学习是一种机器学习方法,其目标是通过构建多层神经网络来模拟人脑的工作原理,让机器能够从大量的数据中自动学习和提取特征,从而实现智能化的数据处理和决策。器能够从大量的数据中自动学习和提取特征,从而实现智能化的数据处理和决策。神经网络是深度学习的核心组成部分,深度学习采用多层神经网络模型,其中包含输入层、多个隐藏层和输出层。输入层:输入层:负责接收原始数据(如视频、图像等),并将其转化为可
41、以被隐藏层处理的格式。隐藏层:隐藏层:主要是对输入数据应用一组权重和偏差,从输入数据中提取对当前任务更有意义的高级特征,根据任务复杂程度,可以选择单层或者多层隐藏层。输出层:输出层:输出隐藏层的处理结果。请阅读最后一页免责声明及信息披露 11 图图 5:神经网络结构(输入层、多个隐藏层、输出层):神经网络结构(输入层、多个隐藏层、输出层)资料来源:数据之书微信公众号,信达证券研发中心 神经网络的主要训练过程包括前向传播与反向传播,神经网络的主要训练过程包括前向传播与反向传播,可以在训练过程中可以在训练过程中实现实现自行学习与改进。自行学习与改进。前向传播前向传播是将输入数据通过神经网络生成输出
42、的过程。它涉及计算网络每一层中每个神经元的输出,通过将权重权重和偏差偏差应用于输入并通过激活函数激活函数传递结果来完成。反向传播通过计算损失损失函数函数的梯度梯度,反向传播允许神经网络以减小训练过程中的整体误差或损失的方式更新其权重。深度神经网络深度神经网络的训练过程表明其可以的训练过程表明其可以直接从数据中学习特征直接从数据中学习特征,并,并自行学习和改进,自行学习和改进,在自动驾驶在自动驾驶算法中可以算法中可以去掉人工编写的规则,实现数据驱动。去掉人工编写的规则,实现数据驱动。神经网络更适合处理大型数据集,与传统机器学习需要手动提供特征不同,我们可以直接向算法投喂高水平人类司机真实的驾驶视
43、频数据,通过反复训练使算法理解并学习高水平司机的驾驶习惯,输出正确的行驶轨迹,从真实数据中学习如何开车,最终实现数据驱动。综上所述,通过神经网络实现的综上所述,通过神经网络实现的端到端自动驾驶优势端到端自动驾驶优势包括包括:完全基于数据驱动进行全局任务优化,具备更好、更快的纠错能力;传统分模块的架构被进一步压缩,能进一步减少模块间信息的有损传递、延迟和冗余,避免误差累积,提升计算效率;泛化能力更强,由 Rule-based算法转向 Learning-based,具备零样本学习能力,面对未知场景仍可正确决策,智能驾驶的上限会比传统架构更高。图图 6:端到端端到端的主要优势的主要优势 资料来源:甲
44、子光年微信公众号,焉知新能源汽车微信公众号,司普科技微信公众号,信达证券研发中心 请阅读最后一页免责声明及信息披露 12 2.3 目前的“端到端”自动驾驶包含狭义与广义两种定义 目前端到端目前端到端自动驾驶自动驾驶的定义可以简单分为狭义端到端和广义端到端。的定义可以简单分为狭义端到端和广义端到端。狭义端到端:狭义端到端:传感器数据进入神经网络处理后,直接输出方向盘、油门、刹车等执行器的控制信号,该模式通过单一神经网络模型实现,是严格意义上的端到端。图图 7:狭义端到端狭义端到端自动驾驶自动驾驶架构(架构(单一神经网络模型实现感知、决策规划、控制单一神经网络模型实现感知、决策规划、控制)资料来源
45、:远川汽车评论微信公众号,信达证券研发中心 广义端到端:广义端到端:广义上的端到端具有两个特点信息无损传递;可以实现数据驱动的整体优化。从广义角度理解端到端,可以看到目前主流的方案仍有差异。主要方案包括通过主要方案包括通过神经网络模型神经网络模型实现感知与决策规划,不包括控制模块实现感知与决策规划,不包括控制模块;感知和决策规划使用神经网络,模块之间仍有人工设感知和决策规划使用神经网络,模块之间仍有人工设计的数据接口计的数据接口等方式。等方式。图图 8:广义广义端到端自动驾驶架构(神经网络模型端到端自动驾驶架构(神经网络模型实现实现感知与决策规划感知与决策规划,不包括控制模块,不包括控制模块)
46、资料来源:远川汽车评论微信公众号,信达证券研发中心 请阅读最后一页免责声明及信息披露 13 图图 9:广义广义端到端自动驾驶架构(感知端到端自动驾驶架构(感知和和决策规划决策规划使用使用神经网络神经网络,模块,模块之间仍有人工设计之间仍有人工设计的的数据接口数据接口)资料来源:远川汽车评论微信公众号,信达证券研发中心 2.4 端到端迭代有望实现从“感知”到“决策”到“One Model”平滑过渡 从端到端的最终实现上,我们认为通过从端到端的最终实现上,我们认为通过感知“端到端”感知“端到端”,模块化“端到端”,再到,模块化“端到端”,再到One Model/单一模型单一模型“端到端端到端”是一
47、种相对平滑的过渡形式。而当前是一种相对平滑的过渡形式。而当前感知“端到端”感知“端到端”已经已经是主流的是主流的感知模型,感知模型,展望后续技术发展,展望后续技术发展,我们认为自动驾驶算法向“端到端”收敛,有望成为行业的一我们认为自动驾驶算法向“端到端”收敛,有望成为行业的一大趋势。大趋势。不同迭代阶段之间的区别:不同迭代阶段之间的区别:感知“端到端”:感知“端到端”:当前的主流感知算法路线大多数都是用神经网络模型,通过基于多传感器融合的 BEV(Bird Eye View,鸟瞰图视角)+Transformer 基本实现了感知模块的端到端,感知输出检测结果的精度及稳定性相对之前的感知方案都有比
48、较大的提升,但在决策规划控制模块仍然以 rule-based 为主1。模块化“端到端”模块化“端到端”:与感知“端到端”相比,感知端算法没有太大变化,决策规划控制模块有望通过深度学习实现,取代原有的 rule-based 方案,从这一阶段开始,端到端的雏形逐渐形成。并且感知与决策规划控制模块之间的数据传递有望由人为定义的结果抽象为特征向量,避免数据损耗与误差累计等问题,决策规划控制模块的综合模型基于特征向量输出运动规划的结果2。One Model/单一模型单一模型“端到端端到端”:这一阶段不再有感知、决策规划等模块的明确划分。从原始信号输入到最终规划轨迹的输出直接采用单一深度神经网络实现。On
49、e Model 可以基于强化学习(Reinforcement Learning,RL)或模仿学习(Imitation Learning,IL)的端到端模型,也可以通过世界模型这类生成式模型衍生3。1 资料来源:辰韬资本端到端自动驾驶行业研究报告 2 资料来源:辰韬资本端到端自动驾驶行业研究报告 3 资料来源:辰韬资本端到端自动驾驶行业研究报告 请阅读最后一页免责声明及信息披露 14 图图 10:端到端:端到端自动驾驶架构演进示意图自动驾驶架构演进示意图 资料来源:辰韬资本端到端自动驾驶行业研究报告,信达证券研发中心 3.数据、算力、算法既是端到端落地驱动力,也是落地挑战 3.1 数据挑战:获取
50、成本和难度较高,特斯拉目前处于领先 端到端自动驾驶端到端自动驾驶及用途神经网络实现及用途神经网络实现数据驱动,数据驱动,因此用于因此用于训练训练的的数据数据要求要求越来越高。越来越高。端到端对训练数据的要求主要体现在数据量、数据标注、数据质量和数据分布等方面4。图图 11:端到端对数据的要求端到端对数据的要求 资料来源:辰韬资本端到端自动驾驶行业研究报告,信达证券研发中心 分车企看,特斯拉在数据规模层面处于领先地位。分车企看,特斯拉在数据规模层面处于领先地位。与大语言模型可以在互联网上爬取海量文字数据用于训练不同,端到端智驾需要的视频数据获取成本和难度较高。对于车企而言,我们认对于车企而言,我
51、们认为决定自动驾驶训练数据的重要因素包括目前能够稳定收集数据的车辆总数、以及车企智驾车为决定自动驾驶训练数据的重要因素包括目前能够稳定收集数据的车辆总数、以及车企智驾车型比例,这与车企型比例,这与车企自研实力、综合自研实力、综合产品力、产品力、资金投入、智驾车型资金投入、智驾车型销量息息相关。销量息息相关。根据车企公布的数据,根据车企公布的数据,截至 2023 年年初,特斯拉特斯拉 FSD 在北美的累计测试车辆数在 40 万辆左 4 资料来源:辰韬资本端到端自动驾驶行业研究报告 请阅读最后一页免责声明及信息披露 15 右,到今年 3 月,已经达到 180 万辆。据华为华为预计,截至 2024
52、年底,搭载华为智驾系统车型保有量将突破 50 万台。截至 2024 年 7 月份,理想理想累计交付超过 87 万辆万辆,其中有 99%的用户使用过辅助驾驶。截止 2024 年 7 月份,蔚来蔚来智能驾驶总用户数达 55.8 万人万人,NOP+总用户数总用户数达达 30.8 万人万人。2024 年上半年,小鹏小鹏 XNGP 的智能导航辅助驾驶的用户渗透率达到了 95.87%。表表 3 3:各车企辅助驾驶里程累计情况各车企辅助驾驶里程累计情况 特斯拉特斯拉 鸿蒙智行鸿蒙智行 理想理想 蔚来蔚来 小鹏小鹏 超过 16 亿英里(截止 2024 年中报)4.6 亿公里(截止 2024 年 8 月)20.
53、6 亿公里(截止 2024 年 7 月)11.12 亿公里(截止 2024 年 7 月)756 万公里(实车测试里程,截止2024 年 7 月)资料来源:特斯拉财报,42号车库官方微博,理想汽车微信公众号,第一财经微信公众号,小鹏汽车微信公众号,信达证券研发中心 对于智驾供应商而言,数据获取难度会更大对于智驾供应商而言,数据获取难度会更大。此前国内上海AI lab浦驾团队搜罗了整个Youtube,才最终搭建了一个 2000 小时的数据集 OpenDV-2K。在 2023 年特斯拉端到端神经网络开发之初,就投喂了 1000 万个经过筛选的人类驾驶视频片段,即使以每段 15 秒计,这也是超过 4
54、万小时的高清视频。3.2 算力挑战:算力竞争重点由车端转向云端,算力需求水涨船高 端到端与端到端与 ChatGPT 等生成式大语言模型类似,除了海量高质量数据之外,还需要强大的算力等生成式大语言模型类似,除了海量高质量数据之外,还需要强大的算力来支撑模型的训练。来支撑模型的训练。过去几年,以英伟达、地平线、Mobileye 等为代表的车端算力芯片受到行业高度关注。随着汽车智能化的竞争重点从算法转向数据和算力,云端算力或将成为车企未来几年竞争的关键。算力即计算的能力,狭义定义算力即计算的能力,狭义定义是一台计算机理论上具备的最大每秒浮点运算次数(FLOPS)。广义定义广义定义是计算机设备或计算/
55、数据中心处理信息的能力,是计算机硬件和软件配合共同执行某种计算需求的能力。除了运算能力之外,还包括数据存储与访问能力、与外界的数据交换能力、数据显示能力等。算力的基础是各类高性能计算芯片。算力的基础是各类高性能计算芯片。计算芯片主要包括 CPU(中央处理器)和 GPU(图形处理器)。CPU 是计算设备的运算和控制核心,适合处理逻辑复杂的串行任务。GPU 早期主要用来加速图像计算任务,由于其更加侧重计算而非逻辑控制,并能很好地支持并行计算,成为目前提供算力的主要芯片。因此目前大算力因此目前大算力 GPU(英伟达(英伟达 H100、H800、A100、A800 等等)的的储备情况往往成为衡量训练算
56、力资源的重要依据。储备情况往往成为衡量训练算力资源的重要依据。请阅读最后一页免责声明及信息披露 16 图图 12:英伟达英伟达 H100、H800、A100、A800 与与 4090 显卡参数对比显卡参数对比 资料来源:IDC 观察微信公众号,信达证券研发中心 注:与智算中心或者 AI 相关的算力参考 FP16。FLOPS(Floating Point Operations Per Second):每秒浮点运算次数。这是衡量算力的基本单位,常见的有 MFLOPS(百万次/秒)、GFLOPS(十亿次/秒)、TFLOPS(万亿次/秒)、PFLOPS(千万亿次/秒)、EFLOPS(百亿亿次/秒)国内
57、、厂商与特斯拉国内、厂商与特斯拉超算超算中心的算力水平差距较大,另外还有中心的算力水平差距较大,另外还有 GPU 采购的难题。采购的难题。大部分研发端到端自动驾驶的公司目前的训练算力规模在千卡级别,国内算力布局领先的车企与供应商包括商汤、华为、理想、小鹏商汤、华为、理想、小鹏等。特斯拉特斯拉近年来不断增加训练算力投入,2024Q1 财报电话会上特斯拉表示,公司已经有 35000 张 H100GPU,并计划在 2024 年内增加到 85000 张 H100 以上,届时总算力有望达到 100EFLOPS。此前,特斯拉还部署了规模更大的 A100GPU 训练集群,其实际训练算力投入在自动驾驶行业中大
58、幅领先其他参与者5。我们认为我们认为当算法层面逐渐收敛至“端到端”,数据当算法层面逐渐收敛至“端到端”,数据+算力将成为核心竞争要素,以特斯拉、华算力将成为核心竞争要素,以特斯拉、华为为、理想、理想为代表的智能驾驶与整车交付领先为代表的智能驾驶与整车交付领先以及算力储备领先企业以及算力储备领先企业有望“强者有望“强者愈愈强”。强”。5 资料来源:辰韬资本端到端自动驾驶行业研究报告 请阅读最后一页免责声明及信息披露 17 表表 4 4:各车企、智驾供应商智算中心算力布局情况各车企、智驾供应商智算中心算力布局情况 企业类型企业类型 企业名称企业名称 算力布局算力布局 车企车企 特斯拉特斯拉 100
59、EFLOPS(2024 年 10 月)理想理想 4.5EFLOPS 小鹏小鹏 2.5EFLOPS 长城长城 1.64EFLOPS 长安长安 1.42EFLOPS 蔚来蔚来 1.4EFLOPS 吉利吉利 0.81EFLOPS 智驾供应商智驾供应商 商汤商汤 12EFLOPS(年底 20EFLOPS)华为华为 5EFLOPS 百度百度 1.8-2.2EFLOPS 资料来源:汽车之心微信公众号、NE时代智能车微信公众号、36氪汽车微信公众号、智能车参考微信公众号,信达证券研发中心 车端算力或并非端到端落地的主要矛盾。车端算力或并非端到端落地的主要矛盾。首先,目前以英伟达 Orin 为代表的大算力车载
60、芯片已经支持 BEV+Transformer 模型的部署,并且架构从传统模块化到端到端后,总代码数量会显著降低,因此端到端带来的车端算力需求相比 BEV 模型并不一定会有显著的提升,更多的需求可能来自模型参数量和模型性能的提升。其次,高算力芯片与算法一直处于动态演化的过程中,相比于对更大算力的需求,基于现有算力芯片优化端到端模型实现更高效部署可能是更容易实现的方案。目前行业头部竞争者如英伟达、华为、地平线、蔚来、Momenta 都在逐渐走向软硬一体,针对自研模型定制化开发更匹配的计算芯片,可以做到最大程度的优化6。3.3 算法挑战:黑盒算法局限性、验证测试与世界模型 3.3.1 黑盒算法局限性
61、黑盒算法局限性:不可解释性、灾难性遗忘等问题易造成端到端算法上限高、下限低不可解释性、灾难性遗忘等问题易造成端到端算法上限高、下限低 端到端端到端的的“黑盒”属性“黑盒”属性导致其导致其具有不可解释性。具有不可解释性。可解释性在自动驾驶中很重要,它有利于工程测试和系统改进,还能从社会角度提供性能安全保证,增加民众对自动驾驶的接受度。但神经网络的先天缺点是不可解释性,也叫“黑盒”属性。通俗理解就是向神经网络输入数据并得出正确的计算结果,但我们并不知道结果是如何计算出来的。神经网络的“黑盒”属性会对智驾的安全性带来影响。根据根据 Li Chen 等等发表的发表的论文论文End-to-end Aut
62、onomous Driving:Challenges and Frontiers,可以通过,可以通过多种方式多种方式增强模型设计增强模型设计的的可解释性。可解释性。图图 13:多种方式增强模型设计的可解释性多种方式增强模型设计的可解释性 资料来源:Li Chen 等End-to-end Autonomous Driving:Challenges and Frontiers,深蓝 AI 微信公众号,信达证券研发中心 6 资料来源:辰韬资本端到端自动驾驶行业研究报告 请阅读最后一页免责声明及信息披露 18 在已公布的解决方案中,在已公布的解决方案中,华为和华为和小鹏采用了小鹏采用了模块化模块化端到
63、端的渐进式路线端到端的渐进式路线:模块间有人类定义的接口,便于人类解读中间结果,并检查、定位问题,并且串联两个较小的模型可以使得训练难度更低、消耗算力更小,落地时间更快。图图 14:小鹏模块化端到端小鹏模块化端到端算法架构算法架构 资料来源:远川汽车评论微信公众号,远川研究所微信公众号,信达证券研发中心 理想通过理想通过并联并联一个一个 22 亿参数规模的亿参数规模的 VLM(Vision-Language Model,视觉语言模型)大模型,视觉语言模型)大模型解决可解释性差的问题:解决可解释性差的问题:VLM 模型对复杂交通场景、交通文字标识有更强的理解力,能够为端到端模型的驾驶决策提供参考
64、,提升智驾系统的表现。图图 15:理想端到端算法架构理想端到端算法架构 资料来源:理想汽车,36 氪 Pro 微信公众号,信达证券研发中心 端到端算法端到端算法还还存在灾难性遗忘的问题存在灾难性遗忘的问题。灾难性遗忘是神经网络固有的局限性,主要是指系统在引入新数据时突然忘记以前学到的信息。主要原因是训练期间引入新任务,神经网络调整其参数或权重以适应新任务,导致覆盖从之前任务中获得的知识。日前马斯克在推特上解释了 FSD V12.4.2 推迟的原因,该版本投喂了大量需要接管的复杂场景数据进行训练优化,但在简单场景的驾驶平顺性反而倒退了。针对这种情况,需要对神经网络采取一些权重固化措施后重新训针对
65、这种情况,需要对神经网络采取一些权重固化措施后重新训练。练。3.3.2 验证测试:验证测试:端到端验证测试尚不成熟端到端验证测试尚不成熟 经典的自动驾驶架构验证环节已较为成熟。感知算法使用回灌数据进行离线开环测试,规控算经典的自动驾驶架构验证环节已较为成熟。感知算法使用回灌数据进行离线开环测试,规控算 请阅读最后一页免责声明及信息披露 19 法基于模拟器进行闭环测试验证法基于模拟器进行闭环测试验证7。端到端自动驾驶系统测试有两种方法:仿真环境中的在线仿真环境中的在线/闭环闭环测试测试;人类驾驶数据集的离线;人类驾驶数据集的离线/开环开环测试测试。在线在线/闭环闭环测试测试需要需要构建一个模仿真
66、实驾驶环境的模拟环境构建一个模仿真实驾驶环境的模拟环境,在模拟环境中部署在模拟环境中部署测试测试系统并系统并测测试端到端试端到端性能性能,目的是缩小算法训练与实际应用之间的差距,目的是缩小算法训练与实际应用之间的差距。此类测试一般涉及三个主要子任务:参数初始化、交通仿真和传感器仿真。在线在线/闭环评估闭环评估的优点的优点在于可以对初始环境参数、交通状况、传感器数据等实现高度控制,缺点缺点包括大多数数据样本是常见驾驶场景,而长尾场景和异常驾驶场景数据几乎无法获取;数据自动标注方法需要更加准确高效;为解决城市某些场景下性能不佳的问题,需要提升场景数据挖掘和场景理解能力。(资料来源:Li Chen
67、等End-to-end Autonomous Driving:Challenges and Frontiers,Lincan Li 等Data-Centric Evolution in Autonomous Driving:A Comprehensive Survey of BigData System,Data Mining,and Closed-Loop Technologies)离线离线/开环开环测试测试根据预先记录的根据预先记录的人类人类驾驶行为来评估系统的性能驾驶行为来评估系统的性能,通过将系统预测的未来轨迹通过将系统预测的未来轨迹与人类驾驶与人类驾驶数据数据中的轨迹进行比较来衡量性
68、能。中的轨迹进行比较来衡量性能。目前主流的离线数据集包括 nuScenes、Argoverse、Waymo 和 nuPlan,所有这些数据集都包含来自现实世界驾驶环境的大量带注释的轨迹。开环评估的开环评估的优优点点是基于真实的交通和传感器数据,测试易于实现。缺点缺点包括静态数据集中学习的行为可能无法转化为现实世界驾驶场景的动态特性;测试过程驾驶系统可能会偏离人类的驾驶数据,因此必须验证系统从这种偏离中恢复的能力。(资料来源:Li Chen 等End-to-end Autonomous Driving:Challenges and Frontiers,Lincan Li 等Data-Centri
69、c Evolution in Autonomous Driving:A Comprehensive Survey of BigData System,Data Mining,and Closed-Loop Technologies)图图 16:在线在线/闭环测试闭环测试与离线与离线/开环测试的主要特点与优缺点开环测试的主要特点与优缺点 资料来源:Li Chen 等End-to-end Autonomous Driving:Challenges and Frontiers,Lincan Li 等Data-Centric Evolution in Autonomous Driving:A Comp
70、rehensive Survey of BigData System,Data Mining,and Closed-Loop Technologies,辰韬资本端到端自动驾驶行业研究报告,信达证券研发中心 3.3.3 世界模型世界模型:重建真实世界的重要工具,亦存在端到端算法的问题:重建真实世界的重要工具,亦存在端到端算法的问题 世界模型的概念是指能够学习及揭示真实世界物理及数学定律的模型世界模型的概念是指能够学习及揭示真实世界物理及数学定律的模型8,具备对信息的全景理具备对信息的全景理 7 资料来源:辰韬资本端到端自动驾驶行业研究报告 8 资料来源:辰韬资本端到端自动驾驶行业研究报告 请阅读
71、最后一页免责声明及信息披露 20 解力,在想象的维度理解物理规律,并重建世界。简单来说,就是通过构建人类大脑的复杂认解力,在想象的维度理解物理规律,并重建世界。简单来说,就是通过构建人类大脑的复杂认知过程,模拟人类感知和决策过程,为自动驾驶系统提供预测和适应动态环境的能力。知过程,模拟人类感知和决策过程,为自动驾驶系统提供预测和适应动态环境的能力。通过世界模型重构世界,通过世界模型重构世界,智能驾驶算法智能驾驶算法的的空间理解能力空间理解能力有了进一步升级。有了进一步升级。智能驾驶的感知算法经历了 2D/3D 检测检测-BEV 算法算法-占用网络占用网络 OCC 算法算法的迭代。2020 年之
72、前感知算法只能进行2D/3D 检测检测,即分辨特定对象、确认三维空间位置,并提取车道线。2022 年,智能驾驶感知算法普遍升级到 BEV 算法算法,将所有摄像头的信息聚合到一个环境中,通过一张鸟瞰图俯瞰周边,动态感知更精准。但是,BEV 算法的框架还是基于二维,缺乏高度信息导致无法感知异形物体。2023 年开始,行业开始引入占用网络占用网络 OCC 算法算法,对环境的感知升级为三维。但 OCC 的感知,缺失表面材质信息,对细小物体等不确定性的描述不足。世界模型世界模型在智能驾驶场景中的主要能力在智能驾驶场景中的主要能力在于:在于:还原真实的物理世界,以及动态物体和静态物体之间的关系,符合大家对
73、于真实场景的认知;场景更加丰富,视频生成软件给出的视频只有简单的一个运镜,场景相对简单,世界模型可以生成丰富度更高的视频场景;能在短时间内推演出多种可能发生的轨迹并寻找最佳决策,得到驾驶的最优解。基于世界模型,智驾模型基于世界模型,智驾模型在感知端的时空理解能力、环境想象的真实度与丰富度会有明显提升,并且进一步具备了路径在感知端的时空理解能力、环境想象的真实度与丰富度会有明显提升,并且进一步具备了路径规划与最佳路径选择能力。规划与最佳路径选择能力。图图 17:2D/3D 检测检测、BEV、OCC、世界模型空间理解能力世界模型空间理解能力与真实世界的对比与真实世界的对比 资料来源:蔚来微信公众号
74、,信达证券研发中心 在端到端概念在端到端概念中,世界模型具有两个作用:根据外部输入生成视频,可以作为端到端模型训中,世界模型具有两个作用:根据外部输入生成视频,可以作为端到端模型训练的数据源练的数据源:通过世界模型生成的数据可以覆盖大量极端工况(如车祸或长尾的障碍物等),并且在线生成的数据具有成本优势。对世界模型进行微小的调整或者增加一些输出链路及模对世界模型进行微小的调整或者增加一些输出链路及模块,就可以实现块,就可以实现 One Model 端到端自动驾驶端到端自动驾驶:世界模型本身具备理解周围环境以及预测交通参与者行为的能力,同时也具备推理和理解的能力基础,所以它有能力基于所有已掌握信息
75、进行推理和最佳决策及规划。因此只要对世界模型进行微小的调整或者增加一些输出链路及模块,就可以很快实现端到端自动驾驶。但但同时因为同时因为世界模型基于端到端概念,世界模型基于端到端概念,其其也具有黑盒算法也具有黑盒算法带带来的来的不可解释性等问题不可解释性等问题9。9 资料来源:辰韬资本端到端自动驾驶行业研究报告 请阅读最后一页免责声明及信息披露 21 4.特斯拉引领端到端智驾算法迭代,国内参与者多点开花 4.1 端到端主要参与者包括主机厂、自动驾驶公司与人工智能公司等 端到端主要端到端主要参与者参与者涵盖了车企、人工智能企业、自动驾驶技术公司机器人公司以及自动驾驶芯涵盖了车企、人工智能企业、自
76、动驾驶技术公司机器人公司以及自动驾驶芯片制造商。片制造商。主机厂包括特斯拉、小鹏、理想特斯拉、小鹏、理想、蔚来、蔚来等,等,主要供应商包括华为、元戎启行、商汤华为、元戎启行、商汤绝影、绝影、百度百度等公司。从技术路线看,主流路线包括小鹏、华为的模块化端到端,商汤绝影的一体化端到端,另外还包括理想的双系统端到端,以及蔚来基于世界模型的端到端。图图 18:端到端主要端到端主要参与者参与者与技术路线与技术路线 资料来源:NE 时代智能车微信公众号,绝影智能 SenseAuto 微信公众号,智能车参考微信公众号,蔚来微信公众号,Xauto报告微信公众号,理想汽车微信公众号,HiEV 大蒜粒车研所微信公
77、众号,董车会微信公众号,42 号车库微信公众号,特来讯,信达证券研发中心 4.2 特斯拉 FSD V12 落地引领端到端变革 特斯拉经历了特斯拉经历了自研芯片、算法结构、数据标注与融合等方面的升级,逐步向端到端迈进。自研芯片、算法结构、数据标注与融合等方面的升级,逐步向端到端迈进。硬件层面硬件层面,特斯拉经历多次迭代升级至 HW4.0,其中传感器硬件通过 7 颗摄像头实现纯视觉路线;智驾芯片从 HW3.0 开始实现自研,HW4.0 进一步升级,算力达到 720TOPS。表表 5 5:特斯拉智能驾驶硬件迭代历程(特斯拉智能驾驶硬件迭代历程(HW1.0HW1.0-HW4.0HW4.0)版本版本 H
78、W1.0 HW2.0 HW2.5 HW3.0 HW4.0 发布时间发布时间 2014 年 9 月 2016 年 10 月 2017 年 8 月 2019 年 3 月 2023 年 H1 前摄像头前摄像头 1 3 3 3 2 侧摄像头侧摄像头 0 2 2 2 2 侧面后置摄像头侧面后置摄像头 0 2 2 2 2 后置摄像头后置摄像头 0 1 1 1 1 雷达数雷达数 1 1 1-智能驾驶芯片智能驾驶芯片 Mobileye EyeQ3 SoC:Nvidia Parker*1;GPU:Nvidia Pascal*1;CPU:Infineon TriCore*1 SoC:Nvidia Parker*2
79、;GPU:Nvidia Pascal*1;CPU:Infineon TriCore*1 FSD1.0 芯片*2 FSD2.0 芯片*2 算力算力 0.256TOPS 24TOPS 24TOPS 144TOPS 720TOPS 资料来源:Teslatap,车市物语微信公众号,91che 微信公众号,HiEV 大蒜粒车研所微信公众号,信达证券研发中心 算法结构层面算法结构层面,特斯拉最初与 Mobileye 进行合作,从 2016 年开始自研。2020 年开始实现BEV+Transformer+占用网络升级,逐步转向大模型时代。2023 年年 12 月,月,FSD V12 测试版亮测试版亮相,将城
80、市街道驾驶堆栈升级为经过数百万视频剪辑训练的单一端到端神经网络,取代了超过相,将城市街道驾驶堆栈升级为经过数百万视频剪辑训练的单一端到端神经网络,取代了超过 请阅读最后一页免责声明及信息披露 22 30 万行显式万行显式 C+代码。代码。图图 19:特斯拉自动驾驶算法结构迭代历程特斯拉自动驾驶算法结构迭代历程 资料来源:九章智驾微信公众号,42 号车库微信公众号,汽车之心微信公众号,智协慧同 EXCEEDDATA 微信公众号,特来讯,信达证券研发中心 自动驾驶软件版本迭代方面自动驾驶软件版本迭代方面,2013 年特斯拉开始 Autopilot 研发,主要功能包括主动巡航控制、自动辅助转向等;2
81、020 年开始 FSD Beta 开启内测,2023 年 12 月,FSD V12 测试版升级单一端到端神经网络,2024 年 3 月 FSD Beta 更名为 FSD Supervised(有监督的自动驾驶),在性能、安全、法规遵从方面持续突破,落地进程有望加速。表表 6 6:Autopilot/EAP/FSDAutopilot/EAP/FSD 主要功能与收费情况主要功能与收费情况 Autopilot EAP FSD 主动巡航控制主动巡航控制 标配 标配 标配 自动辅助转向自动辅助转向 标配 标配 标配 自动变道自动变道-标配 标配 高速辅助导航驾驶高速辅助导航驾驶-标配 标配 自动泊车自动
82、泊车-标配 标配 召唤功能召唤功能-稍后推出 标配 智能召唤功能智能召唤功能-稍后推出 标配 交通信号灯和停车标志控制交通信号灯和停车标志控制-稍后推出 城市辅助导航驾驶城市辅助导航驾驶-稍后推出 国内订阅价格国内订阅价格 标配标配 3.2 万万 6.4 万万 国外订阅价格国外订阅价格 标配标配 标配标配 8000 美元美元 资料来源:特斯拉官网,信达证券研发中心 表表 7 7:Autopilot/FSDAutopilot/FSD 重要升级内容重要升级内容 时间时间 版本版本 升级内容升级内容 2013 年-马斯克在社交平台 Twitter 上表示开始 Autopilot 的研发 2014 年
83、-Autopilot 产品提供主动安全功能,包括车道偏离警告、速度限制警告等 2015 年-增加自适应巡航和自动转向等功能 2016 年-推出 Enhanced Autopilot(EAP,增强辅助驾驶)产品线,功能包括召唤和自动泊车等;推出 Full Self-Driving(FSD,完全自动驾驶)预售产品,但并未给出何时落地的承诺 2018 年-增加 NOA(Navigate On AutoPilot,导航辅助驾驶)功能,下线 FSD 产品线 2019 年-将召唤和自动泊车作为基础功能归入 Autopilot 产品线,Autopilot 成为标配;将 NOA 召唤和自动泊车功能归入 FSD
84、 产品线;EAP 产品线下线 2020 年-发布 FSD Beta 版本,增加识别交通灯和停车标志并作出反应的功能、城市街道自动转向等功能 2020 年 10 月 FSD Beta 开启内测,仅向部分北美 FSD 的测试平台用户推送测试功能 2021 年 1 月 FSD Beta V8 V8.1 可以让车辆在没有干预的情况下正常行驶 2021 年 7 月 FSD Beta V9 放弃使用雷达,采用 100%摄像头的纯视觉解决方案,新增城市场景 请阅读最后一页免责声明及信息披露 23 2021 年 9 月 FSD Beta V10 增加新的辅助驾驶功能,优化驾驶体验 2021 年 10 月 FS
85、D Beta V10.2 开启公测,但有条件要求,safety score(特斯拉设计的安全评估机制,分数越高表示驾驶越安全)达到 100 分的北美地区车主可获得试用资格 2022 年-针对只想使用高速公路辅助驾驶功能的用户重新上线 EAP,售价 6000 美元,同期 FSD Beta 价格为 1.2 万美元 2022 年 11 月 FSD Beta V10.69.3.1 全面放开公测,向北美地区所有购买 FSD 的用户推送测试功能 2023 年 2 月 FSD Beta V11 统一城市驾驶和高速公路驾驶堆栈,在此之前高速场景并未统一到 FSD Beta 技术栈中 2023 年 12 月 F
86、SD Beta V12.1 FSD V12 测试版将城市街道驾驶堆栈升级为经过数百万视频剪辑训练的单一端到端神经网络,取测试版将城市街道驾驶堆栈升级为经过数百万视频剪辑训练的单一端到端神经网络,取代了超过代了超过 30 万行显式万行显式 C+代码代码 2024 年 3 月 FSD(Supervised)V12.3.3 再次下线再次下线 EAP,FSD Beta 更名为更名为 FSD Supervised(有监督的自动驾驶)(有监督的自动驾驶)2024 年 4 月-特斯拉 FSD 用户累计行驶里程突破 13 亿英里 2024 年 5 月 FSD(Supervised)V12.4 FSD V12.
87、4 新增视觉注意力监控 2024 年 8 月-特斯拉 Cybertruck FSD 预计将于 9 月发布 资料来源:第一财经微信公众号,新皮层 NewNewThing 微信公众号,特来讯,信达证券研发中心 特斯拉围绕数据驱动实现了自动驾驶的快速迭代,特斯拉围绕数据驱动实现了自动驾驶的快速迭代,FSD 有望持续进化。有望持续进化。从 Autopilot 到端到端架构,特斯拉通过影子模式、HydraNet 神经网络架构构建、数据自动标注、算法层面迭代(BEV+Transformer+占用网络等)、算力储备等布局实现了逐步迭代升级。图图 20:特斯拉通过影子模式、数据标注、数据挖掘与训练等环节实现数
88、据闭环特斯拉通过影子模式、数据标注、数据挖掘与训练等环节实现数据闭环 资料来源:42 号车库微信公众号,信达证券研发中心整理 从实际体验来看,端到端的从实际体验来看,端到端的 FSD 开起来更加拟人、丝滑。开起来更加拟人、丝滑。何小鹏在加州体验 FSD 最新版本时表示,FSD 比他作为加州新手司机开得更好。根据实测视频,面对复杂的施工路段、夜晚临时路桩、飞扬的纸袋、路过的动物等,特斯拉 FSD 均能做出灵活且准确的反应。根据 Tesla FSD Tracker 统计,FSD V12.3 在城市工况下平均接管里程为 20 英里,平均安全接管里程为 372英里。特斯拉或将通过世界模型实现特斯拉或将
89、通过世界模型实现 3D 空间空间生成。生成。特斯拉 AI 负责人 Ashok Elluswamy 表示特斯拉正在试图构建一个更加通用的世界模型(General World Model),它能够预测未来并帮助神经网络自主学习,能够以 AI 的方式生成 3D 空间,并且根据人类的左右转弯等指令,在八个摄像 请阅读最后一页免责声明及信息披露 24 头视角里同时进行一致性非常强的 3D 变换。特斯拉特斯拉 FSD 入华限制逐渐解除,与百度入华限制逐渐解除,与百度地图地图达成合作。达成合作。4 月底马斯克抵京当日,特斯拉通过中国汽车数据安全 4 项全部要求车外人脸信息等匿名化处理、默认不收集座舱数据、座
90、舱数据车内处理、处理个人信息显著告知,我们认为在数据层面的限制正逐步解除。4 月 22 日,百度副总裁尚国斌官宣与特斯拉达成合作,称百度地图真车道级导航将在特斯拉全球首发。7 月初,特斯拉 Model Y 后轮驱动版进入江苏省政府新能源用车采购目录,上海临港新片区国企也已采购一批特斯拉 Model Y,各地已陆续解除对特斯拉等智能网联汽车的禁行禁停限制。图图 21:百度与特斯拉达成地图合作百度与特斯拉达成地图合作 资料来源:百度,盖世汽车社区微信公众号,信达证券研发中心 在在二季度财报电话会议上,马斯克表示特斯拉二季度财报电话会议上,马斯克表示特斯拉 FSD 有望在有望在 V12.5 或者或者
91、 12.6 版本,进入中国、版本,进入中国、欧洲,以及其他国家,并在早期推送之后提交给上述国家的监管部门进行审核。欧洲,以及其他国家,并在早期推送之后提交给上述国家的监管部门进行审核。马斯克表示 FSD V12.5 的参数量是 V12.4 的五倍,可以实现高速道路和一般道路相统一的高阶智驾解决方案,按照当前的迭代节奏,我们认为 V12.6 有望在年内推出。根据特斯拉财报,截止二季度末特斯拉 FSD 累计测试里程已突破 16 亿英里,其中 FSD V12 测试里程已突破 6 亿英里。马斯克表马斯克表示他们计划在年内达成一个重要里程碑,即在实际行驶超过十亿英里的过程中,受监管的自动示他们计划在年内
92、达成一个重要里程碑,即在实际行驶超过十亿英里的过程中,受监管的自动驾驶系统将比人类驾驶员更为安全。驾驶系统将比人类驾驶员更为安全。图图 22:FSD Beta 累计行驶里程(十亿英里)累计行驶里程(十亿英里)资料来源:特斯拉财报,信达证券研发中心 4.3 华为、小鹏、理想等车企与供应商纷纷跟进,技术路线有望向“端到端”收敛 请阅读最后一页免责声明及信息披露 25 4.3.1 华为华为 ADS3.0 享界享界 S9 首发,首发,构建构建感知、规划控制神经网络感知、规划控制神经网络实现模块化端到端实现模块化端到端 华为在华为在 2024 年年 4 月推出了新品牌乾崑及其新一代智能驾驶解决方案月推出
93、了新品牌乾崑及其新一代智能驾驶解决方案 ADS 3.0,该方案以,该方案以 GOD网络和网络和 PDP 网络为核心,实现端到端的智能驾驶。网络为核心,实现端到端的智能驾驶。华为 ADS 3.0 8 月份率先搭载享界 S9 交付,9 月开始有望依次推送鸿蒙智行其他车型以及 Hi 合作模式车型。表表 8 8:HUAWEI ADSHUAWEI ADS 迭代历程迭代历程 类别类别 ADS 1.0 ADS 2.0 ADS 3.0 发布时间发布时间 2021.4 2023.4 2024.4 软件架构软件架构 BEV BEV+GOD+RCR GOD+PDP 核心功能核心功能 NCA 领航辅助(上海、广州、深
94、圳等)NCA 领航辅助(全国高速、城区)NCA 领航辅助(全国高速、城区,实现点到点)搭载车型搭载车型 极狐阿尔法 S、阿维塔 11 问界 M5/M7/M9,阿维塔 11/12,智界 S7 享界 S9,后续有更多品牌与车型加入 资料来源:甲子光年微信公众号,信达证券研发中心 在在 ADS 2.0 智驾解决方案中智驾解决方案中,华为在,华为在 BEV 的基础上增加了的基础上增加了 GOD+RCR 网络实现“网络实现“全国都能全国都能开开”的无的无图图 NCA 智驾能力智驾能力。GOD 网络(网络(General Obstacle Detection,通用障碍物检测网络)可以通过激光雷达+摄像头,
95、来识别通用障碍物白名单外的异形物体,用 3D 像素块来构建出障碍物的轮廓,对路上的障碍物进行精细识别,障碍物的识别不再存在上限。RCR 网络(网络(Road Cognition&Reasoning,道路拓扑推理网络),道路拓扑推理网络)进一步让智驾摆脱高精地图的依赖,结合普通导航地图来与现实进行匹配和印证,再实时通过传感器来拓扑绘制一幅可用的行车地图,能够做到具体路况具体分析。图图 23:华为华为 ADS 2.0 BEV+GOD+RCR 网络网络 资料来源:董车会微信公众号,信达证券研发中心 ADS 3.0 升级点主要在于构建了升级点主要在于构建了 GOD 感知神经网络感知神经网络+PDP 决
96、策神经网络实现模块化端到端。决策神经网络实现模块化端到端。在 ADS 3.0 当中,华为将 GOD 和 RCR 都神经网络化,并纳入到一个完整的 GOD 感知神经网络,规划决策模块构建了 PDP 决策神经网络,实现去 BEV 化。华为还利用自己的云端 AI 训练平台进行大量的数据训练,让模型得以快速迭代升级。截止目前,华为学习训练的算力已经截止目前,华为学习训练的算力已经从从 3.5E FLOPS 更新到更新到 5E FLOPS,模型每天训练的里程数达到了,模型每天训练的里程数达到了 3500 万公里。万公里。华为还在华为还在端到端模型中端到端模型中增加了“增加了“本能安全网络本能安全网络”进
97、行下限兜底,进行下限兜底,增强模型可解释性与稳健性,增强模型可解释性与稳健性,避免端到端下限低的问题避免端到端下限低的问题。请阅读最后一页免责声明及信息披露 26 图图 24:华为华为 ADS 3.0 GOD+PDP 网络网络 资料来源:董车会微信公众号,信达证券研发中心 ADS 3.0 升级后体验亮点包括:升级后体验亮点包括:享界 S9 泊车代驾正式商用,到达目的地后,人可下车即走,车辆自主泊入,解决停车找位难、费时间等痛点;开启条件不挑场景,可以从地库车位、路边临时停车等等状态下直接起步;可以自己过闸机、下地库、自主泊车的几个功能无缝衔接,可实现车位到车位的智驾体验;特殊场景应对:鬼探头,
98、ADS 3.0 能够及时避让或刹停;对向来车时会主动博弈避让。4.3.2 小鹏:小鹏:组织架构调整,组织架构调整,全面投入端到端全面投入端到端 小鹏小鹏 5 月月发布发布 AI 天玑系统天玑系统,成为首个落地量产端到端大模型的车企。成为首个落地量产端到端大模型的车企。AI 天玑系统是一个将 AI技术全面应用于智能座舱与智能驾驶的操作系统,核心功能包括 AI 小 P(升级了 LLM 的 AI 助理)、AI 司机(包括 AI 代驾、AI 泊车、XNGP 等智能驾驶功能)、AI 保镖(车辆环境的大范围感知及预警)。此次升级此次升级 XNGP 升级了模块化端到端模型,升级了模块化端到端模型,主要由主要
99、由 XNet 感知神经网络、感知神经网络、XPlanner 规划控制大模型以及规划控制大模型以及 XBrain 大语言模型组成。大语言模型组成。感知大模型感知大模型 XNet:聚合动态 XNet、静态 XNet、纯视觉 2K 占用网络,能够让自动驾驶系统对现实世界中的可通行空间进行 3D 还原,清晰识别静态障碍物细节,感知范围提升 2 倍,面积有 1.8 个足球场大小,能精准识别 50+个目标物。大语言模型大语言模型 XBrain:通过大语言模型网络,提高自动驾驶对复杂甚至未知场景的泛化处理能力,及对宏观逻辑的推理能力,从而做出兼顾安全及性能的拟人驾驶决策。能够认识待转区、潮汐车道、特殊车道、
100、路牌文字,理解各种令行禁止、快慢缓急的行为指令。规控大模型规控大模型 XPlanner:基于图像数据的感知输入,实现对智驾行驶路径的规划控制。规划大模型基于数据驱动模式迭代,取代人类手写规则代码,使得驾驶策略向拟人进化,目前在效果上,前后顿挫减少 50%、违停卡死减少 40%、安全接管减少 60%。请阅读最后一页免责声明及信息披露 27 图图 25:小鹏小鹏智驾端到端大模型架构智驾端到端大模型架构 资料来源:小鹏汽车微信公众号,信达证券研发中心 XNGP 于于 7 月底月底升级“全国都好用”升级“全国都好用”,年内实现“门到门”智驾体验。年内实现“门到门”智驾体验。7 月 30 日,小鹏宣布A
101、I 天玑系统 XOS 5.2.0 版本向全球推送,坚持“每 2 天一次版本迭代,每 2 周一次体验升级”,在 5 月首次发布后至迭代版本超 35 个。XNGP 最新一轮 OTA 内测中 AI 代驾已实现自动过ETC,按照规划 2024 年四季度打通全国道路,打通行泊场景,AI 代驾实现车位到车位体验。按计划,按计划,2025 年小鹏现有车型都年小鹏现有车型都将将开始开始进行进行 AI 天玑系统公测,天玑系统公测,在中国实现类在中国实现类 L4 级智驾体验,级智驾体验,并且并且目前目前正在全球范围对正在全球范围对 XNGP 端到端的能力进行测试,智驾技术开始走向全球端到端的能力进行测试,智驾技术
102、开始走向全球。图图 26:2024 年年小鹏小鹏智驾推送规划智驾推送规划 资料来源:小鹏汽车微信公众号,信达证券研发中心 请阅读最后一页免责声明及信息披露 28 在组织架构层面,小鹏在组织架构层面,小鹏自动驾驶部门新设三大自动驾驶部门新设三大 AI 板块,全面推进端到端研发。板块,全面推进端到端研发。小鹏自动驾驶部门新设 AI 模型开发、AI 应用开发、AI 效能开发三大板块,其中 AI 模型开发部门主要负责端到端模型开发。相较原来由产品研发部、架构、系统开发部等 10 多个部门组成,调整后智驾团队研发方向更加“精简”,专注于端到端研发。在投入方面,在投入方面,2024 年,小鹏汽车在研发上将
103、投入年,小鹏汽车在研发上将投入 70 亿元。何小鹏亿元。何小鹏透露透露目前公司已有目前公司已有 7000+张张GPU 卡,小鹏今年将在训练算力上再投入超过卡,小鹏今年将在训练算力上再投入超过 7 亿元亿元。4.3.3 理想:构建端到端理想:构建端到端+VLM(视觉语言模型)(视觉语言模型)双系统双系统,进一步提升端到端下限,进一步提升端到端下限 理想理想端到端端到端采用了采用了“行业首个双系统量产方案”“行业首个双系统量产方案”,双系统包含系统,双系统包含系统 1:端到端模型,系统:端到端模型,系统 2:VLM(视觉语言模型)。(视觉语言模型)。系统系统 1 由一体化端到端实现由一体化端到端实
104、现,具备高效、快速响应能力,能够应对驾驶车辆时 95%的常规场景。系统系统 2 是与系统是与系统 1 相并联的一个相并联的一个 22 亿参数规模的亿参数规模的 VLM(视觉语言模型)(视觉语言模型),具备复杂环境理解能力、修正导航的能力以及理解交通规则与文字标识的能力,主要应对系统 1 处理不了的复杂情况,约占日常驾驶场景的 5%。图图 27:理想理想 4D One Model 端到端架构图端到端架构图 资料来源:Xauto 报告微信公众号,信达证券研发中心 VLM 本质是一个多模态大模型,本质是一个多模态大模型,可以可以利用大语言模型的认知能力理解场景,输出另外一条行利用大语言模型的认知能力
105、理解场景,输出另外一条行驶轨迹给端到端模型参考修正。驶轨迹给端到端模型参考修正。因为端到端模型的是黑盒算法,对于目标的错检漏检,以及幻觉问题难以通过直接调参解决,所以理想通过 VLM 以及适当的强化学习手段来规范端到端模型的行为。请阅读最后一页免责声明及信息披露 29 图图 28:理想理想 VLM(Visual Language Model,视觉语言模型),视觉语言模型)架构图架构图 资料来源:Xauto 报告微信公众号,信达证券研发中心 除了双系统之外,理想还在云端部署了重建除了双系统之外,理想还在云端部署了重建+生成式世界模型。生成式世界模型。该模型基于重建和生成两种技术路径,将真实数据通
106、过 3DGS(3D 高斯溅射)技术进行重建,并使用生成模型补充新视角。重建+生成的场景为自动驾驶系统能力的学习和测试创造了更优秀的虚拟环境,使系统具备了高效闭环的迭代能力,保证了系统的安全、可靠、高效。图图 29:理想汽车的自动驾驶系统考试方案理想汽车的自动驾驶系统考试方案:重建重建+生成的世界模型生成的世界模型 资料来源:Xauto 报告微信公众号,信达证券研发中心 根据理想汽车规划,双系统方案将于根据理想汽车规划,双系统方案将于 8 月开启千人公测,月开启千人公测,官方预计今年底或明年初面向普通用官方预计今年底或明年初面向普通用户推送。户推送。7 月份向全量 AD Max 用户推送的无图
107、NOA 仍然基于分段式端到端实现。请阅读最后一页免责声明及信息披露 30 4.3.4 蔚来:蔚来:构建基于世界模型的端到端算法,时空理解构建基于世界模型的端到端算法,时空理解+规划决策能力全面提升规划决策能力全面提升 基于对于时空理解能力需求的提升,蔚来构建世界模型实现端到端。基于对于时空理解能力需求的提升,蔚来构建世界模型实现端到端。单一端到端模型对于时间维度信息的融合和推演都是定长的,缺乏自动建模长时序信息的能力。在蔚来科技日上,蔚来智能驾驶副总裁任少卿发布了蔚来世界模型 NWM(NIO World Model)。NWM 类比人脑具有想象推演和想象重建能力,可以根据一个真实场景,生成一万个
108、“平行世界”。其表示该模型和端到端架构结合,能够进一步提升算法对复杂场景的处理能力,补足了自动驾驶系统预测未来事件以及时空理解与想象能力。图图 30:常规端到端与:常规端到端与蔚来世界模型蔚来世界模型 NWM 的对比的对比 资料来源:蔚来微信公众号,信达证券研发中心 NWM 主要的优化在于主要的优化在于全量理解信息,空间认知能力更强全量理解信息,空间认知能力更强;能够预测接下来的场景能够预测接下来的场景;生生成式无监督的方式,对海量数据的利用更加高效成式无监督的方式,对海量数据的利用更加高效,基于以上能力,基于以上能力,MWN 理解世界、推演世界、理解世界、推演世界、仿真世界的能力。仿真世界的
109、能力。1、理解世界理解世界:通过自回归的方式重建原始传感器信息的输入,在其中自动学习知识和物理规律,能够做到全量信息重建,想象重构世界,保证更强的泛化能力。2、推演世界推演世界:NWM 能在 0.1 秒内推演出 216 种可能发生的轨迹,并根据外界的信息的输入,重复更新内在时空的模型,对 216 种可能性进行预测,得到驾驶决策最优解。3、仿真世界仿真世界:NWM 具备闭环仿真测试能力,生成式仿真模型 NSim 可以在真实世界唯一轨迹的基础上增加大量 NWM 推演的轨迹与仿真结果进行对比,让输出的智驾轨迹和体验更安全合理高效。世界模型的端到端架构将在全新世界模型的端到端架构将在全新智能驾驶架构智
110、能驾驶架构 NADArch 2.0 上车。上车。蔚来智能驾驶架构NADArch 2.0 在算法层面升级为引入世界模型的端到端架构,全域领航辅助 NOP+和智能安全将同步升级为 2.0 版本。其中,点到点全域领航辅助其中,点到点全域领航辅助 2.0 将于下半年上车,智能安全将于下半年上车,智能安全 2.0 已逐已逐步迭代。步迭代。端到端技术端到端技术将首先将首先应用在主动安全功能应用在主动安全功能上,上,今年今年 7 月初,基于端到端架构的自动紧急月初,基于端到端架构的自动紧急制动功能制动功能 AEB 已在已在 Banyan榕榕 2.6.5 版本中正式上车,提升响应覆盖版本中正式上车,提升响应覆
111、盖 6.73 倍。倍。请阅读最后一页免责声明及信息披露 31 图图 31:蔚来蔚来智能驾驶架构智能驾驶架构 NADArch 2.0 资料来源:蔚来微信公众号,信达证券研发中心 4.3.5 智驾供应商:智驾供应商:百度模块化端到端赋能萝卜快跑,百度模块化端到端赋能萝卜快跑,商汤绝影开始一体化端到端测试商汤绝影开始一体化端到端测试 百度于百度于 5 月月 15 日发布了面向自动驾驶的端到端大模型日发布了面向自动驾驶的端到端大模型 Apollo ADFM。从 2021 年开始,百度Apollo 将系统中的多个小模型任务逐步整合,Apollo ADFM 实现了感知大模型+规划大模型的模块化端到端方案,
112、通过对中间结果做隐式传递,实现了端到端的联合训练。整体的数据训练评测都更为简化,进一步减少了信息损失。该方案已经告别了科研探索阶段,能够满足非常高该方案已经告别了科研探索阶段,能够满足非常高的安全标准,亦可解决的安全标准,亦可解决 L4 无人驾驶的问题。无人驾驶的问题。图图 32:百度百度 Apollo ADFM 端到端端到端大模型大模型 资料来源:百度,Apollo Day 2024,信达证券研发中心 以以 Apollo ADFM 为基础,为基础,Apollo 自动驾驶大模型能够迅速泛化。自动驾驶大模型能够迅速泛化。目前只需要 6 个月的时间,就能在一座新城市实现接近“老司机”的驾驶效果。该
113、技术将搭载于价格仅 20 万元的萝卜快跑第六代无人车;纯视觉城市领航辅助驾驶产品 ANP3 也将全面应用自动驾驶大模型 Apollo ADFM,并升级为 ASD(Apollo Self-Driving),即将在极越全系车型量产首发。商汤绝影商汤绝影是是行业首个行业首个提出提出感知决策一体化感知决策一体化端到端的供应商。端到端的供应商。面向量产的端到端自动驾驶解决方面向量产的端到端自动驾驶解决方案案 UniAD 在北京车展上完成上车演示首秀。在北京车展上完成上车演示首秀。商汤绝影 UniAD 方案将感知、决策、规划等模块 请阅读最后一页免责声明及信息披露 32 整合到一个全栈 Transform
114、er 端到端模型,实现感知决策一体化。搭载 UniAD 端到端自动驾驶解决方案的车辆可适配纯视觉的硬件基础,无需高精地图。同同时时,商汤也依靠世界模型生成更,商汤也依靠世界模型生成更加精细和复杂的自动驾驶视频数据,给加精细和复杂的自动驾驶视频数据,给 UniAD 进行有针对性的模型训练。进行有针对性的模型训练。图图 33:商汤绝影商汤绝影 UniAD 架构演进历程架构演进历程 资料来源:绝影智能 SenseAuto 微信公众号,信达证券研发中心 商汤还前瞻性布局了下一代自动驾驶技术商汤还前瞻性布局了下一代自动驾驶技术 DriveAGI,进一步向认知驱动进化。,进一步向认知驱动进化。DriveA
115、GI 基于多模态大模型对端到端智驾方案进行改进和升级,具备更强的推理能力、决策能力以及交互能力,思维模式更接近人类,解决驾驶困难场景能力强。DriveAGI 可以在无高精地图,甚至是针对某种类型目标 0 样本学习的前提下,仅依靠视觉感知实际道路情况,准确地完成包括大角度转向、避让占道车辆及施工区域、绕行跑步行人等一系列高难度操作。图图 34:商汤绝影商汤绝影多模态场景大脑多模态场景大脑 DriveAGI 资料来源:智能车参考微信公众号,信达证券研发中心 元戎启行元戎启行在北京车展在北京车展对外展示了其即将量产的高阶智驾平台对外展示了其即将量产的高阶智驾平台 DeepRoute IO。DeepR
116、oute IO基于导航地图应用端到端模型,在导航地图覆盖的范围内,DeepRoute IO 可实现全域点到点高阶智能驾驶,复杂路况下元戎启行 IO 平台的路口通行成功率近 98%,特殊路口转向成功率近 90%。IO 平台还设有完善的安全兜底策略,保证驾驶安全,在将要发生碰撞时,系统会启动安全模型,车辆迅速进入保守策略避免出现安全事故。DeepRoute IO 的硬件方案支持定制化设计,根据车企的不同硬件设置、不同软件功能要求进 请阅读最后一页免责声明及信息披露 33 行专属定制。首款基于 DeepRoute IO 的解决方案采用 NVIDIA DRIVE Orin 系统级芯片,200+TOPS
117、 算力,1 颗固态激光雷达,11 颗摄像头,行泊一体,基于导航地图可实现全域、全时、全场景的智慧领航辅助驾驶功能。图图 35:元戎启行端到端模型技术变迁元戎启行端到端模型技术变迁 资料来源:元戎启行微信公众号,信达证券研发中心 总体看,特斯拉特斯拉作为端到端路线的引领者具有数据、算力等优势。国内路线智驾领先车企如华华为为、小鹏小鹏等为加快量产进度,减少过于激进带来的算法缺陷,均选择了模块化端到端路线,以提升端到端算法的可解释性与稳健性;而理想、商汤理想、商汤等一体化方案在端到端模型的基础上构建了以语言模型为基础的多模态大模型作为认知能力的补充,同时还包括了世界模型补充测试的数据集;蔚来蔚来的端
118、到端则以世界模型为基础,通过世界模型的时空感知与预测规划决策能力实现端到端。我们认为因各车企战略选择有差异,端到端路线尚处在百花齐放的阶段,但随着数我们认为因各车企战略选择有差异,端到端路线尚处在百花齐放的阶段,但随着数据、算力等竞争要素逐渐赶上,端到端路线有望逐渐收敛至一体化结构,并会结合多模态大模据、算力等竞争要素逐渐赶上,端到端路线有望逐渐收敛至一体化结构,并会结合多模态大模型、世界模型等加强感知、认知、决策能力。型、世界模型等加强感知、认知、决策能力。5.投资建议 我们认为以特斯拉为代表的端到端快速迭代有望带来智能驾驶新一轮产业革命,自动驾驶能力将重新构筑车企竞争壁垒,数据+算力将成为
119、核心竞争要素,头部车企或供应商能掌握更多更优的“数据”,以及更强更快的“算力”,而优秀的智驾能力有望加强销量转化,最终强化车企马太效应,头部车企强者愈强时代即将来临。整车整车板块重点关注:1)受益于华为强大智驾能力赋能的鸿蒙智行合作车企以及相关合作伙伴【赛力斯、北汽蓝谷、长安汽车、江淮汽车】【赛力斯、北汽蓝谷、长安汽车、江淮汽车】;2)汽车保有量大且品牌积淀深厚,智能电动技术布局有望逐步赶上的自主品牌龙头车企【比亚迪、长城汽车】【比亚迪、长城汽车】;3)智能驾驶技术领先的造车新势力【理想汽车、蔚来、小鹏汽车】【理想汽车、蔚来、小鹏汽车】;4)全球化布局提速、有望迎来新一轮产品周期、同时在智能驾
120、驶、能源、人形机器人多线并进的全球新能源汽车龙头【特斯拉】【特斯拉】。零部件零部件板块建议重点关注智能化产业链核心零部件:1)感知层【德赛西威、保隆科技、华域汽【德赛西威、保隆科技、华域汽车】车】等。2)决策层【经纬恒润、均胜电子、华阳集团】【经纬恒润、均胜电子、华阳集团】等。3)执行层【伯特利、中鼎股份、【伯特利、中鼎股份、拓普集团、亚太股份、耐世特、浙江世宝】拓普集团、亚太股份、耐世特、浙江世宝】等。请阅读最后一页免责声明及信息披露 34 6.风险因素 智能化零部件降本不及预期、智能驾驶利好政策落地不及预期、消费者体验不及预期、技术迭代不及预期、外部宏观环境恶化等。请阅读最后一页免责声明及
121、信息披露 35 研究团队简介研究团队简介 陆嘉敏,信达证券汽车行业首席分析师,上海交通大学机械工程学士&车辆工程硕士,曾就职于天风证券,2018 年金牛奖第 1 名、2020 年新财富第 2 名、2020 年新浪金麒麟第 4 名团队核心成员,2023 年 WIND 金牌分析师第二名。擅长自上而下挖掘投资机会。汽车产业链全覆盖,重点挖掘华为汽车产业链、特斯拉产业链、智能汽车、自主品牌等领域机会。丁泓婧,墨尔本大学金融硕士,主要覆盖智能座舱、电动化、整车等领域。徐国铨,中国社会科学院大学应用经济学硕士,主要覆盖智能化、新势力、自主整车等领域。请阅读最后一页免责声明及信息披露 36 分析师声明分析师
122、声明 负责本报告全部或部分内容的每一位分析师在此申明,本人具有证券投资咨询执业资格,并在中国证券业协会注册登记为证券分析师,以勤勉的职业态度,独立、客观地出具本报告;本报告所表述的所有观点准确反映了分析师本人的研究观点;本人薪酬的任何组成部分不曾与,不与,也将不会与本报告中的具体分析意见或观点直接或间接相关。免责声明免责声明 信达证券股份有限公司(以下简称“信达证券”)具有中国证监会批复的证券投资咨询业务资格。本报告由信达证券制作并发布。本报告是针对与信达证券签署服务协议的签约客户的专属研究产品,为该类客户进行投资决策时提供辅助和参考,双方对权利与义务均有严格约定。本报告仅提供给上述特定客户,
123、并不面向公众发布。信达证券不会因接收人收到本报告而视其为本公司的当然客户。客户应当认识到有关本报告的电话、短信、邮件提示仅为研究观点的简要沟通,对本报告的参考使用须以本报告的完整版本为准。本报告是基于信达证券认为可靠的已公开信息编制,但信达证券不保证所载信息的准确性和完整性。本报告所载的意见、评估及预测仅为本报告最初出具日的观点和判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会出现不同程度的波动,涉及证券或投资标的的历史表现不应作为日后表现的保证。在不同时期,或因使用不同假设和标准,采用不同观点和分析方法,致使信达证券发出与本报告所载意见、评估及预测不一致的研究报告,对此信达证券可
124、不发出特别通知。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议,也没有考虑到客户特殊的投资目标、财务状况或需求。客户应考虑本报告中的任何意见或建议是否符合其特定状况,若有必要应寻求专家意见。本报告所载的资料、工具、意见及推测仅供参考,并非作为或被视为出售或购买证券或其他投资标的的邀请或向人做出邀请。在法律允许的情况下,信达证券或其关联机构可能会持有报告中涉及的公司所发行的证券并进行交易,并可能会为这些公司正在提供或争取提供投资银行业务服务。本报告版权仅为信达证券所有。未经信达证券书面同意,任何机构和个人不得以任何形式翻版、复制、发布、转发或引用本报告的任何部分。若信达证券
125、以外的机构向其客户发放本报告,则由该机构独自为此发送行为负责,信达证券对此等行为不承担任何责任。本报告同时不构成信达证券向发送本报告的机构之客户提供的投资建议。如未经信达证券授权,私自转载或者转发本报告,所引起的一切后果及法律责任由私自转载或转发者承担。信达证券将保留随时追究其法律责任的权利。评级说明评级说明 风险提示风险提示 证券市场是一个风险无时不在的市场。投资者在进行证券交易时存在赢利的可能,也存在亏损的风险。建议投资者应当充分深入地了解证券市场蕴含的各项风险并谨慎行事。本报告中所述证券不一定能在所有的国家和地区向所有类型的投资者销售,投资者应当对本报告中的信息和意见进行独立评估,并应同
126、时考量各自的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专业顾问的意见。在任何情况下,信达证券不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任,投资者需自行承担风险。投资建议的比较标准投资建议的比较标准 股票投资评级股票投资评级 行业投资评级行业投资评级 本报告采用的基准指数:沪深 300指数(以下简称基准);时间段:报告发布之日起 6 个月内。买入:买入:股价相对强于基准 15以上;看好:看好:行业指数超越基准;增持:增持:股价相对强于基准 515;中性:中性:行业指数与基准基本持平;持有:持有:股价相对基准波动在5%之间;看淡:看淡:行业指数弱于基准。卖出:卖出:股价相对弱于基准 5以下。