1、大模型迭代,智能驾驶、机器人算法进化机器人系列深度研究之12证券分析师:洪依真 A0230519060003 施鑫展 A0230519080002 刘洋 A0230513050006王珂A0230521120002 戴文杰A0230522100006 黄忠煌A0230519110001 胡雪飞A0230522120002屠亦婷A02305120800032023.9.192模型模型AIAI小结:理解不同参与者的环节小结:理解不同参与者的环节检测跟踪Tracking映射地图Mapping运动预测Motion占用预测Occupancy路径规划(含防碰撞)Planner控制执行尝试视觉+4D成像为主
2、的传感器大模型:谷歌/微软/Tesla/Meta等发力尝试 人车互动/人机互动/自动行走局部尝试大模型AI的端对端自动驾驶传感器摄像头视觉激光雷达毫米波雷达超声波雷达传动部件减速器/丝杠/其他等控制器电机伺服/步进/空心杯传感器电流环控制/力矩/被动力控制/视觉GPUDSA(Tesla DOJO为例)ASIC/边缘计算处理器MCU高速连接器高压传感器光芯片定位导航IMU等其他连接器电子和半导体范畴通信范畴大机械范畴大汽车范畴软件互联网AI范畴图例大机器人具身智能大智联汽车3XgVnXgVaXnVnRqMrM7NcM7NsQqQoMoNkPqQwPlOmOrM7NrQoOuOnOtNNZnMqM
3、3大模型大模型AIAI小结:理解不同参与者的环节小结:理解不同参与者的环节检测跟踪Tracking映射地图Mapping运动预测Motion占用预测Occupancy路径规划(含防碰撞)Planner控制执行尝试视觉+4D成像为主的传感器推理+理解:例如谷歌PaLM-E传感器摄像头视觉激光雷达毫米波雷达超声波雷达传动部件减速器/丝杠/其他等控制器电机伺服/步进/空心杯传感器电流环控制/力矩/被动力控制/视觉GPUDSA(Tesla DOJO为例)ASIC/边缘计算处理器MCU高速连接器高压传感器光芯片定位导航IMU等其他连接器电子和半导体范畴通信范畴大机械范畴大汽车范畴软件互联网AI范畴图例大
4、机器人具身智能大智联汽车2020-2022年硬件预埋理解+运动。如UCLA两篇机器人相关论文Design of a Highly Dynamic Humanoid Robot、Development and Real-Time Optimization-based Control of a Full-sized Humanoid for Dynamic Walking and RunningAI端到端(CVPR 2023最佳论文为代表):局部尝试大模型AI的端对端自动驾驶谷歌/微软/Tesla/Meta等发力,尝试 人车互动/人机互动/自动行走2022年机器人硬件AI 视觉的3D化:Nerf/
5、BEV/占用网络AI视觉大模型:脸书:SAM/dinoV2ViT/MAE/Swin视觉+理解+运动:泛化+零样本例如谷歌RT-1/RT-2,例如李飞飞VoxPoser主要内容主要内容1.智能驾驶:端到端的算法新范式2.视觉泛化:大模型带来何种改变3.机器人:从google看算法迭代4.投资机会和标的选择451.11.1 AIAI感知:机器人感知:机器人+驾驶驾驶+具身智能的智能化曾都卡在这里具身智能的智能化曾都卡在这里检测跟踪Tracking映射地图Mapping运动预测Motion占用预测Occupancy路径规划(含防碰撞)Planner检测-激光雷达检测-毫米波雷达检测-摄像头雷达感知算
6、法毫米波雷达感知算法摄像头感知算法原始数据Raw data原始数据Raw data原始数据Raw data识别结果1识别结果2识别结果3融合算法预测&决策算法控制执行控制执行检测-激光雷达检测-毫米波雷达检测-摄像头端到端融合算法原始数据Raw data原始数据Raw data原始数据Raw data数据融合预测&决策算法控制执行检测跟踪预测L1-L2时代,大约2018年以前后融合ADAS算法L2+L3时代多种传感器崛起ADAS域控制器崛起前融合ADAS算法传感器感知算法尝试视觉+4D成像为主的传感器L3-L4时代尝试 人车互动局部尝试大模型AI的端对端自动驾驶61.21.2 AIAI感知:以