《大算力异构芯片赋能具身智能:从实时控制到空间计算 – 隋伟博士 地瓜机器人技术副总裁.pdf》由会员分享,可在线阅读,更多相关《大算力异构芯片赋能具身智能:从实时控制到空间计算 – 隋伟博士 地瓜机器人技术副总裁.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、隋 伟 博地机器技术副总裁算异构芯赋能具身智能从实时控制到空间计算共通的三大计算任务计算架构开发平台智能算法产业生态源自智能驾驶,通往通用智能具身智能:堪比“计算机诞生”级的颠覆式创新趋势一:大模型驱动具身机器人向AGI跃迁截屏2025-04-25 03.20.19截屏2025-04-25 03.20.19截屏2025-04-25 03.20.19截屏2025-04-25 03.20.19顶层任务拆解任务运动规划执器械优点:模块化可解释性强、数据依赖少缺点:依赖规则,可扩展性差、法处理由度本体优点:数据驱动,模型上限,可处理复杂任务缺点:不可解释性,强依赖数据,前泛化性差优点:数据真实可,有效
2、性缺点:采集成本、效率低优点:采集效率,成本低,数据多样缺点:与真实数据存在差异,数据上限低基础模型数据驱动海量数据长程数据G1基础自动化G2通用原子技能G3端到端操作技能G4端到端操作大模型G5AGI商场/租车/导览/导购/巡检桌面陪玩/教育2025-2030年硬件成熟成本降低2030-年硬件标准化模型能力提升家庭服务危险场景劳动力短缺场景工厂生产n手臂操作精度要求低n交互体验要求高n硬件支持完成任务n智能化低,适合刚需、容错率场景n本体标准化且起量n数据飞轮效应凸显,具备通用性趋势一:大模型驱动具身机器人向AGI跃迁趋势二:以Transformer为核心的基础模型正在重塑机器人技术栈多模态
3、模型模型容量增:B到B数据量增加端到端模型VLA通场景VLN视觉语导航VLM+ASR+TTS视觉基础模型VFMGrounding趋势三:模型架构趋于统一,满足具身机器人场景各种需求传感器VLA执行器传感器System2执行器System1共通的三大计算任务具身机器人大小脑需要更适合的计算平台大脑System2“认知”慢系统小脑System1“直觉”快系统功能需求计算需求任务规划视觉推理语言理解高算力高能效高实时高可靠GPU/NPU、MCU运动策略实时控制状态跟踪S100 算控一体化计算平台大小脑协同,大小模型协作 驱动具身机器人大小脑协同进化4核 R52+MCU运控核RDK S100/S100
4、P6核 A78AE CPU逻辑核RDK S100PRDK S100全新BPUNash算核RDK S100PRDK S100全新 BPU Nash 架构支持算法高速运行改进的三级缓存和高带宽 DDR,突破内存瓶颈80/128 TOPS 灵活选择,能效密度优化,满足不同场景需求新增多线程VPU(Vector Process Unit)单元,支持FP16 和 FP32 浮点计算,提升 Layernorm、Softmax 等敏感算子的精度和性能支持超过 160+ONNX 标准算子,覆盖 CNN 和Transformer 等主流算法,100%硬件加速YOLO12l检测YOLO12m检测CenterPoi
5、nt3D感知模型BEV多任务模型FPS 环境时序预测、复杂环境交互式规 BEVFormer、PETR、UniAD VPU、DataTransformer Engine、紧耦合异构计算优化BPUNashBPU持续迭代,构建具身机器人的大小脑引擎实现效率最大化、具备高灵活性及高可编程性Transformer 在特征融合中扮演关键角色Transformer 在统一网络框架下具有极大的潜力强大的机器视觉处理能力是具身智能的基石CNN 是当前最成熟且广泛应用的算法大量端侧可直接部署的智能算法语音、检测、追踪、OCR、雷达检测等大语言模型、多模态模型机械臂、四足、人形等控制算法FoundationSter
6、eoASRTTSPaddleOCRVGGTGroundingDinoQwen2 1.5BDeepseekQwen2 7BInternVL2ACTwalk-these-waysPPOASAPNash纳什架构Bayes贝叶斯架构Bernoulli 2.0伯努利2.0架构Bernoulli 1.0伯努利1.0架构Gauss高斯架构超强异构系统,构建具身机器人核心驱动力低频低频高频高频高频低频大脑System2“认知”慢系统小脑System1“直觉”快系统传感输入状态检测机器人任务规划视觉推理语言理解运动策略实时控制S100CPUBPUMCUBPU+CPU+MCU超强异构,计算+控制的最佳方案1.2G