北京航空航天大学:2025面向具身智能的大小脑模型协同算法研究及实践报告(37页).pdf

编号:915278 PDF  PPTX 37页 4.32MB 下载积分:VIP专享
下载报告请您先登录!

北京航空航天大学:2025面向具身智能的大小脑模型协同算法研究及实践报告(37页).pdf

1、面向具身智能的大小脑模型协同算法研究及实践盛律|软件学院2025-08-231具身智能的基本概念基于物理载体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性具身智能2具身智能的基本概念基于物理载体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性具身智能传统智能具身智能只可远观,被动接受别人告诉我这就是盒子可以打开,可以装东西我主动体验什么是盒子被动抽象接受主动具体体验重要意义具身智能因其能自主产生智能行为和适应性,是通用人工智能的可能起点3具身智能的关键任务导航问

2、答操作4具身智能的核心目标5具身智能的核心要素具身载体(Agent)具身模型(Model)智能算法物理载体相比具身载体的日趋成熟,具身模型的算法研究方兴未艾、挑战众多现状6具身模型应该考虑哪些能力?n 技能泛化、真实交互、本体扩展Skill(技能泛化)Reality(真实交互)Embodiment(本体扩展)Adapted from Jim Fans talk7具身模型的几种类型大小脑协同端到端8具身模型的最新进展:代表性新工作端到端VLA(2024.10)大小脑 hi robot(2025.02)混合(2025.04)大脑-小脑端到端VLA端测SDK(2025.03)具身大脑端到端VLA9具

3、身大模型离实用还有差距2023及之前2025及之后2024大模型大数据基本能力单任务单本体单场景多任务单本体单场景通用智能系统多本体多场景Scaling Law在大语言模型和多模态大模型上都得到了验证感知和理解决策和规划执行和协作评估和反馈端到端多模态大模型机器人Hand-Eye CoordinationRobotic Arm感知操作导航不好用不易用不通用需要“聪明”的大脑大模型和跨本体的大小脑协作框架,实现跨本体、跨场景、可泛化的具身智能10模型能力弱,未达到具身智能的“ChatGPT时刻”大脑、小脑、本体适配难度高一个模型只适用于一种本体本报告来源于三个皮匠报告站(),由用户Id:3494

4、61下载,文档Id:908399,下载日期:2025-09-10大小脑模型协同的技术路线仍有机会q 端到端模型虽决策高效,但泛化性和扩展性受限,受制于环境交互与硬件适配,难以适应多样场景。而模块化的大小脑协同框架凭借强泛化、可解释优势,正成为学界与业界的研究热点模块化:大小脑协同框架赋予具身智能体模块化优势,具备可扩展架构、高效开发与强适应性三大特性可泛化:基于VLM开发的大脑具备丰富的多模态认知能力,且不受小脑模型的影响可解释:决策过程更加透明,提升人机协同效率大小脑模型协同框架 是当前实现具身智能体更易落地的技术路线11传统多模态大模型能够作为“大脑”?n 传统VLMs在具身智能场景(长程

5、闭环操作、时空智能等)中面临严峻挑战以把锅放到抽屉里为例,该任务涉及多步骤的长时间交互,包括移动、抓取、放置等操作,并需要与锅、抽屉等物体进行持续交互GPT-4o在具身任务中表现欠佳12回顾:具身模型应该考虑哪些能力?n 技能泛化、真实交互、本体扩展Skill(技能泛化)Reality(真实交互)Embodiment(本体扩展)Adapted from Jim Fans talk13技能泛化:多智能体实现长时序开放具身任务解决DayLong-horizon open-Forestworld embodied tasksStoneWaterTask:Gather wood fromthe for

6、est,craft a stonesword on the plains,andthen use it to kill a pigduring the daytime nearwater and grassWoodPigGrassPlains14技能泛化:多智能体实现长时序开放具身任务解决Task:Gather wood fromthe forest,craft a stonesword on the plains,andthen use it to kill a pigduring the daytime nearwater and grassDayForestStoneWaterWoodO

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(北京航空航天大学:2025面向具身智能的大小脑模型协同算法研究及实践报告(37页).pdf)为本站 (active) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠