当前位置:首页 > 报告详情

20231125 王文冠_watermark.pdf

上传人: 张** 编号:155519 2024-02-15 65页 8.87MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了基于知识与大模型驱动的具身智能技术。首先,提出了基于BEV 3D感知的具身决策方法,通过2D环视图转换为BEV特征,结合3D目标检测和空间占用预测,实现对3D空间的感知,提升导航智能体的性能。其次,提出了基于世界模型的推理决策方法,通过构建世界模型,智能体可以预测未来状态,生成大量可能的路径并择优执行。然后,提出了基于大-小模型协同的具身交互方法,通过多模态大模型进行推理,动作预测与语言交互小模型负责具体任务执行和双向语言交互。最后,提出了知识和大模型双驱动的智能规划方法,基于大语言模型、视频任务小模型和外部知识,构建智能规划智能体,解决真实动态世界中的任务。
基于BEV 3D感知的具身决策如何实现? 知识与数据双驱动的智能推理如何进行? 大小模型协同的具身交互有哪些优势?
客服
商务合作
小程序
服务号
折叠