1、海外科技研究海外科技研究从谷歌看机器人大模型进展从谷歌看机器人大模型进展证券研究报告投资评级:()报告日期:行业推荐维持2023年11月19日分析师:傅鸿浩SAC编号:S1050521120004分析师:臧天律SAC编号:S1050522120001专题报告2 2投 资 要 点投 资 要 点大模型是远期人形机器人的必备要素:大模型是远期人形机器人的必备要素:人形机器人的特点在于通用性和泛化能力,远期可以替代人类完成多项任务。而大模型具有庞大的先验知识库与强大的通识理解能力,可以满足人形机器人通用性的场景要求和技能要求,不再仅限于完成某一类特定工作,而是进一步完成多类型任务。在机器人大模型上,思
2、维链可以帮助机器人拆分与分解一件事件如何完成,先解码出计划的步骤,再解码需要完成任务需要输出的动作。谷歌:从谷歌:从SaycanSaycan到到RTRT-X X,软件领军者,步步为营,模型高速迭代,软件领军者,步步为营,模型高速迭代从2022 年4月谷歌推出 Say-can 模型,初次引入大模型用于做任务理解和拆分,到RT-1使用传统神经网络的方法来执行SayCan的任务,再到RT-2将VLM大模型与RT-1的机器人执行数据集一起微调训练,最后创建Open X数据集训练出模型RT-X。谷歌的模型持续高速迭代,逐步向底层运动控制方面发展。机器人产业仍然处于较为早期阶段,数据、数据与细分场景模型搭
3、建均有产业机会机器人产业仍然处于较为早期阶段,数据、数据与细分场景模型搭建均有产业机会目前大部分机器人大模型仍然以单机械臂抓取为主,且模型的框架仍然在持续变化。可以明确看到大模型现在对底层的控制仍然偏弱。我们认为未来产业机会主要有三个方面,1、算力:机器人需要快速与环境交互,同时大模型本身要计算和存储空间。二者叠加之下机器人所需的参数和算力比自动驾驶以及大语言模型都要更大,因此对于算力的需求将在后续逐步有所体现。2、数据:机器人需要通过多种传感器感知环境状态,然后执行实际动作来完成任务,一方面需要3D环境数据,另一方面需要的是主动数据,此类数据量极度稀缺。3、细分场景的模型:未来大模型在机器人
4、的应用,或许是通过底层的通识大模型+细分场景模型微调获得,其中底层架构的通识大模型有望参考类似手机安卓的模式由头部的AI企业开源,而细分场景的模型(同时也包括所需的数据)才是未来大部分企业可以竞争的市场。在这个赛道中,数据仍然是模型的基础。诚信、专业、稳健、高效请阅读最后一页重要免责声明BXfWuWdUpX4XgVuX7N9R6MpNnNoMoNjMmNoPeRoMrQ7NqRoNwMoNoRNZmOyQ3 3风 险 提 示风 险 提 示机器人下游发展不及预期机器人下游发展不及预期算力与算法模型更新迭代不及预期算力与算法模型更新迭代不及预期行业竞争加剧风险行业竞争加剧风险诚信、专业、稳健、高效
5、请阅读最后一页重要免责声明目 录CONTENTS2 2.从从SaycanSaycan到到RTRT-X X谷谷歌机器人模型高速迭代歌机器人模型高速迭代3 3.目前机器人大模型产业化目前机器人大模型产业化存在的问题与展望存在的问题与展望1 1.大模型是人形机器人的必备大模型是人形机器人的必备要素要素4 4诚信、专业、稳健、高效请阅读最后一页重要免责声明0101 大模型是人形机器人的必备要素6 6大模型是人形机器人的必备要素大模型是人形机器人的必备要素诚信、专业、稳健、高效请阅读最后一页重要免责声明长期来看,人形机器人的最大优势在于通用性:长期来看,人形机器人的最大优势在于通用性:人形机器人的特点在
6、于泛化能力。如果只为解决单一或少数场景的应用,则特定专用机器人足以满足要求(如酒店服务机器人,扫地机器人等),从第一性原理来说,机器人之所以拟人,其根本目的在于完成多样化的任务能爬楼梯,能按电梯,能提重物等完成所有人类所需的各种任务。通用性的实现依赖大模型的应用(体现在感知与识别):通用性的实现依赖大模型的应用(体现在感知与识别):大模型具有庞大的先验知识库与强大的通识理解能力。可以满足人形机器人通用性的场景要求和技能要求。不再仅限于完成某一类特定工作,而是进一步完成多类型任务。目前机器人的应用基础是代码,机器人工程师需要编写代码和规范来控制机器人行为,这个调试过程缓慢、昂贵且低效,使用场景有