中移智库:2024年AI大模型技术变迁情况回溯报告(18页).pdf

编号:185285 PDF  DOCX 18页 657.04KB 下载积分:VIP专享
下载报告请您先登录!

中移智库:2024年AI大模型技术变迁情况回溯报告(18页).pdf

1、20242024 年年 AIAI 大模型技术变迁情况回溯大模型技术变迁情况回溯中国移动智慧家庭运营中心2024 年 12 月中移智库 摘要摘要2024 年大模型技术快速演进,相较于 2023 年的大小模型之争,技术的进步方向逐步向应用落地方向倾斜,降低端侧模型部署门槛,缩短模型推理时延,提升模型交互能力,大模型的发展迎来了新的变化。本文将从技术视角梳理 2024 年以来大模型各个领域发生的变化,以行业领先实践为佐证,提出大模型技术演进方向。语言大模型发展迎来新范式,通过强化学习优化内部思维链策略,以提升复杂逻辑推理能力。多模态大模型架构正向端到端演进,决策准确性和灵敏度提升推动机器人场景应用落

2、地。在视频生成领域,DiTs 架构的可扩展性优势显现,推动 AI 应用商业化。在硬件部署方面,模型压缩、安全控制等技术正降低部署门槛。在智能体实践方面,垂类大模型开始在智能终端环境应用。在合成数据策略方面,自我奖励语言模型生成合成数据,试图打破数据瓶颈。2/18中移智库 一、一、语言大模型领域:后训练阶段规模定律显现,语言大模型领域:后训练阶段规模定律显现,以强化学习优化内部思维链策略或成大模型发展新范式以强化学习优化内部思维链策略或成大模型发展新范式在 2024 年之前,语言类大模型的参数量快速扩展带来的“规模定律”获得业界普遍共识,因模型参数规模扩展、数据集质量提升以及人工微调为语言模型展

3、现出前所未有的泛化能力和通用能力。而今年 9 月 OpenAI 公开发布 o1 推理大模型后,使得语言类大模型在解决专业科学、代码和数学模型等复杂逻辑推理问题的能力上更进一步。通过研究 o1 的技术原理发现,其以强化学习优化模型内部思维链推理逻辑步骤,模拟人的思考过程,以加深对问题的理解程度从而提升处理复杂推理任务能力。o1 推理大模型的发布标志著语言大模型的“规模定律”正延展至后训练阶段,OpenAI 首席技术官米拉穆拉迪称通过强化学习优化思考策略或将是未来大模型发展新范式。通过强化学习学会了精炼其思维链并优化所用的策略,学会识别并纠正错误,将复杂的步骤分解为更简单的部分,并在 3/18中移

4、智库 当前方法无效时尝试不同的途径。通过这个过程显著提升了模型的推理能力。在多个高难度推理基准测试中,o1 的表现出色,超越人类专家和 GPT-4o,展示了其强大的推理能力和在某些领域的专业知识。图1:以图文匹配任务多模态大模型实现架构无独有偶,斯坦福团队今年 3 月发布论文提出的 Q-STaR 语言模型也有类似的原理,利用强化学习优化中间图例过程,实现并行原理生产、混合原理预测、优化原理生成的能力。其测试在 7B 参数规模的语言类模型上表现优异,经调整后的语言模型在零样本测试准确率大幅提升。二、二、多模态大模型领域:主流模型架构从跨模态向多模态大模型领域:主流模型架构从跨模态向端到端演进,提

5、高决策准确性的同时提升模型灵敏度,以端到端演进,提高决策准确性的同时提升模型灵敏度,以 4/18中移智库 满足无人驾驶、人形机器人应用场景下的需求满足无人驾驶、人形机器人应用场景下的需求过去业界多模态大模型多采用基于语言模型为主干的跨模态架构,其往往通过模态特定的编码器(RNN、CNN)转化为统一的向量表示后再输入语言模型,依靠语言模型来处理模态融合后的特征交互。但是这样带来的问题是任务响应时间长、损失模态间交互细节。图2:以图文匹配任务多模态大模型实现架构2024 年以来以 GPT-4o、Gemini 为代表的多模态大模型纷纷开始使用端到端支持多种模态统一输入输出的模型架构。在该架构下引入分

6、词器,通过将图像、音频等连续信号转换为离散 5/18中移智库 的 token序列,然后与文本模态做统一表示,共同输入到基于自注意力的 Transformer等模型中,实现端到端的学习。通过简化了模型的输入接口,减少模态间的信息损失,提升了模型处理即时任务的响应时间。图3:端到端多模态模型架构图2024GTC 大会上,英伟达发布了人形机器人项目 GR00T,旨在开发人形机器人的通用基础模型,该模型便是基于控制、执行和决策三个层级分层实现模型的端到端训练学习,最终通过合并反向反馈来得到精准输出结果,相比于直接通过语言大模型来让机器人实现自主决策可大幅提升机器人处理复杂任务的 6/18中移智库 精度

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(中移智库:2024年AI大模型技术变迁情况回溯报告(18页).pdf)为本站 (securities) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠