当前位置:首页 > 报告详情

牛建伟- 蔚来座舱多模态大模型的应用实践.pdf

上传人: le****ng 编号:186908 2024-12-17 32页 6.35MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了蔚来座舱多模态大模型的应用实践。主要内容包括: 1. 蔚来多模态大模型的价值定位:多模态大模型是智能座舱3.0的底层核心技术之一,也是蔚来智能座舱塑造差异化的重要方向。 2. 蔚来MLLM的技术路径:采用视觉大模型和语音多语言大模型各自推进,最终实现音视觉完全融合的技术路径。 3. 视觉模态模型的技术实践:以多元视觉模型为核心,利用大语言模型的通识能力,充分挖掘视觉模态模型的感知和理解潜力。 4. 听觉模态模型的技术实践:采用无监督预训练+SFT的方案进行多任务多语言语音大模型的训练,模型训练分为三个阶段。 5. 端侧部署方案:介绍NIO-MLLM的软件方案和端侧部署现状与挑战。 6. 总结与展望:多模态大模型是智能座舱的底座模型,车载场景具备更强的算力、更强的环境感知能力以及设备操控能力,多模态大模型具备将汽车塑造为新一代智能体的潜力。
蔚来多模态大模型如何实现智能座舱的主动安全功能? 视觉模态模型技术实践中的多元视觉编码器有何优势? 听觉模态模型技术实践中的动态Acoustic Adapter Module (DAAM)如何提升多语种语音特征的动态适配能力?
客服
商务合作
小程序
服务号
折叠