当前位置:首页 > 报告详情

彭厚文-腾讯混元多模态大模型技术实践.pdf

上传人: 哆哆 编号:630963 2025-04-19 39页 11.15MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了腾讯混元多模态模型的研发和应用。该模型由彭厚文团队负责,结合了多模态基础模型研发和微软亚洲研究院的主管研究员经验。模型在人工智能领域国际期刊和会议上发表了30余篇论文,担任Pattern Recognition期刊副主编,ACM Multimedia会议领域主席。混元多模态大模型技术实践与思考包括:多模态基础模型研发、数据获取与处理、模型训练、模型推理、偏好对齐和模型评测等方面。模型在多个领域取得了显著的效果,如广告理解、短视频多模态理解、直播带货实时理解、文档搜索审核等。未来研究方向包括:数据获取与处理、MoE结构、模型训练、模型推理、偏好对齐和模型评测等。此外,腾讯混元还开源了多个大模型工程框架,如混元DIT、混元-Large和混元-3D等。
"腾讯混元多模态模型有哪些创新之处?" "如何利用混元多模态大模型提升业务应用效果?" "未来混元大模型的发展方向是什么?"
客服
商务合作
小程序
服务号
折叠