当前位置:首页 > 报告详情

6-3 游戏视频的多模态与细粒度理解分析技术.pdf

上传人: 云闲 编号:102373 2021-01-01 36页 11.61MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了游戏视频的多模态与细粒度理解技术,包括游戏视频理解简介、游戏视频事件检测框架、游戏视频细粒度理解技术、游戏视频多模态理解技术四个部分。核心数据包括:1)游戏视频细粒度理解技术中,多尺度模板匹配目标检测识别准确率97%,特征点匹配加Homography对应目标检测识别深度神经网络目标识别准确率90%;2)游戏视频多模态理解技术中,EfficientNetVggishBert模型在视频数据量相对较少、长视频信息提取不足、标签数量不平衡等问题上进行优化,提升模型性能;3)多模态预训练模型中,视频模态全局Clip模型、图像模型连续视频抽帧结果、音频模型密集抽帧连续音频抽帧结果、文本模态短文本处理等技术的应用,提高模型对多模态信息融合的理解能力;4)优化损失函数中,Focal Loss、ASY Loss等方法的应用,解决正负样本不平衡问题,提升模型性能。本文还提到了多模态技术在游戏视频分类、推荐、内容分析等业务场景中的应用。
"游戏视频多模态理解技术如何提升内容推荐效率?" "如何通过游戏视频细粒度理解技术实现精准的事件检测?" "游戏视频多模态理解技术在内容版权保护中的应用前景如何?"
客服
商务合作
小程序
服务号
折叠