《2020年终大会-计算机视觉:11-1.pdf》由会员分享,可在线阅读,更多相关《2020年终大会-计算机视觉:11-1.pdf(42页珍藏版)》请在三个皮匠报告上搜索。
1、 ? 百度视频技术应用场景 爱奇艺爱奇艺 长视频: 10分钟+ 手机百度资讯流 手机百度资讯流 短视频:110分钟 好看视频好看视频APP APP 短视频:110分钟 全民小视频 全民小视频 微视频:1分钟以内 百度视频AI2B技术应用场景 车路协同车路协同 人体流量估计人体流量估计 视频基础技术研究及应用 研发 平台 PaddleCVPaddleCloud训练平台 视频语义分析 视频质量 视频检索 超分辨率 自适应编解码 GAN 分割/关键点/AR 视频跟踪 相似度量 人/车/物 检测 预训练模型 分类/检测/分割 NAS 视频理解 视频编辑 视频监控 通用视觉 视频AI 视频AI 视频基础
2、技术研究及应用 研发 平台 PaddleCVPaddleCloud训练平台 视频语义分析 视频质量 视频检索 超分辨率 自适应编解码 GAN 分割/关键点/AR 视频跟踪 相似度量 人/车/物 检测 预训练模型 分类/检测/分割 NAS 视频理解 视频编辑 视频监控 通用视觉 视频AI 视频AI 视频理解技术Demo 视频分类VS图像分类 ? ? ? T? ? ? 视频识别特点:计算量大、多模态、时序多帧信息、多标签 视频分类技术创新 视频分类特点:计算量大、多模态、时序多帧信息、多标签 Aen%onCluster CVPR2018,多帧信多帧信 息建模 息建模 KeylessAen%on A
3、AAI2018,多模态信多模态信 息融合 息融合 StNet AAAI2019,时序信时序信 息优化 息优化 AAAI2020,多标签多标签 图卷积 图卷积 千万级大规模视频分类框千万级大规模视频分类框 架架特征学习与序列建特征学习与序列建 模解耦 模解耦 视频分类 注意力聚类网络 帧间冗余性 帧间冗余性 局部判别性局部判别性 近似无序性近似无序性 多段可分性多段可分性 思想思想 Attention Clusters: Purely Attention Based Local Feature Integration for Video Classification, CVPR 2018 视频分类注意力聚类网络 优点: 注意力网络优化:多组attention参数有效引入diversity,能学习到不同的注意力模式 Best single model in Best single model