当前位置:首页 > 报告详情

2017年解锁深度视频理解的潜力.pdf

上传人: 云闲 编号:95390 2021-01-01 61页 6.46MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了深度学习在视频理解领域的应用和进展。首先,作者概述了深度学习的发展历程,包括全连接神经网络、卷积神经网络、循环神经网络等。接着,作者详细介绍了深度学习在图像分类、物体检测、语义分割等图像理解任务上的应用,并引用了ImageNet分类挑战赛、COCO分割挑战赛等数据,展示了深度学习在这些任务上的优异表现。 然后,作者转向视频理解领域,指出视频理解面临的挑战,如高内容多样性、高数据量、实时要求等。作者介绍了微软研究院在视频分析方面的主要方法,包括视频人脸模糊、人体姿态估计、人群计数、人体识别、行为分析等。作者还详细介绍了基于骨架数据的行为识别方法,包括空间注意力模型和时间注意力模型,并展示了在NTU数据集上的优异表现。 最后,作者介绍了微软认知服务和Custom Vision平台,展示了如何将深度学习应用于实际应用和市场化。
深度学习如何改变视频理解? 视频分析面临哪些挑战? 微软认知服务如何助力视频理解?
客服
商务合作
小程序
服务号
折叠