当前位置:首页 > 报告详情

6-5 基于图的视觉分类模型的可解释性.pdf

上传人: 云闲 编号:102432 2021-01-01 39页 9.90MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文探讨了基于图的图像分类的可解释性问题。作者首先指出,虽然卷积神经网络(ResNet)在图像分类中表现出色,但其难以捕捉图像中的成对关系、全局上下文和属性特征。随后,文章介绍了图神经网络(GCN)、图注意力网络(GAT)等,它们在预测方面具有优势。文章还讨论了图胶囊网络,包括胶囊网络和图注意力在GraCapsNet图像分类中的应用。此外,文中提出了一个关于视觉变换器的图视角,探讨了其自我关注操作和图卷积运算。研究还比较了DeiT和ResNet在面对自然干扰和对抗性干扰时的鲁棒性,发现DeiT对自然干扰更鲁棒,但对对抗性干扰更脆弱。最后,文章提出,在特征空间而不是输入空间建模视觉概念更有效,并且当前先进的视觉模型隐式地将图像表示为图,解释可以从图表示的角度创建。
图像分类中图神经网络如何工作? 图卷积网络在图像分类中的应用? 视觉变换器如何有效地忽略自然干扰?
客服
商务合作
小程序
服务号
折叠