欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。
注意力机制是当下计算机视觉和自然语言处理中非常重要的内容,是模型设计的基础和核心方向,包含的内容非常多,本次我们给新手推荐计算机视觉注意力机制入门必须阅读的论文。
作者&编辑 | 言有三
1 什么是注意力机制
Itti and Koch model是最早研究注意力机制问题的模型之一,虽然不属于深度学习与神经网络领域,但对于想要追溯注意力机制的早期研究,了解显著目标检测方向的朋友来说,仍然是值得一读的论文。
文章引用量:5000+
推荐指数:✦✦✦✦✦
[1] Itti L, Koch C. Computational modelling of visual attention[J]. Nature reviews neuroscience, 2001, 2(3): 194-203.
2 空间注意力机制
Spatial Transformer Networks是极为经典的基于空间注意力机制的模型,它通过对输入数据中有效目标位置的学习,实现预处理变换,降低模型的学习难度,该思想被后续很多领域借鉴,广泛被用于进行空间位置对齐等用途,是必须重点阅读的文章。
文章引用量:6000+
推荐指数:✦✦✦✦✦
[2] Jaderberg, Max, et al. “Spatial Transformer Networks.” NIPS’15 Proceedings of the 28th International Conference on Neural Information Processing Systems, vol. 28, 2015, pp. 2017–2025.
3 通道注意力机制
SENet及其后续SKNet是最经典也最为简单,理解起来最直观的通道注意力机制模型,用于对不同的特征进行加强和抑制,从而实现特征的选择,是必须重点阅读的文章。
文章引用量:16000+
推荐指数:✦✦✦✦✦
[3] Hu, Jie, et al. “Squeeze-and-Excitation Networks.” 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2018, pp. 7132–7141.
[4] Li, Xiang, et al. “Selective Kernel Networks.” 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019, pp. 510–519.
4 自注意力机制
前面介绍的方法都需要通过额外的模块来实现注意力机制的学习,实际上基于特征本身也可以实现注意力机制,即自注意力模型,比较典型的代表是双线性模型(只有Bilinear CNN models)。
文章引用量:1800+
推荐指数:✦✦✦✦✦
[5] Lin T Y, RoyChowdhury A, Maji S. Bilinear CNN models for fine-grained visual recognition[C]//Proceedings of the IEEE international conference on computer vision. 2015: 1449-1457.
5 混合注意力机制
将空间注意力与通道注意力机制进行混合是一种非常直观的思想,它不需要过多创新的设计,却可以在经过串行或者并行的模块组合后获得性能超越,以CBAM/BAM为典型代表。
文章引用量:6000+
推荐指数:✦✦✦✦✦
[6] Woo, Sanghyun, et al. “CBAM: Convolutional Block Attention Module.” Proceedings of the European Conference on Computer Vision (ECCV), 2018, pp. 3–19.
[7] Park J, Woo S, Lee J Y, et al. Bam: Bottleneck attention module[J]. arXiv preprint arXiv:1807.06514, 2018.
6 如何进行实战
为了帮助大家掌握一些模型设计的重要方法,我们推出了相关的专栏课程《深度学习之模型设计:理论实践篇》,其中就有属于注意力机制的内容,感兴趣可以进一步阅读:
【视频课】AI必学,超20小时,4大模块,循序渐进地搞懂CNN模型设计与简单部署!
总结
本次我们简单介绍了注意力机制一些重要内容,空间注意力机制,通道注意力机制,自注意力机制,混合注意力机制,值得所有从业者掌握。
有三AI秋季划-模型算法组
如果想要永久系统性地跟随我们社区学习深度学习模型算法的相关内容,请关注有三AI-CV秋季划模型算法组,阅读了解下文:
【CV秋季划】模型算法与落地很重要,如何循序渐进地学习好(2022年言有三一对一辅导)?
转载文章请后台联系
侵权必究
标签:模型,论文,al,CV,初学,文章,et,机制,注意力 From: https://blog.51cto.com/u_14122493/5749355