前言
卷积神经网络在许多计算机视觉任务中取得了显著成功,例如图像分类和目标检测。然而,在图像分辨率较低或目标较小的更困难任务中,它们的性能会迅速下降。在本文中,指出这根源于现有CNN架构中一个常见但有缺陷的设计,即使用了步幅卷积和/或池化层,这导致了细粒度信息的丢失以及学习到的特征表示效果较差。为了解决这个问题,提出了一种新的CNN构建模块,称为SPD-Conv,以取代每个步幅卷积层和每个池化层。SPD-Conv由一个空间到深度(SPD)层和一个非步幅卷积(Conv)层组成,可以应用于大多数CNN架构中,在低分辨率图像和小目标的更困难任务中显著优于最先进的深度学习模型。
SPDConv理论详解可以参考链接:论文地址
SPDConv代码可在这个链接找到:代码地址
本文在YOLOv9中引入SPDConv(全维度动态卷积),实现了大幅度涨点,代码已经整理好了,跟着文章复制粘贴,即可直接运行