首页 > 其他分享 >卷积和转置卷积的输出尺寸计算

卷积和转置卷积的输出尺寸计算

时间:2024-09-19 22:55:00浏览次数:12  
标签:kernel stride 卷积 padding 转置 尺寸 size

卷积和转置卷积的输出尺寸计算

卷积

h'是输出的高,h是输入的高,k_h是卷积核的高
w类似

stride=1

h' = h - k_h + padding*2 + 1

通用公式

stride=1就是上面的公式

 h' = (h - k_w + 2*padding + stride)//stride 

一些常见的卷积

  • 高宽不变的卷积kernel_size=3, padding=1,这样的卷积常用于特征提取加深网络层数避免信息丢失,以及在深层网络(如 ResNet)中保持输入输出尺寸一致。
  • 宽高减半的卷积:如kernel_size=3, stride=2, padding=1,一般是将stride=2,若kernel_size=5的话,padding就要为2了。(也可以用kernel_size=2,stride=2的池化来做。两者各有优点:卷积核是可学习的参数,可以提取复杂的特征,但计算量比池化更大;池化没有可学习的参数,计算效率高,同时有一定的平滑特征图的作用,但会丢失一些细节信息)。
  • 1×1的卷积:1×1 卷积改变特征图的通道数,而不改变空间维度(即图像的高和宽)。通常用于降维从而减少计算复杂度,或者升维进行更丰富的特征表示。1×1也可以认为是逐像素的全连接层(其对每个像素位置上不同通道的特征进行加权线性组合。这与全连接层的机制非常相似,都是对输入的所有特征进行线性组合)。

转置卷积

计算公式,其实就是上面公式的逆运算

h' = h*stride - 2*padding + k_w - stride

若想要将图像高宽扩大p倍,就可以让stride=p,然后调整k_w和padding,比如,input image shape: torch.Size([561, 728, 3]) 变为 output image shape: torch.Size([1122, 1456, 3]),先让stride=2,然后kernel_size=4(这样滑动一次只滑过窗口的一半),然后看padding取多少,可以让 -2*padding + k_w - stride = 0,这里padding就取1。

再比如,高宽被缩小32倍后为 torch.Size([1, 512, 10, 15]) ,想要恢复原尺寸:首先stride = 32kernel_size还是取stride的两倍64,然后让 -2*padding + k_w -stride=0,那么padding就取16

标签:kernel,stride,卷积,padding,转置,尺寸,size
From: https://blog.csdn.net/jokerMingge/article/details/142371731

相关文章

  • 分类预测 | Matlab实现SMA-CNN-SVM黏菌算法优化卷积支持向量机分类预测
    分类预测|Matlab实现SMA-CNN-SVM黏菌算法优化卷积支持向量机分类预测目录分类预测|Matlab实现SMA-CNN-SVM黏菌算法优化卷积支持向量机分类预测分类效果基本描述程序设计参考资料分类效果基本描述1.Matlab实现SMA-CNN-SVM黏菌算法优化卷积支持向量机分类预......
  • 时序预测 | Matlab实现PSO-CNN粒子群优化卷积神经网络时间序列预测
    时序预测|Matlab实现PSO-CNN粒子群优化卷积神经网络时间序列预测目录时序预测|Matlab实现PSO-CNN粒子群优化卷积神经网络时间序列预测预测效果基本介绍程序设计参考资料预测效果基本介绍Matlab实现PSO-CNN粒子群优化卷积神经网络时间序列预测(完整源码和数据)1.data为数据集,单......
  • CNN-SVM模型 | Matlab实现SO-CNN-SVM蛇群算法优化卷积神经网络结合支持向量机多特征分
    CNN-SVM模型|Matlab实现SO-CNN-SVM蛇群算法优化卷积神经网络结合支持向量机多特征分类预测目录CNN-SVM模型|Matlab实现SO-CNN-SVM蛇群算法优化卷积神经网络结合支持向量机多特征分类预测分类效果基本描述程序设计参考资料分类效果基本描述1.Matlab实现SO-CNN-SVM蛇群算法优化......
  • CAS-ViT:用于高效移动应用的卷积加法自注意力视觉Transformer
    近年来,VisionTransformer(ViT)在计算机视觉领域取得了巨大突破。然而ViT模型通常计算复杂度高,难以在资源受限的移动设备上部署。为了解决这个问题,研究人员提出了ConvolutionalAdditiveSelf-attentionVisionTransformers(CAS-ViT),这是一种轻量级的ViT变体,旨在在效率和性......
  • YOLOv9改进策略【卷积层】| GnConv:一种通过门控卷积和递归设计来实现高效、可扩展、平
    一、本文介绍本文记录的是利用GnConv优化YOLOv9的目标检测方法研究。YOLOv9在进行目标检测时,需要对不同层次的特征进行融合。GnConv可以考虑更高阶的空间交互,能够更好地捕捉特征之间的复杂关系,从而增强特征融合的效果,提高模型对目标的检测能力。文章目录一、本文介绍二......
  • YOLOv9改进策略【卷积层】| SCConv:即插即用,减少冗余计算并提升特征学习
    一、本文介绍本文记录的是利用SCConv优化YOLOv9的目标检测网络模型。深度神经网络中存在大量冗余,不仅在密集模型参数中,而且在特征图的空间和通道维度中。SCConv模块通过联合减少卷积层中空间和通道的冗余,有效地限制了特征冗余,本文利用SCConv模块改进YOLOv9,提高了模型的性能......
  • PbootCMS上传缩略图截取尺寸缩小变模糊解决方案
    如果你在使用PBootCMS时遇到上传图片后缩略图被自动截取且尺寸变小的问题,可以通过调整配置文件中的缩略图尺寸来解决。具体步骤如下:步骤找到配置文件:打开 \config\config.php 文件。修改缩略图配置:找到缩略图配置部分,并调整 max_width 和 max_height 的值。......
  • 基于卷积神经网络的图像去噪研究 毕业设计(案例展示)
    开发一种基于卷积神经网络(CNN)的高效图像去噪技术。图像去噪是图像处理领域的一个关键挑战,对于图像质量的提升、目标检测、目标跟踪以及图像分析等研究领域至关重要。CNN因其在图像识别和处理任务中的卓越性能而成为本研究的核心工具。研究内容包括分析图像去噪的重要性、评述当......
  • AD设计板子尺寸等,设计PCB的一些个人总结技巧
    板框大小评估第一步:首先先左键按紧,框选好你的元件第二步:进行板框大小评估   工具 - 器件摆放 - 在矩形区域摆放之后通过鼠标框选矩形区域,元件会自动按照框选的范围进行摆放。会摆出一个大概的位置板框绘制 第一步:点击Mechanical1,切换到机械层。(记得先把shee......
  • UNO.Skia.Gtk 设置窗口尺寸变化方法
    本文记录一个简单的在UNO.Skia.Gtk应用里面,配置GTK平台修改窗口尺寸的方法为了全平台通用性,推荐是走定义接口加平台注入的方式。定义的接口如下publicinterfaceIWindowActivator{voidResizeMainWindow(Sizesize);}这里为了方便起见,直接使用静态属性注入方法,如......