首页 > 其他分享 >机器学习——卷积神经网络中的其他类型

机器学习——卷积神经网络中的其他类型

时间:2024-04-02 09:30:28浏览次数:26  
标签:空洞 plt 机器 卷积 shape 转置 神经网络 dilation

机器学习——卷积神经网络中的其他类型

卷积神经网络(Convolutional Neural Networks, CNNs)是深度学习领域中最重要的技术之一,它在图像处理、语音识别、自然语言处理等领域取得了巨大成功。在CNN中,卷积层是最核心的组成部分之一,而卷积操作又有许多不同类型,本文将重点介绍其中的两种特殊类型:空洞卷积和转置卷积。

1. 空洞卷积(Dilated Convolution)

空洞卷积是一种特殊的卷积操作,也称为膨胀卷积或扩张卷积。它在传统的卷积操作中引入了一个膨胀因子(或称为空洞因子),用于在卷积核中引入间隔。这样可以增大卷积核的感受野(Receptive Field),而不增加参数数量和计算量,从而提高了网络的感知能力。

空洞卷积的公式

假设输入数据为 X X X,卷积核为 K K K,膨胀因子为 d d d,则空洞卷积的计算公式如下:

Y ( i , j ) = ∑ m = 1 M ∑ n = 1 N X ( i + m d , j + n d ) ⋅ K ( m , n ) Y(i, j) = \sum_{m=1}^{M} \sum_{n=1}^{N} X(i + md, j + nd) \cdot K(m, n) Y(i,j)=m=1∑M​n=1∑N​X(i+md,j+nd)⋅K(m,n)

其中, Y ( i , j ) Y(i, j) Y(i,j) 表示卷积结果的第 i i i 行第 j j j 列的像素值, M M M 和 N N N 分别表示卷积核的高度和宽度。

空洞卷积的应用

  • 空洞卷积常用于图像分割、语义分割等任务中,能够提高网络对大范围上下文信息的感知能力,从而提高分割精度。

2. 转置卷积(Transpose Convolution)

转置卷积,也称为反卷积,是一种用于实现上采样(Upsampling)操作的卷积类型。在卷积操作中,我们将输入数据和卷积核进行卷积操作以提取特征,而在转置卷积中,我们可以通过卷积核进行上采样操作,将输入数据的尺寸放大。

转置卷积的公式

假设输入数据为 X X X,卷积核为 K K K,转置卷积的计算公式如下:

Y ( i , j ) = ∑ m = 1 M ∑ n = 1 N X ( i − m , j − n ) ⋅ K ( m , n ) Y(i, j) = \sum_{m=1}^{M} \sum_{n=1}^{N} X(i - m, j - n) \cdot K(m, n) Y(i,j)=m=1∑M​n=1∑N​X(i−m,j−n)⋅K(m,n)

转置卷积的应用

  • 转置卷积常用于图像生成、图像分割中的上采样操作,例如将低分辨率的特征图上采样至高分辨率,从而实现图像重建或语义分割等任务。

3. Python实现

下面我们使用Python代码对空洞卷积和转置卷积进行简单的演示:

import numpy as np
import matplotlib.pyplot as plt
import cv2

# 定义一个二维输入数据
X = cv2.imread('lena_std.tif', 0)

# 定义一个二维卷积核
kernel = np.array([[1, 0],
                   [0, 1]])

# 空洞卷积计算
dilated_result = np.zeros_like(X)
dilation_factor = 2  # 空洞因子为2
for i in range(X.shape[0] - kernel.shape[0] * dilation_factor + 1):
    for j in range(X.shape[1] - kernel.shape[1] * dilation_factor + 1):
        dilated_result[i, j] = np.sum(X[i:i+kernel.shape[0]*dilation_factor:dilation_factor, j:j+kernel.shape[1]*dilation_factor:dilation_factor] * kernel)

# 转置卷积计算
transposed_result = np.zeros((X.shape[0]*2-1, X.shape[1]*2-1))
for i in range(X.shape[0]):
    for j in range(X.shape[1]):
        transposed_result[i*2, j*2] = X[i, j]

# 可视化结果
plt.figure(figsize=(10, 4))

plt.subplot(1, 3, 1)
plt.imshow(X, cmap='gray')
plt.title('Original Image')
plt.axis('off')

plt.subplot(1, 3, 2)
plt.imshow(dilated_result, cmap='gray')
plt.title('Dilated Convolution Result')
plt.axis('off')

plt.subplot(1, 3, 3)
plt.imshow(transposed_result, cmap='gray')
plt.title('Transposed Convolution Result')
plt.axis('off')

plt.show()

在这里插入图片描述

通过上述代码,可以清晰地看到空洞卷积和转置卷积的效果。空洞卷积通过增加膨胀因子提高了感受野,而转置卷积则实现了输入数据的上采样。

标签:空洞,plt,机器,卷积,shape,转置,神经网络,dilation
From: https://blog.csdn.net/weixin_39753819/article/details/137231100

相关文章

  • 深度学习-卷积神经网络--Mask RCNN-62
    目录1.总体网络结构2.MaskRCNN细节3.loss4.预测参考链接:https://blog.csdn.net/qq_47233366/article/details/131326554?ops_request_misc=%25257B%252522request%25255Fid%252522%25253A%252522171196013016800213023649%252522%25252C%252522scm%252522%25253A%252522201......
  • YOLOv9有效改进专栏汇总|未来更新卷积、主干、检测头注意力机制、特征融合方式等创新![
    ​专栏介绍:YOLOv9改进系列|包含深度学习最新创新,助力高效涨点!!!专栏介绍    YOLOv9作为最新的YOLO系列模型,对于做目标检测的同学是必不可少的。本专栏将针对2024年最新推出的YOLOv9检测模型,使用当前流行和较新的模块进行改进。本专栏于2024年2月29日晚创建,预计四......
  • 论文阅读:图神经网络应用于知识图谱推理的研究综述
    论文链接:图神经网络应用于知识图谱推理的研究综述一、知识推理研究进展(1)知识图谱以节点和边的图结构存储数据,GNN可以有效整合知识图谱结构特征及属性特征,通过节点的领域信息聚合并更新节点,利用其强大的信息传播能力学习数据间的语义关系和潜在信息,使其可以很好地学习知识推理......
  • Baseswap交易所的得力助手:Base链市值机器人
    随着区块链技术的深入发展,Base链市值机器人这一创新产品应运而生。它是一种智能合约系统,能够实时监控市场动态,通过复杂的算法和大数据分析,自动执行买卖操作,旨在维护或提升项目市值。Base链市值机器人的核心功能在于自动化市场做市,无需人工干预,为项目提供流动性支持,同时协助项目......
  • 基于神经网络的心脏健康监测计算机毕设+完整代码+数据
        ......
  • 机器学习KNN算法实现例子
    KNN算法(k近邻算法)是一种有监督分类算法,它的原理非常简单,下面以一个简单的例子引入。已知两种酒的标签:赤霞珠和黑皮诺,在这个情景中,我们对酒进行分类的依据是酒精浓度和颜色深度,如下图所示:红色代表赤霞珠,紫色代表黑皮诺,图中有一分类未知的黄点,给定一个K值,我们找到距离黄点最近的K个......
  • 神经网络与深度学习课程总结一
    线性回归定义与基本概念:线性回归用于确定变量间相互依赖的定量关系,是一种统计分析方法。以房屋面积与销售价格的关系为例,通过拟合一条直线(模型)来预测未知面积的房屋价格。数学模型:模型表示为\(y=h_{\theta}(x)=\theta^Tx+\theta_0\),其中\(x\)和\(y\)分别是输入和输......
  • 机器学习的技术原理、应用与挑战
    在数字化浪潮的推动下,机器学习作为人工智能的核心技术之一,正以前所未有的速度改变着我们的生活和工作方式。机器学习通过模拟人类的学习过程,使计算机能够从数据中提取有用信息,并做出预测或决策。本文将深入探讨机器学习的技术原理、应用领域以及面临的挑战,以展现其深度和专业技术......
  • CyberDog测试视频 —— 【开箱】小米"限量"机器狗!被我玩坏了...
    地址:https://www.youtube.com/watch?v=3ntAhy3thXMPS.现在的智能机器人其实真的没有人们想象中的那么智能。感觉现在的智能机器人最为有用的功能一个是倒地自动重新站立,一个是急停控制。......
  • 【机器人】具有扰动抑制功能的有限时间基于方位角的领航者-跟随者编队控制(Matlab代码
     ......