首页 > 其他分享 >卷积认知

卷积认知

时间:2023-10-19 11:44:08浏览次数:40  
标签:卷积 认知 信息 二维 信号 点云 翻转

前言

博主研究生时期研究的课题有关于点云的深度学习。对于点云这一三维数据形式的深度学习研究,相关工作启发于二维图像深度学习处理,由此对于点云的特征提取也采用卷积这一形式。但在实践过程中,点云的卷积衍生出了多种方法。

因此该随笔主要内容为对卷积这一概念的个人理解与梳理。

卷积字面意义的探讨

参考他人的见解1与Wiki2,在数学定义上,卷积是一种使用两个函数\(f\)与\(g\)的数学算子,即将\(g\)翻转与平移后与\(f\)相乘形成的函数的积分。换句话说,可以看作是\(g\)经过翻转与平移后,成为函数\(f\)的权重,最后进行加权相加得到卷积的结果。

如果将卷积二字拆解成"卷"与"积",个人认为在造这个词的时候有所参考。"卷"代表着翻转平移(很像拿出一张纸卷起来,这样卷起的部分既有翻转并且随着卷的过程一直在移动),"积"则是积分或是加权相加。

但实际上,在深度学习代码实践的时候,往往不会特别在意"卷"中的翻转。以二维图像CNN举例,通常定义一个\(n\)x\(n\)的卷积核后就让它在图像上滑动了。

因此,赞同他人的观点,卷积在各个领域均有所应用的情况下它的概念有所变化,翻转这一操作可以扩大为一种约束的概念。即卷积就是,在某种约束下,两个函数\(f\)与\(g\),随着\(g\)的移动计算得到\(f\)与\(g\)的乘积的积分(加权相加)。

卷积中约束为翻转的进一步理解

参考1,信号处理中有常见的情景,使得卷积中的约束变为翻转。

信号处理图解

在物理意义上,时刻\(t=0\)的时候输入的信号大小为\(f(0)g(0)\),即输入信号的强度乘以系统的响应阈值(在了解了工作中一些传感器后,对此有更深的理解,很多接收信号的器件一定会存在自身物理上的限制,因此就有了系统响应之类的概念的存在)。时刻\(t=10\)的时候\(t=0\)输入的信号大小变为\(f(0)g(10)\)。

卷积在此处的意义为,某一时刻总的接收信号为之前信号与系统响应的加权相加。因此最终的计算图解变为下图。

信号处理图解

系统响应函数在此处进行了翻转后,对于总的接收信号计算就变得更为直观。因此翻转在该问题下也代表着时间上的一种约束。

神经网络中的卷积

事实上在深度学习的研究中卷积已经变成了某种框架了,为了更好的提取特征卷积的变体相当之多(卷积核可以变,卷积方式也可以变)。

卷积在深度学习的本质作用是过滤并获取对后续任务有用的特征。Pytorch代码里通常有一维卷积,二维卷积,三维卷积。卷积的维度主要区别在于卷积的移动方向,即一维卷积只往一个方向移动,二维卷积往两个方向移动,三维卷积则是三个方向。

卷积中主要会考虑到卷积核移动的步长(stride),同时因为考虑尺寸的关系,有时候需要对被卷积数据的周围进行填充数据(padding),或者对卷积核进行扩充(空洞卷积,主要作用为不想要pooling把相当数量的信息丢失又想减少计算量)。

二维卷积的形象动图3,该作者做的比较好。

神经网络中卷积可行性的思考

参考李宏毅课程对CNN的探讨4,卷积可行的理由在于模仿人的信息输入与处理。人对于数据的认知和判断往往在于抓住关键信息,而抓住关键信息的同时也会考虑到信息周围,最终全局的信息也是构成认知的重要部分。卷积网络的设计天然的关注数据中的一小部分,并且在层层卷积的过程中信息会逐渐集中,相当于慢慢的从局部再结合周围乃至全局的信息。可以认为卷积的过程是逐渐将数据的特征提取优化的过程。

参考

<div id="refer-anchor-1">

- [1] 如何通俗易懂地解释卷积-palet的回答

<div id="refer-anchor-2">

- [2] Wikipedia

<div id="refer-anchor-3">

- [3]  A guide to convolution arithmetic for deep learning

<div id="refer-anchor-4">

- [4] 李宏毅机器学习2021

标签:卷积,认知,信息,二维,信号,点云,翻转
From: https://www.cnblogs.com/tavonl/p/17774005.html

相关文章

  • 什么是卷积
    参考文献:https://blog.csdn.net/zhibing_ding/article/details/125254670 不断的学习,就会有不同的认识和理解. 卷积操作的基本思想是提取输入数据的局部特征,这有助于网络捕捉图像中的空间结构和模式。卷积核是一个小的矩阵,通常是正方形的,它在输入数据上进行滑动。在每个位......
  • 6.卷积神经网络
    卷积层的作用一在说卷积层之前,我想先说一下为什么会有卷积层;前面几个博客提到的神经网络都是用矩阵乘法来建立输入和输出之间的关系,如果有n个输入和m个输出,那么就需要n*m个参数;如果n和m很大并且有多个全连接层的话需要的参数数量是庞大的;卷积层就是通过三个特性来解......
  • SOA认知和方法论
    1前言1.1架构分类在软件设计领域,企业架构通常被划分为如下五种分类:如何理解架构分类依据及其彼此之间的关系?业务是企业赖以生存之本,因此业务架构是基础、是灵魂,其他一切均是对业务架构的支撑;根据业务架构形成与之相应的产品架构和数据架构;最后通过技术架构落地实施。应用架......
  • 【分享】讯飞星火认知大模型Python调用上下文测评
    一个很常用的用法,先是system提示,然后是user问题{"role":"system","content":"假设你是个程序员,你的微信是xxxxxxxx"},{"role":"user","content":"微信多少"}openai测试importopenai#pipinstallopenaiop......
  • 【分享】讯飞星火认知大模型Python调用上下文测评
    一个很常用的用法,先是system提示,然后是user问题{"role":"system","content":"假设你是个程序员,你的微信是llike620"},{"role":"user","content":"微信多少"}openai测试importopenai#pipinstallopenaiope......
  • 动手学深度学习--卷积神经网络
    frompixiv从全连接层到卷积现在我们给自己一个任务:用神经网络去识别区分出百万级像素的不同图片回顾一下以前:我们是通过多层感知机来实现的,当面对一张图片的时候,我们将其看成一个像素点矩阵,然后将其从二维拉直到一维上,再通过MLP进行训练但是我们这次的任务每张照片具有百......
  • 【极简】什么是空洞卷积?
    定义卷积核一定,空洞卷积DilatedConvolution对卷积核的感受野进行“强行扩大”,直接从更大的感受野采样一定数量的像素。空洞卷积有“膨胀率”参数,扩张率中文也叫空洞数(HoleSize),b是膨胀率2,c是膨胀率3.作用扩大感受野、提高效率等论文......
  • 通俗理解GAN -- 基础认知
     Smiling&Weeping----你已春风摇曳,我仍一身旧雪 1.GAN的基本思想GAN全称对抗生成网络,顾名思义是生成模型的一种,而他的训练则是一种对抗博弈状态中的。下面我们举例来解释一下GAN的基本思想。假如你是一名篮球运动员,你想在下次比赛......
  • 国标GB28181视频智能分析平台EasyGBS正从从感知阶段走向认知智能
    国标GB28181视频智能分析平台可以实现对视频内容的实时监控和分析。通过对视频数据进行实时采集和传输,系统可以对视频画面进行实时分析和处理,包括人脸识别、车牌识别、行为分析等。这些功能可以帮助用户快速获取视频中的关键信息,提高安全防范能力。​视频智能分析平台EasyGBS正从......
  • css的认知与样式
    #1.介绍##目录- [1.介绍](#1-介绍)- [2.CSS语法](#2-CSS语法)- [3.CSS注释](#3-CSS注释)- [4.CSS中的颜色值](#4-CSS中的颜色值)- [5.CSS长度单位](#5-CSS长度单位)- [6.html引入CSS的三种方法](#6-html引入CSS的三种方法)- [6.1行内样......