首页 > 其他分享 >深度学习神经网络笔记--卷积神经网络

深度学习神经网络笔记--卷积神经网络

时间:2024-10-13 20:53:47浏览次数:10  
标签:Layer -- 用途 特点 卷积 神经网络 特征 图像

  • 为什么要用卷积
    • 捕捉特征,如文末的图)
    • 不受位置影响(左右,前后,上下)
    • 可以参考下图:
  • 卷积操作
    • 可移动的小窗口与图像数据逐元素相乘后相加
    • 小窗口是滤波器,卷积核,(权重矩阵)
    • 需要注意的问题:
      • stride:步长
      • 卷积核的个数:决定输出的depth,卷积核个数
      • 填充值zerp-padding:外圈补0
        • 为什么要补零:确保卷积核能够覆盖输入图像的边缘区域,同时保持输出特征图的大小
  • 卷积神经网络构造:
    • input Layer:原始图像数据:三个颜色通道组成二维矩阵,表示像素强度值,进行预处理
      • 去均值:把图像位置拉回坐标系原点
      • 归一化:类似正态标准化,线性代数便准化,数据分为变成0-1
      • PCA主成分分析数据降维,白化:降低输入数据的冗余性。
    • Conv Layer:图像与卷积核卷积操作:
      • 输出尺寸=(样本尺寸-过滤器尺寸+2*填充)/步幅+1
      • 保持画幅不变的步幅为1的零填充值:(K-1)/2
    • Relu Layer:应用激活函数(ReLU)引入非线性(为了使网络学习复杂特征)实际上其实就是Relu(x) = max(0,x),当然会有一些其他变体。
    • (要多层堆叠:提取更高级被的特征,深层次特征有更复杂的模式)
    • Pooling Layer:减小特征图的大小来减少计算复杂性,有助于提取重要特征。(图像处理大致是压缩图像)
      • 特征不变
      • 特征降维
      • 防止过拟合
      • 选择池化窗口内的最大值(maxPooling或平均值averagePooling来实现
    • FC全连接与输出:处理分类标签,回归值,其他任务结果。

常见的 CNN 模型(一些链接是其他读起来有帮助的博主写的,一些是原论文)

  1. LeNet
    • 特点:最早的卷积神经网络之一,结构相对简单,包含卷积层、池化层和平坦层。
    • 用途:主要用于手写数字识别,如 MNIST 数据集。
  2. AlexNet
    • 特点:在 2012 年的 ImageNet 大赛中获得冠军,引入了 ReLU 激活函数和 Dropout 正则化技术,提高了模型的深度和精度。
    • 用途:图像分类、目标检测等任务。
  3. VGGNet
    • 特点:通过堆叠多个小尺寸的卷积核(如 3×3)来代替较大的卷积核,使得网络更深且参数更少。
    • 用途:图像分类、图像风格转移、特征提取等。
  4. GoogLeNet(Inception 网络)
    • 特点:采用了 Inception 模块,该模块允许网络在同一层中学习不同尺度的特征,并通过 1×1 卷积减少通道数来降低计算成本。
    • 用途:图像分类、目标检测等。
  5. ResNet(残差网络)
    • 特点:引入了残差块(Residual Block),通过跳线连接(Skip Connection)解决了深层网络中的梯度消失问题。
    • 用途:图像分类、目标检测、人脸识别等。
  6. DenseNet
    • 特点:每一层都与前面的所有层相连,通过密集连接的方式最大化特征重用,减少参数数量,同时增强特征传播。
    • 用途:图像分类、目标检测等。
  7. MobileNet
    • 特点:为移动设备设计,通过深度可分离卷积(Depthwise Separable Convolution)来减少计算量。
    • 用途:在嵌入式设备上实时处理图像和视频数据。
  8. SegNet
    • 特点:专为图像分割设计,使用编码器-解码器结构,编码器通常是一个预训练的 CNN,如 VGG-16,解码器负责从编码器的输出中重建像素级别的标签。
    • 用途:语义分割。

(有特定的需求可以通过链接调转或者自行获取论文代码看博客等方式再仔细研究)

上述内容是结合博客,论文等内容总结归纳的自己的学习笔记

无商业用途

如果侵犯到您的权利请联系我删除,谢谢!

标签:Layer,--,用途,特点,卷积,神经网络,特征,图像
From: https://blog.csdn.net/qq_62678349/article/details/142862178

相关文章

  • 【AI论文精读3】RAG论文综述1-P4-生成和增强
    【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI大项目】【AI应用】P1,P2,P3四、生成在检索之后,直接将所有检索到的信息输入到大语言模型(LLM)中以回答问题并不是一种良好的做法。接下来将从两个方面介绍调整方法:调整检索到的内容和调整大语言模型。4.1上......
  • Hadoop单节点docker镜像
    用于个人学习构建,镜像地址如下:quanueilun/hadoop:singledockerfile,用来构建hadoop单节点镜像。FROMdragonwell-registry.cn-hangzhou.cr.aliyuncs.com/dragonwell/dragonwell:8RUNyummakecacheRUNyumupdate-yRUNyuminstall-yopenssh-servervimopenssh-cli......
  • 阿里云的Qwen2.5-Coder 和 Qwen2.5-Math专有模型怎么样?
    阿里云发布Qwen2.5 系列模型,最新发布的Qwen2.5系列中包括普通的大语言模型(LLM)以及针对编程和数学的专用模型:Qwen2.5-Coder 和 Qwen2.5-Math。包括:Qwen2.5:0.5B、1.5B、3B、7B、14B、32B和72BQwen2.5-Coder:1.5B、7B和32B(即将发布)Qwen2.5-Math:1.5B、7B和72......
  • Daimayuan Online Judge F. 栈!
    题目描述你需要实现一个栈,支持以下两种操作:1、插入一个整数 xx;2、删除栈顶的前 kk 个数字并在一行中按出栈顺序输出被删除的数字,数字之间以空格分隔(若删除前栈中元素不足 kk 个,则不进行删除操作,输出 -1)。初始时栈为空,现在给你 nn 个操作指令,请你按照要求输出答案。......
  • 云计算(第二阶段):mysql后的shell
    第一章:变量前言什么是shellShell是一种提供用户与操作系统内核交互的工具,它接受用户输入的命令,解释后交给操作系统去执行。它不仅可以作为命令解释器,还可以通过脚本完成一系列自动化任务。shell的特点跨平台:大多数Shell都可以在不同的类UNIX系统上运行,包括Linux......
  • ChatGPT Canvas:系统提示词泄漏了~
     OpenAI推出了一款叫做Canvas的新工具,用来帮助用户更好地与ChatGPT协作写作和编程。详细介绍可以看这篇文章:ChatGPTCanvas:交互式对话编辑器-CSDN博客​编辑以下是OpenAI新功能“Canvas”的系统提示内容你是ChatGPT,由OpenAI训练的大型语言模型。知识截止日期:2......
  • Docker 指令详解:全面掌握容器化管理工具
    Docker是当前最流行的容器化平台之一,它通过轻量级的虚拟化技术,让开发者能够快速构建、部署和管理应用。掌握Docker的基础指令对于有效使用这一工具至关重要。本文将详细介绍Docker的常用命令,帮助你全面了解和运用Docker。目录Docker基础概念Docker镜像管理命令do......
  • [C++][第三方库][ODB]详细讲解
    目录1.介绍2.安装1.安装build22.安装odb-compiler3.安装ODB运行时库4.安装MySQL和客户端开发包5.安装boostprofile库6.总体操作7.测试样例3.ODB常见操作1.ODB类型映射2.ODB编程1.指令2.示例4.类与接口5.使用1.介绍ODB框架:数据库ORM框架-->对象关系映......
  • python数据分析与可视化
    关注我,持续分享逻辑思维&管理思维&面试题;可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导;推荐专栏《10天学会使用asp.net编程AI大模型》,目前已完成所有内容。一顿烧烤不到的费用,让人能紧跟时代的浪潮。从普通网站,到公众号、小程序,再到AI大模型网站。干货满满。学成后可......
  • c语言栈-回文
    include<stdio.h>include<stdlib.h>defineMAXSIZE7//定义结构体structStack{charworld[MAXSIZE];inttop;};//定义栈structtemp{structStacks;};intmain(){Stacks{};//入栈charc1[MAXSIZE]={0};printf("输入字符串,最多%d个字符\n",MAXSI......