首页 > 其他分享 >opencv保姆级讲解——图像预处理(3)

opencv保姆级讲解——图像预处理(3)

时间:2024-11-05 18:15:30浏览次数:6  
标签:噪声 kernel img cv2 讲解 滤波 opencv 图像 预处理

图像滤波

所为图像滤波通过滤波器得到另一个图像

什么是滤波器

在深度学习中,滤波器又称为卷积核,滤波的过程成为卷积

卷积核概念

卷积核大小,一般为奇数,如

  1. 3*3
  2. 5*5
  3. 7*7

为什么卷积核大小是奇数?

原因是:保证 锚点 在中间,防止位置发生偏移的原因

卷积核大小的影响

在深度学习中,卷积核越大,看到的信息越多,提取的特征越好,同时计算量越大

图像平滑处理

图像噪声的定义和性质‌‌

图像噪声‌是指存在于图像数据中的不必要的或多余的干扰信息。它妨碍了人们通过视觉器官对接收信息的理解。噪声在理论上可以定义为“不可预测,只能用概率统计方法来认识的随机误差”。因此,将图像噪声看成是多维随机过程是合适的,描述噪声的方法可以借用随机过程的描述,即用其概率分布函数和概率密度分布函数。

图像噪声的分类

图像噪声可以根据其来源和性质进行分类。主要分为外部噪声和内部噪声。外部噪声是由外部环境因素引起的,如光线变化、电磁干扰等。内部噪声则是由设备本身的因素引起的,如传感器噪声、电路噪声等。

图像噪声的产生原因

图像噪声的产生原因多种多样,主要包括以下几个方面:

  • 传感器和电路产生的噪声‌:扫描仪或数码相机的传感器和电路可能会产生电子噪声,导致图像中出现噪点。
  • 长时间曝光‌:在拍摄夜景时,由于CCD无法处理较慢的快门速度所带来的巨大工作量,导致一些特定的像素失去控制,产生噪点。
  • 格式压缩‌:使用JPEG格式对图像进行压缩时,由于图像数据的处理方式,可能会在边缘位置产生不自然的结合,形成噪点。
  • 感光元件特性‌:感光元件的热稳定性等特性也可能导致噪点的产生。

图像噪声的影响和解决方法

图像噪声的存在严重影响了图像的质量,使得图像中的信息变得模糊和不清晰。为了减少图像中的噪声,可以采取一些专业的图像处理技术,如图像降噪(Image Denoising),通过减少数字图像中的噪声来提高图像的质量。

​ 图像平滑处理的一个例子是减少图像中的噪声。比如,在拍摄夜间照片时,由于光线不足,图像可能出现许多随机噪点。通过应用平滑处理(如高斯模糊),可以降低这些噪点的影响,从而使图像看起来更清晰,细节更突出。这有助于后续的图像分析或特征提取,提升最终结果的准确性

常见的图像平滑处理方法包括高斯滤波、中值滤波和双边滤波。

高斯滤波

高斯滤波是图像处理中常用的一种平滑滤波方法,其主要作用是去除图像中的噪声,并减少图像细节,以实现图像的平滑处理。

高斯滤波的原理是利用高斯函数对图像进行加权平均。在滤波过程中,每个像素的值都会被其周围像素的加权平均值所取代,而这些权重则由高斯分布函数计算得出。通过这种方式,高斯滤波可以有效地减少图像中的噪声,并保留图像的整体特征。

高斯滤波的使用场景包括但不限于:

  1. 去除高斯噪声: 高斯滤波可以有效地去除高斯噪声,因为该滤波器在计算像素值时会对周围像素进行加权平均,从而抑制噪声的影响。
  2. 模糊处理: 由于高斯滤波会平均周围像素的值,因此它也可用于实现图像的模糊处理,例如在某些需求下需要模糊化处理的图像或区域。
  3. 提取大致轮廓: 由于高斯滤波会平滑图像细节,因此在一定程度上可以帮助提取图像的大致轮廓和结构特征。

cv2.GaussianBlur() 是 OpenCV 库中用于图像模糊处理的函数之一。该函数可以对图像进行高斯模糊处理,即在每个像素周围使用高斯核来加权平均计算像素值,从而达到模糊效果。

cv2.GaussianBlur(src, ksize, sigmaX)

  • src:输入图像。
  • ksize:高斯核的大小,通常以元组 (width, height) 的形式指定。
  • sigmaX:高斯核在 x 方向上的标准差。

以下是一个简单的示例代码,演示如何使用 cv2.GaussianBlur() 函数对图像进行高斯模糊处理:

import cv2
img = cv2.imread("images/renwu01.jpeg")
# 定义高斯核大小和标准差
ksize = (9, 9)
sigma = 3

# 对图像进行高斯模糊处理
blurred_image = cv2.GaussianBlur(img, ksize, sigma)

# 显示原始图像和滤波后的图像

cv2.imshow('old Image', img)
cv2.imshow('new Image', blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

双边滤波

双边滤波是图像处理中常用的一种平滑滤波方法,它可以同时平滑图像并保留边缘信息。

传统的线性滤波方法如均值滤波或高斯滤波在平滑图像的同时,可能会模糊或模糊边缘。而双边滤波通过考虑像素点的空间距离和灰度差异,实现了对图像进行平滑的同时,尽量保留图像的边缘细节。

双边滤波的原理是在滤波过程中,不仅考虑像素点与周围像素点之间的空间距离权重,还考虑像素点与周围像素点的灰度差异权重。这样,像素点的最终值将由它的邻域像素根据这两个权重的组合来计算得出,从而平滑图像的同时保留边缘信息。

双边滤波适用于各种类型的图像,特别适合于那些需要平滑处理但仍保留边缘细节的图像,例如人脸识别、图像增强和图像去噪等领域。

cv2.bilateralFilter() 是 OpenCV 库中用于图像滤波处理的函数之一。该函数可以对图像进行双边滤波处理,即在保持边缘清晰的同时,对图像进行平滑处理。

cv2.bilateralFilter(src, d, sigmaColor, sigmaSpace) 函数接受四个参数:

  • src:输入图像。
  • d:滤波器的直径,用于指定在每个像素周围考虑的像素邻域大小。一般为正奇数
  • sigmaColor:颜色空间的标准差,用于控制滤波过程中颜色相似性的权重。较大的值意味着更宽松的颜色相似性条件。

  • 大 sigmaColor 值:当 sigmaColor 较大时,颜色差异较大的像素也会被赋予较大的权重,这意味着滤波器会在更大范围内进行平滑处理,导致图像细节的丢失较多。

  • 小 sigmaColor 值:当 sigmaColor 较小时,只有颜色差异较小的像素会被赋予较大的权重,滤波器主要在颜色相似的区域内进行平滑处理,这样可以更好地保留边缘和细节

  • sigmaSpace:坐标空间的标准差,用于控制滤波过程中空间相似性的权重。较大的值意味着更宽松的空间相似性条件。

  • 大 sigmaSpace 值:当 sigmaSpace 较大时,空间上距离较远的像素也会被赋予较大的权重,这意味着滤波器会在更大的空间范围内进行平滑处理,导致图像的局部细节被进一步平滑。

  • 小 sigmaSpace 值:当 sigmaSpace 较小时,只有空间上距离较近的像素会被赋予较大的权重,滤波器主要在局部范围内进行平滑处理,这样可以更好地保留局部细节和边缘信息

以下是一个简单的示例代码,演示如何使用 cv2.bilateralFilter() 函数对图像进行双边滤波处理:

import cv2
img = cv2.imread("images/renwu02.png")
# 定义滤波器参数
d =30
sigmaColor = 100
sigmaSpace = 150

# 对图像进行双边滤波处理
filtered_image = cv2.bilateralFilter(img, d, sigmaColor, sigmaSpace)

# 显示原始图像和滤波后的图像

cv2.imshow('old Image', img)
cv2.imshow('new Image', filtered_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

中值滤波

中值滤波是图像处理中常用的一种平滑滤波方法,其主要作用是去除图像中的胡椒噪声或其他类型的脉冲噪声。

中值滤波的原理是将每个像素点周围的邻域像素按照灰度值大小进行排序,然后取中间值作为该像素点的输出值。因为椒盐噪声或脉冲噪声的灰度值通常远远偏离周围像素的灰度值,通过中值滤波可以有效地将这些异常值去除,从而使图像变得更加平滑。

中值滤波适用于各种类型的图像,特别适合于那些受到椒盐噪声干扰的图像,例如传感器捕获的图像或者在传输过程中受到干扰的图像

cv2.medianBlur()是OpenCV中的一个函数,用于对图像进行中值滤波处理。中值滤波是一种常见的图像处理技术,可用于去除图像中的椒盐噪声或斑点噪声。这个函数的语法如下:

 cv2.medianBlur(src, ksize)

其中:

  • src 是输入的图像。
  • ksize 是用于中值滤波的孔径大小,必须是大于1的奇数,例如3、5、7等。
import cv2
img = cv2.imread("images/hujiao.png")

# 对图像进行高斯模糊处理
blurred_image = cv2.medianBlur(img,5)

# 显示原始图像和滤波后的图像

cv2.imshow('old Image', img)
cv2.imshow('new Image', blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像边缘检测

使用OpenCV进行图像边缘检测的原因有以下几点:

  1. 图像边缘是物体与背景、物体与物体之间的边界,因此边缘检测对于图像分割、特征提取等任务非常重要。
  2. 图像边缘蕴含了丰富的信息,如形状、方向、纹理等,这些信息对于后续的图像处理和分析非常重要。
  3. 通过边缘检测,可以大幅减少数据量,并且剔除可以认为不相关的信息,保留了图像重要的结构属性。
  4. 边缘检测是图像处理和计算机视觉中的一个基本问题,它可以帮助我们标识数字图像中亮度变化明显的点,用于确定图片中物体的边界(边缘)或者区域。

Canny边缘检测

Canny 边缘检测广泛应用于图像处理、计算机视觉和机器学习中的物体识别、图像分割等任务

案例

import cv2

# 读取并转换为灰度图
image = cv2.imread("images/car.png")
# 将图像从BGR到灰度图像的转换
image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 应用 Canny 边缘检测
edges = cv2.Canny(image, 50, 80)
# 显示结果
cv2.imshow('边缘检测', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()

cv2.Canny 函数是 OpenCV 中用于边缘检测的重要工具。它实现了 Canny 边缘检测算法,该算法可以有效地提取图像中的边缘。

函数语法

edges = cv2.Canny(image, threshold1, threshold2)

参数

  • image: 输入的灰度图像。
  • threshold1: 第一个阈值,用于边缘检测的低阈值。
  • threshold2: 第二个阈值,用于边缘检测的高阈值。
  1. 低阈值
    • 低阈值用来识别可能的边缘像素。如果一个像素的梯度值大于低阈值,那么这个像素可能会被认为是边缘的一部分。
    • 但是,单独依靠低阈值来识别边缘是不够的,因为它可能会导致很多虚假的边缘被识别出来,特别是那些由于噪声引起的边缘。
  2. 高阈值
    • 高阈值用于识别强烈的边缘像素。如果一个像素的梯度值大于高阈值,那么这个像素几乎可以肯定是边缘的一部分。
    • 高阈值的存在可以有效地减少由于噪声引起的虚假边缘

返回值

  • edges: 返回检测到的边缘图像,边缘部分为白色,其他部分为黑色。

图像形态学操作

在OpenCV中,形态学操作是一类基于形状的图像处理技术,主要用于提取图像中的有用特征,如边界检测、噪声去除等。常见的形态学操作包括腐蚀、膨胀、开运算、闭运算、梯度、顶帽和黑帽等。下面是这些操作的简要介绍和使用方法:

腐蚀

腐蚀操作会减少图像中白色区域的大小,常用于消除小的白色噪声点。腐蚀的基本思想是,如果一个结构元素完全包含在前景物体内部,则该结构元素对应的输出图像位置的值为1,否则为0。

import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/ceshi02.jpg")
# 定义结构元素
kernel = np.ones((3, 3), np.uint8)
# 执行腐蚀操作
eroded = cv2.erode(img, kernel, iterations=3)
# 显示结果
cv2.imshow('Original Image', img)
cv2.imshow('Eroded Image', eroded)
cv2.waitKey(0)
cv2.destroyAllWindows()

函数:

eroded = cv2.erode(src, kernel, dst,iterations=1)

参数说明

  • src: 输入图像。
  • kernel: 结构元素,用于定义腐蚀操作的方式。是一个矩阵结构数据
  • dst (可选): 输出图像。如果未提供,则会自动创建一个新的图像。
  • iterations (可选): 腐蚀操作的迭代次数,默认为1

迭代次数的影响

  • 迭代次数iterations 参数控制腐蚀操作的迭代次数。增加迭代次数会使腐蚀效果更加明显,但也会导致前景物体变得更小

膨胀

膨胀操作与腐蚀相反,它会增加图像中白色区域的大小,常用于填补前景物体中的小洞或扩大前景物体的边界。

import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/ceshi01.jpeg")
# 定义结构元素
kernel = np.ones((5, 5), np.uint8)
# 执行腐蚀操作
eroded = cv2.dilate(img, kernel, iterations=3)
# 显示结果
cv2.imshow('Original Image', img)
cv2.imshow('Eroded Image', eroded)
cv2.waitKey(0)
cv2.destroyAllWindows()

函数:

dilated = cv2.dilate(src, kernel, iterations=1)

参数说明

  • src: 输入图像。
  • kernel: 结构元素,用于定义腐蚀操作的方式。是一个矩阵结构数据
  • dst (可选): 输出图像。如果未提供,则会自动创建一个新的图像。
  • iterations (可选): 迭代操作的迭代次数,默认为1

开运算

开运算是先腐蚀后膨胀的过程,常用于去除小的物体、平滑较大的物体边界以及填充细长的突出部分。

import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/kai.jpg")
# 定义结构元素
kernel = np.ones((7, 7), np.uint8)
# 执行腐蚀操作
eroded = cv2.morphologyEx(img, cv2.MORPH_OPEN,kernel)
# 显示结果
cv2.imshow('Original Image', img)
cv2.imshow('Eroded Image', eroded)
cv2.waitKey(0)
cv2.destroyAllWindows()

函数:

opened = cv2.morphologyEx(src, cv2.MORPH_OPEN, kernel)

参数说明

  • src: 输入图像。

  • op
    形态学操作的类型,可以是以下几种之一:
    • cv2.MORPH_OPEN:开运算
    • cv2.MORPH_CLOSE:闭运算
    • cv2.MORPH_GRADIENT:形态学梯度
    • cv2.MORPH_TOPHAT:顶帽
    • cv2.MORPH_BLACKHAT:黑帽
  • kernel: 结构元素,用于定义形态学操作的方式。可以通过 cv2.getStructuringElement 函数获得

闭运算

闭运算是先膨胀后腐蚀的过程,常用于填充前景物体中的小洞,平滑较大物体的边界以及连接邻近的物体。

import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/bi01.jpeg")
# 定义结构元素
kernel = np.ones((17, 17), np.uint8)
# 执行腐蚀操作
eroded = cv2.morphologyEx(img, cv2.MORPH_CLOSE,kernel)
# 显示结果
cv2.imshow('Original Image', img)
cv2.imshow('Eroded Image', eroded)
cv2.waitKey(0)
cv2.destroyAllWindows()

函数:

closed = cv2.morphologyEx(src, cv2.MORPH_CLOSE, kernel)

形态学梯度

形态学梯度是通过计算膨胀后的图像与腐蚀后的图像之间的差值来得到的,可以突出物体的边缘。

形态学梯度= 原图-腐蚀的图

函数:

gradient = cv2.morphologyEx(src, cv2.MORPH_GRADIENT, kernel)
import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/xtx.gif")
# 定义结构元素
kernel = np.ones((9, 9), np.uint8)
# 执行腐蚀操作
eroded = cv2.morphologyEx(img, cv2.MORPH_GRADIENT,kernel)
# 显示结果
cv2.imshow('Original Image', img)
cv2.imshow('Eroded Image', eroded)
cv2.waitKey(0)
cv2.destroyAllWindows()

顶帽

顶帽变换是原图像与开运算结果的差值,用于获取图像中的亮细节。

顶帽: 原图减去开运算,得到大图形外的小图形

函数:

tophat = cv2.morphologyEx(src, cv2.MORPH_TOPHAT, kernel)
import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/kai.jpg")
# 定义结构元素
kernel = np.ones((7, 7), np.uint8)
# 执行腐蚀操作
eroded = cv2.morphologyEx(img, cv2.MORPH_TOPHAT,kernel)
# 显示结果
cv2.imshow('Original Image', img)
cv2.imshow('Eroded Image', eroded)
cv2.waitKey(0)
cv2.destroyAllWindows()

黑帽

黑帽变换是闭运算结果与原图像的差值,用于获取图像中的暗细节。

黑帽:原图减去闭运算,得到大图形内的小图形

函数:

blackhat = cv2.morphologyEx(src, cv2.MORPH_BLACKHAT, kernel)
import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/bi01.jpeg")
# 定义结构元素
kernel = np.ones((7, 7), np.uint8)
# 执行黑帽操作
eroded = cv2.morphologyEx(img, cv2.MORPH_BLACKHAT,kernel)
# 显示结果
cv2.imshow('Original Image', img)
cv2.imshow('Eroded Image', eroded)
cv2.waitKey(0)
cv2.destroyAllWindows()

标签:噪声,kernel,img,cv2,讲解,滤波,opencv,图像,预处理
From: https://blog.csdn.net/m0_74994555/article/details/143486568

相关文章

  • 【计算机毕设选题推荐】基于springboo大学生就业系统的设计与实现 【附源码+部署+讲解
    ✍✍计算机毕设编程指导师**⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流!⚡⚡Java、Python、小程序、大数据实战项目集⚡⚡文末获取......
  • windows安装cmake、opencv、qt
    配置工具1、准备好我们的安装包:2、创建一个不含中文路径文件夹:3、双击cmake安装包:(安装过程略过)勾选选择的时候注意可以选择自动添加到环境变量。安装完成后可以通过win+R键输入cmake-gui.exe去检验环境变量是否配置成功,如果可以打开则配置成功。4、双击opencv-3.4......
  • 基于Open-CV的多四边形检测方案(一):图像预处理与霍夫变换
    目录一、设计目标二、工作流程三、图像预处理与霍夫变换一、设计目标对于一个含有多个相邻四边形的图片,可以定位出其中每一个四边形的顶点。典型的案例如一个围棋棋盘,可以定位出所有的格子的点。软件工具:Python==3.9opencv-python==4.10.0.84numpy==1.22.4二......
  • 冒泡排序与选择排序超详细讲解
    冒泡排序与选择排序冒泡排序condition:输入5个数字,冒泡排序,逆序输出#include<stdio.h>intmain(){ intuserInput,tmp,i,j,arr[6],flag; flag=0; for(inti=0;i<5;i++){ scanf("%d",&userInput); arr[i]=userInput; }//依次输入五个数字 for(inti=0;i<4;i++){//......
  • C++ OpenCv二值化找圆心坐标
    思路:图像转为灰度图,然后二值化得到只有0或255的点坐标,此处圆是黑点,所以添加所有像素值为0的坐标。在这些坐标中找到圆上最左边、最顶端、最右边、最底端的四个点,这时可求出圆心坐标。 .cpp文件#include<opencv2/opencv.hpp>#include<iostream>#include<cstdlib>#include......
  • 基于大数据 Python短视频推荐系统(源码+LW+部署讲解+数据库+ppt)
    !!!!!!!!!选题不知道怎么选不清楚自己适合做哪块内容都可以免费来问我避免后期給自己答辩找麻烦增加难度(部分学校只有一次答辩机会没弄好就延迟毕业了)会持续一直更新下去有问必答一键收藏关注不迷路源码获取:https://pan.baidu.com/s/1aRpOv3f2sdtVYOogQjb8jg?pwd=jf1d提取码:......
  • 艾卡货车救援系统(源码+文档+部署+讲解)
    本文将深入解析“货车救援系统”的项目,探究其架构、功能以及技术栈,并分享获取完整源码的途径。系统概述货车救援系统是一款专为货车司机和救援服务提供商设计的管理平台,旨在通过集成救援服务管理、合作项目管理、用户管理等功能模块,提高救援服务的效率和响应速度。系统包括管理端和......
  • 细嗦Transformer(三):准备训练,讲解及代码实现优化器、学习率调整策略、正则化和KL散度损
    文章目录关注我:细嗦大模型批处理对象/BatchesandMasking训练循环主函数/TrainingLoop优化器/Optimizer学习率调整策略/Learningrateadjustmentstrategy样例测试正则化/RegularizationLabelsmoothing标签平滑KL散度损失样例测试Github完整代码----求......
  • opencv 图像预处理(一) python笔记
    图像预处理​在计算机视觉和图像处理领域,图像预处理是一个重要的步骤,它能够提高后续处理(如特征提取、目标检测等)的准确性和效率。OpenCV提供了许多图像预处理的函数和方法,以下是一些常见的图像预处理操作:图像空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值......
  • Python数据分析NumPy和pandas(二十、数据清洗和预处理之二:数据转换)
    在数据分析和建模过程中,处理缺失数据很重要,另外对于数据的筛选、清理和转换同样很重要。一、删除重复数据删除重复的行。DataFrame的方法duplicated()返回一个布尔序列,判断每一行是否重复(其列值与前一行中的列值完全相等则为重复)。另一个方法drop_duplicates()返回一个去......