首页 > 编程语言 >opencv 图像预处理(一) python笔记

opencv 图像预处理(一) python笔记

时间:2024-11-04 20:15:16浏览次数:3  
标签:python image cv2 opencv 灰度 图像 import 轮廓 预处理

图像预处理

​ 在计算机视觉和图像处理领域,图像预处理是一个重要的步骤,它能够提高后续处理(如特征提取、目标检测等)的准确性和效率。OpenCV 提供了许多图像预处理的函数和方法,以下是一些常见的图像预处理操作:

  1. 图像空间转换
  2. 图像大小调整
  3. 图像仿射变换
  4. 图像翻转
  5. 图像裁剪
  6. 图像二值化处理
  7. 图像去噪
  8. 边缘检测
  9. 图像平滑处理
  10. 图像形态学

图像翻转

cv2.flip 是 OpenCV 库中的一个函数,用于翻转图像。翻转可以是水平翻转、垂直翻转或同时水平和垂直翻转。这个函数接受两个参数:要翻转的图像和一个指定翻转类型的标志。

函数签名

cv2.flip(src, flipCode[, dst]) -> dst

参数说明

  • src:输入图像,可以是任意类型和深度的多通道图像。

  • flipCode

    :指定翻转类型的整数标志:

    • 0:沿 X 轴翻转(垂直翻转)
    • 1:沿 Y 轴翻转(水平翻转)
    • -1:沿 X 轴和 Y 轴翻转(同时水平和垂直翻转)
  • dst:可选参数,输出图像。如果未提供,输出图像将与输入图像具有相同的尺寸和类型。

示例

以下是一些使用 cv2.flip 的示例代码:

import cv2

# 加载图像
image = cv2.imread("save_image/car.png")
# 翻转: -1:水平和垂直 1:水平翻转,0 垂直翻转
img = cv2.flip(image, -1)
# 显示原始图像和翻转后的图像
cv2.imshow('img', img)
# 等待按键并关闭窗口
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

图像仿射变换

仿射变换(Affine Transformation)是一种线性变换,它保持了点之间的相对距离不变,即平行线在变换后仍然保持平行。在图像处理中,仿射变换常用于旋转、缩放、平移和剪切等操作。

图像旋转

旋转操作可以将图像绕着某个点旋转一定的角度

实例代码

import cv2

# 加载图像
image = cv2.imread("images/car.png")
# 获取图像的尺寸
(h, w) = image.shape[:2]
# 设置旋转中心和旋转角度
center = (w // 2, h // 2)
# 计算旋转矩阵
# 旋转角度(可修改)
angle = 40
# 缩放比例 1.0 表示不缩放
M = cv2.getRotationMatrix2D(center, angle, 1.0)
# 进行旋转
rotated_image = cv2.warpAffine(image, M, (w, h))
cv2.imshow('Rotated Image', rotated_image)
# 等待按键并关闭窗口
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

cv2.getRotationMatrix2D 是 OpenCV 库中的一个函数,用于获取旋转矩阵。这个函数主要用于图像的旋转变换。旋转矩阵是一个 2x3 的矩阵,可以用来将图像围绕指定的中心点旋转指定的角度,并且可以选择是否进行缩放。

函数签名

cv2.getRotationMatrix2D(center, angle, scale) -> M

参数说明

  • center:旋转中心点的坐标,格式为 (x, y)
  • angle:旋转角度,单位为度。正角度表示逆时针旋转,负角度表示顺时针旋转。
  • scale:缩放比例。如果设置为 1,则不进行缩放。

返回值

  • M:2x3 的旋转矩阵。

示例

以下是一个使用 cv2.getRotationMatrix2D 的示例代码,

cv2.warpAffine 函数

仿射变换 函数

cv2.warpAffine(src, M, dsize, dst) →
  • src: 输入图像。
  • M: 2x3 的变换矩阵,类型为 np.float32
  • dsize: 输出图像的尺寸,形式为 (width, height)
  • dst (可选): 输出图像。如果未提供,则会自动创建一个新的图像。

图像平移

平移操作可以将图像中的每个点沿着某个方向移动一定的距离

import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/car5.png")
#获取图片像素
(h, w) = img.shape[:2]
# 定义平移矩阵
#tx 图片x轴移动200,ty是图片y轴移动50px
tx, ty = 200, 50
#获取平移矩阵
M = np.float32([[1, 0, tx], [0, 1, ty]])
# 应用平移变换
translated = cv2.warpAffine(img, M, (w, h))
# 显示结果
cv2.imshow('Translated Image', translated)
cv2.waitKey(0)
cv2.destroyAllWindows()

其中,tx 和 ty 分别表示在x轴和y轴方向上的平移距离。
在这里插入图片描述

图像缩放

缩放操作可以改变图像的大小

import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/car5.png")
h, w, channels = img.shape
# 定义缩放因子
sx, sy = 1.5, 1.5
M = np.float32([[sx, 0, 0], [0, sy, 0]])
# 应用缩放变换
scaled = cv2.warpAffine(img, M, (int(w * sx), int(h* sy)))
# 显示结果
cv2.imshow('Scaled Image', scaled)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

sx 和 sy 分别表示在x轴和y轴方向上的缩放因子。

图像错切

错切操作可以改变图像的形状,使其在某个方向上倾斜

import cv2
import numpy as np

# 读取图像
img = cv2.imread("images/car5.png")
rows, cols, _ = img.shape
# 定义剪切因子
shx, shy = 0.2, 0.2
M = np.float32([[1, shx, 0], [shy, 1, 0]])
# 应用剪切变换
sheared = cv2.warpAffine(img, M, (cols, rows))

# 显示结果
cv2.imshow('Sheared Image', sheared)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

图像色彩空间转换

OpenCV中的色彩空间转换是将图像从一种颜色表示形式转换为另一种颜色表示形式的过程。常见的颜色空间包括RGB、HSV、YUV等。

色彩空间转换有几个重要的作用:

  1. 方便图像处理:在不同的颜色空间中,对应的通道代表了不同的属性,例如在RGB空间中,红、绿、蓝三个通道分别代表了颜色的强度,而在HSV空间中,H(色相)代表了颜色的种类,S(饱和度)代表了颜色的深浅,V(亮度)代表了颜色的明暗。因此,对于不同的处理需求,选择不同的颜色空间进行处理可以更加方便。
  2. 提高图像处理效果:在某些情况下,使用某些特定的颜色空间可以提高图像处理的效果。例如,在HSV空间中,可以通过调整S(饱和度)和V(亮度)来提高图像的对比度并去除噪点。
  3. 节省计算资源:在某些情况下,使用特定的颜色空间可以帮助我们节省计算资源。例如,在RGB空间中,每个像素需要3个通道来表示,而在灰度空间中,每个像素只需要一个通道就可以表示。因此,如果我们只需要处理亮度信息而不需要颜色信息时,将图像转换为灰度空间可以节省计算资源。

总之,色彩空间转换在图像处理中是一项非常重要的技术,它可以方便我们对图像进行处理,并提高图像处理的效果和节省计算资源。

cv2.cvtColor()是OpenCV中的一个函数,用于图像颜色空间的转换。它可以将一个图像从一个颜色空间转换为另一个颜色空间,比如从RGB到灰度图像的转换,或者从BGR到HSV的转换等。

函数的语法如下:

cv2.cvtColor(src, code)

参数说明:

  • src:输入图像,可以是一个NumPy数组或者一个OpenCV的Mat对象。
  • code:指定转换的类型,可以使用预定义的转换代码,例如cv2.COLOR_BGR2GRAY表示从BGR到灰度图像的转换。

RGB 转 Gray(灰度)

RGB 转 Gray(灰度),将彩色图像转换为灰度图像,可以减少数据量并简化算法。

    image = cv2.imread("../images/car.png")
    # 将图像从BGR到灰度图像的转换
    gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # 显示原始图像和转换后的灰度图像
    cv2.imshow('old Image', image)
    cv2.imshow('new Image', gray_image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

在这里插入图片描述

RGB 转 HSV

RGB 转 HSV,HSV(Hue, Saturation, Value)色彩空间在颜色分割和颜色识别中非常有用。

import cv2
#在某些情况下,使用某些特定的颜色空间可以提高图像处理的效果。
# 例如,在HSV空间中,可以通过调整S(饱和度)和V(亮度)来提高图像的对比度并去除噪
image = cv2.imread("images/car.png")
# 将图像从BGR到灰度图像的转换
image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)
#转换后的图像
cv2.imshow('new Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

图像二值化处理

案例:

import cv2

# 读取图像并转换为灰度图
image = cv2.imread('image.jpg', cv2.IMREAD_GRAYSCALE)

# 应用阈值
thresh_value = 127
retval, binary_image = cv2.threshold(image, thresh_value, 255, cv2.THRESH_BINARY)

# 显示结果
cv2.imshow('原图', image)
cv2.imshow('二值图像', binary_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

cv2.threshold 是 OpenCV 中用于图像二值化的函数。它通过设置阈值将图像分为前景和背景,常用于图像处理和分析。以下是该函数的主要功能和用法简介:

功能

cv2.threshold 将灰度图像转换为二值图像,根据指定的阈值将像素值分为两类:高于阈值的像素设为一个值(通常是255),低于阈值的像素设为另一个值(通常是0)。

语法

retval, dst = cv2.threshold(src, thresh, maxval, type)

参数

  1. src: 输入的灰度图像。

  2. thresh: 阈值,决定分割的界限。

  3. maxval: 当像素值超过阈值时,赋予的最大值(通常为255)。

  4. type
    阈值类型,常用的有:
    • cv2.THRESH_BINARY: 超过阈值的像素设为最大值,其余设为0。
    • cv2.THRESH_BINARY_INV: 超过阈值的像素设为0,其余设为最大值。
    • cv2.THRESH_TRUNC: 超过阈值的像素设为阈值,其余不变。
    • cv2.THRESH_TOZERO: 超过阈值的像素不变,其余设为0。
    • cv2.THRESH_TOZERO_INV: 超过阈值的像素设为0,其余不变。

返回值

  • retval: 实际使用的阈值(可能与输入值不同)。
  • dst: 输出的二值图像。

图像掩模

它通常用于创建掩模,以便从图像中提取特定颜色的区域。

函数原型

cv2.inRange(src, lowerb, upperb)

参数

  • src: 输入的图像,可以是彩色图像或灰度图像。
  • lowerb: 颜色范围的下界(数组或元组),指定了要提取的颜色的最小值。
  • upperb: 颜色范围的上界(数组或元组),指定了要提取的颜色的最大值。

返回值

  • 返回一个二值图像,白色部分表示在指定颜色范围内的区域,黑色部分表示不在范围内的区域

案例

import cv2
import numpy as np

# 读取图像
image = cv2.imread("images/car.png")
# 将图像从 BGR 转换到 HSV 颜色空间
hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)
# 定义颜色范围,(蓝色区域)
lower = np.array([100, 100, 100])
upper = np.array([140, 255, 255])
# 使用 inRange 函数创建掩模
mask = cv2.inRange(hsv_image, lower, upper)
cv2.imshow('01', mask)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

图像位与操作

cv2.bitwise_and() 是 OpenCV 库中的一个函数,用于对两个图像进行按位与操作。这个操作会逐个像素地对两个输入图像进行比较,只有在两个像素均为 255(白色)时,输出的像素才会为 255(白色),否则输出为 0(黑色)。这个函数在图像处理中的应用非常广泛,尤其是在掩膜和图像分割等任务中

函数原型

dst = cv2.bitwise_and(src1, src2, mask=None)

参数说明

  • src1: 第一个输入图像。
  • src2: 第二个输入图像。两幅图像应具有相同的尺寸和类型。
  • mask: 可选参数,用于指定一个掩膜。如果提供,只有在掩膜的相应位置为非零时,才会计算输出。

返回值

  • 返回按位与操作后的图像(dst)。

案例

import cv2
import numpy as np

# 读取图像
image = cv2.imread("images/car.png")
# 将图像从 BGR 转换到 HSV 颜色空间
hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)
# 定义颜色范围,(蓝色区域)
lower = np.array([100, 100, 100])
upper = np.array([140, 255, 255])
# 使用 inRange 函数创建掩模
mask = cv2.inRange(hsv_image, lower, upper)
#位与操作
image = cv2.bitwise_and(image,image,mask=mask)
cv2.imshow('01', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

图像检测轮廓

cv2.findContours 函数可以在二值图像中找到轮廓,并返回轮廓的点集。轮廓可以用来表示物体的边界,常用于物体检测、分割和形状分析。

语法

contours, hierarchy = cv2.findContours(image, mode, method)

参数

  1. image: 输入的二值图像。通常在调用该函数之前需要将图像转换为灰度图像并进行二值化处理(如使用 cv2.thresholdcv2.Canny)。

  2. mode
    轮廓检索模式:
    • cv2.RETR_EXTERNAL: 只检索外部轮廓。
    • cv2.RETR_LIST: 检索所有轮廓,并将其放入列表中。
    • cv2.RETR_TREE: 检索所有轮廓,并建立层级关系。
  3. method
    轮廓逼近方法:
    • cv2.CHAIN_APPROX_SIMPLE: 压缩轮廓,仅保留端点。
    • cv2.CHAIN_APPROX_NONE: 保留所有轮廓点。

返回值

  • contours: 一个 Python 列表,其中每个元素是一个轮廓(即一组点),轮廓的点以 NumPy 数组的形式存储。
  • hierarchy: 轮廓的层级信息,包含轮廓之间的关系。

案例:

import cv2

# 读取图像并转换为灰度图像
image = cv2.imread("images/car.png")
# 将图像从BGR到灰度图像的转换
image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 二值化处理
retval, binary_image = cv2.threshold(image, 127, 255, cv2.THRESH_BINARY)
# 查找轮廓
contours, hierarchy = cv2.findContours(binary_image, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

# 把灰度图像转换彩色图像
output_image = cv2.cvtColor(binary_image, cv2.COLOR_GRAY2BGR)
# 绘制轮廓
cv2.drawContours(output_image, contours, -1, (0, 255, 0), 2)
# 显示结果
cv2.imshow('Contours', output_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

cv2.boundingRect 函数介绍

cv2.boundingRect 是 OpenCV 中用于计算轮廓的最小外接矩形的函数。这个函数可以返回一个包含轮廓的最小矩形的边界框,通常用于对象检测、图像分割等任务中。最小外接矩形是一个完全包围轮廓的矩形,其边与图像的坐标轴平行。

案例

import cv2

# 读取图像并转换为灰度图像
image = cv2.imread("images/car.png")
# 将图像从BGR到灰度图像的转换
image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 二值化处理
retval, binary_image = cv2.threshold(image, 127, 255, cv2.THRESH_BINARY)
# 查找轮廓
contours, hierarchy = cv2.findContours(binary_image, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

# 把灰度图像转换彩色图像
output_image = cv2.cvtColor(binary_image, cv2.COLOR_GRAY2BGR)
# 绘制轮廓
cv2.drawContours(output_image, contours, -1, (0, 255, 0), 2)
# 在每个轮廓上绘制最小外接矩形
for contour in contours:
    #获取绘制轮廓的边界框
    x, y, w, h = cv2.boundingRect(contour)
    cv2.rectangle(output_image, (x, y), (x + w, y + h), (0, 100, 0), 2)
# 显示结果
cv2.imshow('Contours', output_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

练习:

完成对车牌的分割提取

1 基于车牌是蓝色,可以通过掩模找到车牌所在区域

import cv2
import numpy as np

# 读取图像
image = cv2.imread("../images/car.png")

# 将图像从 BGR 转换到 HSV 颜色空间
hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

# 定义颜色范围,(蓝色区域)
lower = np.array([100, 100, 100])
upper = np.array([140, 255, 255])
# 使用 inRange 函数创建掩模
mask = cv2.inRange(hsv_image, lower, upper)
cv2.imshow('Contours', mask)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

2 掩模返回一个二值对象,可以通过图像轮廓检测,检测当前掩码图像的轮廓

# 查找轮廓
contours, hierarchy = cv2.findContours(mask, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

# 在每个轮廓上绘制最小外接矩形
for contour in contours:
    #获取绘制轮廓的边界框
    x, y, w, h = cv2.boundingRect(contour)
    cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)
# 显示结果
cv2.imshow('Contours', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

在这里插入图片描述

3 获取所有轮廓的边界框,我们发现车牌轮廓也在期间,通过调试,我们给一个车牌尺寸的范围值,提取车牌

    x, y, w, h = cv2.boundingRect(contour)
    if w > 50 and h > 20:  # 可根据实际车牌尺寸调整
      cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)

4 最后,用图片切割切出车牌

  plate_image = image[y:y + h, x:x + w]  # 切割车牌区域

在这里插入图片描述

标签:python,image,cv2,opencv,灰度,图像,import,轮廓,预处理
From: https://blog.csdn.net/b227737437/article/details/143439024

相关文章

  • python+flask框架的智慧停车平台 小程序28(开题+程序+论文) 计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容选题背景随着城市化进程的加速,车辆数量急剧增加,停车难问题已成为各大城市面临的普遍难题。智慧停车平台作为解决停车难问题的有效手段,近年来在国内......
  • python+flask框架的智慧停车平台 小程序18(开题+程序+论文) 计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容选题背景随着城市化进程的加速,车辆数量急剧增加,停车难问题已成为各大城市面临的普遍难题。智慧停车平台作为解决停车难问题的有效手段,近年来在国内......
  • python+flask框架的智慧工会微信小程序 小程序端28(开题+程序+论文) 计算机毕业设计
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容选题背景随着信息技术的飞速发展和移动互联网的普及,微信小程序作为一种轻量级的应用形态,已成为各类服务接入互联网的重要平台。智慧工会作为新时代......
  • Python数据分析NumPy和pandas(二十、数据清洗和预处理之二:数据转换)
    在数据分析和建模过程中,处理缺失数据很重要,另外对于数据的筛选、清理和转换同样很重要。一、删除重复数据删除重复的行。DataFrame的方法duplicated()返回一个布尔序列,判断每一行是否重复(其列值与前一行中的列值完全相等则为重复)。另一个方法drop_duplicates()返回一个去......
  • 【Python期末/课程设计】高校成绩管理系统(PyCharm项目/flask框架/MySQL数据库)
    代写C语言、C++、Java、Python、HTML、JavaScript、vue、MySQL相关编程作业,长期接单,信誉有保证,如有需要请加推广QQ。本文资源:【Python期末/课程设计】高校成绩管理系统(PyCharm项目/flask框架/MySQL数据库)1.题目要求题目描述:无编程软件:2.视频演示【Python期......
  • 基于Python星载气溶胶数据处理与反演分析技术
    Python作为一种强大且易于学习的编程语言,已广泛应用于数据科学和大气科学领域,Python凭借其强大的数据处理能力,可以高效处理海量的气溶胶数据。例如,通过Pandas库,研究人员可以进行高效的数据清洗、整理和分析;NumPy库则提供了强大的数值计算功能,能够快速进行各种数学和统计运算;Ca......
  • python+flask计算机毕业设计个性化推荐图书借阅系统开发(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、选题背景关于图书借阅系统的研究,现有研究主要以传统借阅管理为主,如[1]中的图书借阅管理系统侧重于管理员操作和基本借阅功能的实现。专门针对......
  • Python(logging.StreamHandler())
    目录1.示例代码2.参数和方法3.注意事项logging.StreamHandler()是Python的logging模块中的一个类,用于将日志消息输出到流(如控制台或标准输出)。它是日志处理程序的一种,可以配合其他日志记录器使用。1.示例代码以下是一个完整的示例,演示如何使用logging.StreamHand......
  • Python学习笔记-yield用法及优点
    Python学习笔记-yield用法及优点概述yield用于定义生成器,它最终返回一个生成器对象,这个生成器对象可以被迭代。例子#encoding:utf8importsysn=200m=1000#定义一个生成器,yield必须在函数中使用defGenerators(n):foriinrange(n):ifi%2==0:......