概述
边缘检测是图像处理中的一项重要任务,其原理是基于图像的梯度计算。梯度是函数的变化速率,图像中的边缘意味着像素灰度值的快速变化。常用的边缘检测算法有Sobel算子、Prewitt算子、Laplacian算子、Canny算子等。
Sobel算子(滤波器)
Sobel滤波器通过使用两个3x3卷积核(也称为掩模)来计算图像灰度值的水平和垂直梯度。分别称为
水平梯度核:
垂直梯度核:
梯度计算:
对于每个像素点,应用这些卷积核以获得水平和垂直方向上的梯度值:
计算梯度幅值:
梯度方向:
梯度幅值也可以使用进行近似计算,最后根据设定的阈值进行二值化处理,将梯度幅值大于阈值的点标记为边缘点,否则标记为非边缘点。
Prewitt算子
Prewitt算子与Sobel算子类似,同样是一种基于梯度的算法,但是使用了不同的权重系数。
水平梯度核:
垂直梯度核:
Laplacian算子
Laplacian(拉普拉斯)算子是一种二阶导数算子,它不再以x和y的方向计算,而是以圆方向计算变化率。因此不需要求梯度幅值。它的卷积核可以表示为:
Canny算子
一阶导数、二阶导数的边缘算子虽然简单易用,但存在一些缺点。例如容易受噪声影响,容易产生虚假边缘。
John F. Canny 在 1986 年提出了 Canny 边缘检测算法。它是结合了梯度计算方法和非极大值抑制技术的一种边缘检测算法。该算法克服了之前的边缘检测算法在抑制噪声和保持边缘信息方面的缺陷,具有较好的性能。
Canny算子的步骤如下:
噪声抑制:利用高斯滤波器对输入图像进行平滑处理,以减少图像中的噪声。
梯度计算:通过对平滑后的图像应用Sobel(或Prewitt)算子,计算每个像素点的梯度幅值和方向。
非极大值抑制:在梯度图像上,对每个像素点在其梯度方向上进行比较,并保留局部最大值点,抑制非边缘像素。
双阈值检测:根据设定的高阈值和低阈值,将梯度图像中的像素点分为强边缘、弱边缘和非边缘三个部分。
边缘连接:通过连接强边缘像素和与之相连的弱边缘像素,形成完整的边缘。
python代码实现
利用OpenCV实现边缘检测的示例代码:
import cv2
import numpy as np
from matplotlib import pyplot as plt
image_color = cv2.imread('lena.png')
image_gray = cv2.imread('lena.png', cv2.IMREAD_GRAYSCALE)
"""------------------------------Sobel-------------------------------------"""
# 使用OpenCV的Sobel函数计算梯度
"""
cv2.Sobel(src, ddepth, dx, dy[, ksize[, scale[, delta[, borderType]]]]) # 参数:
src: 输入图像
ddepth: 输出图像的深度(可以理解为数据类型),-1表示与原图像相同的深度
dx, dy: 当组合为dx = 1, du = 0 时求x方向的一阶导数,当组合为dx = 0, dy = 1 时求y方向的一阶导数(如果同时为1,通常效果不佳)
ksize: (可选参数) Sobel算子的大小,必须是1, 3, 5或者7(奇数), 默认为3。
"""
sobel_x = cv2.Sobel(image_gray, cv2.CV_64F, 1, 0, ksize=3)
sobel_y = cv2.Sobel(image_gray, cv2.CV_64F, 0, 1, ksize=3)
# 计算梯度幅值,图像归一化
sobel_img = np.hypot(sobel_x, sobel_y)
sobel_img = np.uint8(sobel_img / np.max(sobel_img) * 255)
"""------------------------------Prewitt-------------------------------------"""
kernelx = np.array([[1, 1, 1], [0, 0, 0], [-1, -1, -1]], dtype=int)
kernely = np.array([[-1, 0, 1], [-1, 0, 1], [-1, 0, 1]], dtype=int)
prewitt_x = cv2.filter2D(image_gray, -1, kernelx)
prewitt_y = cv2.filter2D(image_gray, -1, kernely)
prewitt_img = np.hypot(prewitt_x, prewitt_y)
prewitt_img = np.uint8(prewitt_img / np.max(prewitt_img) * 255)
"""------------------------------Laplacian-------------------------------------"""
# 使用OpenCV的Laplacian函数
"""
cv2.Laplacian(src, ddepth[, dst[, ksize[, scalel, delta[, borderType]]]]])
参数说明:
src:输入图像,可以是灰度图像,也可以是多通道的彩色图像
ddepth:输出图片的数据深度,由输入图像的深度进行选择
ksize:计算二阶导数滤波器的孔径大小,必须为正奇数,可选项
scale:缩放比例因子,可选项,默认值为 1
delta:输出图像的偏移量,可选项,默认值为 0
"""
lap_img = cv2.Laplacian(image_gray, cv2.CV_64F)
lap_img = cv2.convertScaleAbs(lap_img)
"""------------------------------Canny-------------------------------------"""
# 使用OpenCV的Canny函数
"""
cv.Canny( image, threshold1, threshold2[, apertureSize[, L2gradient]])
image 为输入图像
threshold1 表示处理过程中的第一个阈值。
threshold2 表示处理过程中的第二个阈值。通常高阈值是低阈值的2到3倍。
"""
canny_img = cv2.Canny(image_gray, 100, 200)
image_color_rgb = cv2.cvtColor(image_color, cv2.COLOR_BGR2RGB)
plt.figure(figsize=(10, 7))
plt.subplot(2, 3, 1), plt.title('Original Image'), plt.imshow(image_color_rgb, cmap='gray')
plt.subplot(2, 3, 2), plt.title('Gray Image'), plt.imshow(image_gray, cmap='gray')
plt.subplot(2, 3, 3), plt.title('Sobel'), plt.imshow(sobel_img, cmap='gray')
plt.subplot(2, 3, 4), plt.title('Prewitt'), plt.imshow(prewitt_img, cmap='gray')
plt.subplot(2, 3, 5), plt.title('Laplacian'), plt.imshow(lap_img, cmap='gray')
plt.subplot(2, 3, 6), plt.title('Canny'), plt.imshow(canny_img, cmap='gray')
plt.show()
标签:gray,plt,img,检测,算子,cv2,算法,图像处理,梯度
From: https://blog.csdn.net/qq_39631801/article/details/142104712