我遇到了一个问题,我想识别混合中的不同咖啡豆。 我创建了一个神经网络,它能够单独识别不同的豆子。但在实践中,我想开发一种算法,可以批量检测这些豆子。没有必要识别图片中的所有豆子,但是当我能够识别较大批次中的 10-15 个豆子时,这就足够了。
现在的问题是我能够分割豆子当只有一层具有对比背景的 beans 时,但是当第一层下面有多层 beans 时,它会变得非常困难。
我尝试使用距离变换和来自 openCV 的分水岭算法,如上所述,这仅适用于单个 bean 和 bean 之间的一些小重叠(就像 这个示例 一样)。下图显示了结果: 单层分割的结果
我使用的代码是基于前面提到的示例:
import cv2
import numpy as np
from matplotlib import pyplot as plt
from scipy.ndimage import label
from scipy.ndimage import morphology
# load the image as normal and grayscale
img_path = "FINAL/segmentation/IMG_6699.JPG"
img= cv.imread(img_path,0)
img0 = cv.imread(img_path)
#preprocess the image
img= cv.medianBlur(img,5)
ret,th1 = cv.threshold(img,80,255,cv.THRESH_BINARY_INV)
kernel = np.ones((5,5),np.uint8)
opening = cv2.morphologyEx(th1, cv2.MORPH_OPEN, kernel)
dilation = cv2.dilate(opening, None, iterations=2)
erosion = cv2.erode(dilation,kernel,iterations = 50)
border_nonseg = dilation - cv2.erode(dilation, None, iterations = 1)
#distance transform
#dt = morphology.distance_transform_bf(dilation, metric='chessboard')
dt = cv2.distanceTransform(dilation, 2, 5)
dt = ((dt - dt.min()) / (dt.max() - dt.min()) * 255).astype(np.uint8)
hier, dt1 = cv2.threshold(dt, 170, 255, cv2.THRESH_BINARY)
# label the centers found by the distance transform
lbl, ncc = label(dt1)
lbl = lbl * (255/ncc)
# Completing the markers now.
lbl[border_nonseg == 255] = 255
lbl = lbl.astype(np.int32)
# Watershed algorithm
cv2.watershed(img0, lbl)
lbl[lbl == -1] = 0
lbl = lbl.astype(np.uint8)
result = 255 - lbl
lbl_cont = result
# Draw the borders
result[result != 255] = 0
result = cv2.dilate(result, None, iterations=1)
img0[result == 255] = (255, 0, 0)
cv2.imwrite("output.png", img0)
contours, _ = cv.findContours(result, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE)
titles = ['Original Image', 'dilation',
'gradient morph', 'erode']
images = [ border_nonseg, dt, lbl_cont, img0]
plt.figure(figsize=(20,20))
for i in range(4):
plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')
plt.title(titles[i])
plt.xticks([]),plt.yticks([])
plt.show()
但是当出现这样的图片时(这是真实情况),问题就开始了: 多层分割 和 更难的多层分割
我不认为我能够重用前面提到的代码,并且我需要一种不同的方法。因为第一层和第二层之间的对比度太小,因为豆子的尺寸很小,所以它们不会产生很大的阴影,这会产生很好的对比度,而且豆子的颜色也很暗,这使得并没有让它变得更容易。
那么您对解决这个问题的不同方法有什么建议,或者调整当前的代码来解决我的问题吗?
我很好奇听到对此的不同意见!
你绝对说对了,当咖啡豆堆叠在一起,并且底层咖啡豆与背景的对比度很低时,分割咖啡豆就会变得更加困难。你的初始方法适用于单层,但你需要更强大的技术来处理这些复杂的情况。
以下是一些可以探索的想法来改进你的咖啡豆分割:
1. 改进预处理
- 多尺度处理: 由于某些咖啡豆很小,并且由于遮挡而对比度较低,因此尝试使用不同大小的核进行多尺度处理(例如,高斯模糊或拉普拉斯算子)。这可以帮助你增强不同尺度的特征,并可能使那些隐藏的咖啡豆更加突出。
- 直方图均衡化: 尝试对图像的特定区域(其中咖啡豆较暗)应用局部直方图均衡化,以改善对比度。
- 颜色空间: 尝试在 RGB 以外的不同颜色空间(例如 HSV 或 LAB)中工作。某些颜色空间可能可以更好地分离咖啡豆和背景,具体取决于咖啡豆和照明条件。
2. 分割
- 基于边缘的分割: 由于你的分水岭方法在一定程度上有效,因此尝试改进边缘检测。调查更先进的边缘检测算法,例如 Canny 边缘检测,或使用机器学习方法训练边缘检测器,专门针对你的咖啡豆图像。
- 基于区域的分割: 探索区域生长或区域合并等技术。这些算法可以根据颜色、纹理或相似性的标准对像素进行分组,这可能有助于分离重叠的咖啡豆。
- 基于机器学习的分割: 对于更强大的解决方案,请考虑训练分割模型,例如 U-Net 或 Mask R-CNN。这些模型需要大量带注释的数据(分割后的咖啡豆图像),但可以学习识别复杂模式并处理遮挡。
3. 后处理
- 形态学运算: 在分割后,使用形态学运算(例如腐蚀、膨胀或开运算)来细化分割后的区域并消除噪声或小伪影。
- 基于形状的过滤: 如果你的咖啡豆具有独特的形状特征,则使用基于形状的标准(例如,面积、圆度或纵横比)过滤分割后的区域。这可以帮助你消除与典型咖啡豆形状不符的误报。
- 重叠分析: 识别并处理重叠的咖啡豆。你可以根据分割后的区域的大小、形状或其他特征来分析重叠程度,并可能应用算法来分离它们。
实现提示:
- 逐步改进: 逐步处理你的分割管道,并评估每个步骤的影响。
- 数据增强: 如果选择机器学习方法,则使用数据增强技术(例如翻转、旋转和缩放)来增加训练数据集的大小和多样性。
- 实验: 不要害怕尝试不同的技术、参数和组合,以找到最适合你的特定数据的技术。
请记住,没有一种通用的解决方案可以完美地分割所有情况下的咖啡豆。你需要根据图像的具体特征和所面对的挑战来试验和调整你的方法。
标签:python,opencv,computer-vision,watershed From: 66851460