YOLOv5改进策略|YOLOv5鸟类检测,准确率可以达到 87.40%，提升了21.25%,实时检测⻛力发电机附近的⻦类检测,k-means+聚类算法优化鸟类检测

标签：YOLOv5 鸟类检测模型网络 RetinexNet 图像弱光

订阅专栏后私信获取完整源码+远程部署

⻛力发电机组的安全是海上⻛电场稳定运行的前提。然而，⻦害对⻛力发电机和⻛力发电机叶片的安全运行构成直接威胁。此外，每年有数百万只⻦类被⻛力涡轮机杀死。为了保护生态环境、维护海上⻛机安全运行，并针对当前目标检测算法在夜间等弱光环境下检测能力较低的问题，提出一种改进方法通过将 CBAM 注意力机制和 RetinexNet 网络集成到 YOLOv5 中来提高网络性能。首先，将训练集图像输入集成CBAM注意力模块的YOLOv5网络进行训练，并存储最优权重模型。然后，使用Decom-Net和Enhance-Net对低光图像进行增强和去噪，并在最佳权重模型上测试准确性。此外，采用k-means++聚类算法优化anchor box选择方法，解决了初始质心不稳定的问题，取得了更好的聚类效果。实验结果表明，该模型在⻦类检测任务中的准确率可以达到 87.40%，提升了21.25%。该模型可以实时检测⻛力发电机附近的⻦类，并且在夜间、阴雨和震动的情况下表现出很强的稳定性，证明该模型可以保证⻛力发电机的安全稳定运行。

简介

海上⻛电是一种新兴的可再生能源技术，近几十年来经历了快速发展。它是一种低成本、可再生、无污染的资源，海上⻛电现已成为世界上装机容量最大的可再生能源之一[1]。然而，这些改进可能会对生态系统产生负面影响，特别是对海⻦。有许多关于⻦类因与涡轮叶片碰撞以及筑巢和觅⻝栖息地丧失而死亡的报道。随着⻛力涡轮机的普及，预计死亡人数还会增加。在美国，估计每年有多达 50 万只⻦类与⻛力涡轮机相撞 [2]。候⻦物种受到公众高度关注，并受到旨在保护共享自然资源的国际和国家立法的保护[3]。在欧洲，许多海⻦受欧洲立法，特别是野⻦指令 (2009/147/EC) 的保护。在美国，《濒危物种法》和其他立法提供保护，同时考虑到海上⻛能对海⻦种群的潜在影响。法律保护可能会限制海上⻛电场的发展，并且在不久的将来，⻛力涡轮机的增加可能会影响⻦类种群，特别是濒临灭绝的物种。因此有必要开发一种基于深度学习的⻦类自动检测系统，以实现更有针对性的监测.

准确的⻦类检测有助于防止⻦类与⻛力涡轮机之间的碰撞，并有助于设计⻛电场的防碰撞系统 - 例如，当⻦类⻜近时，通过发射脉冲光 [5] 或低频噪声 [6]涡轮机。从历史上看，人们通过根据⻦类迁徙和与⻛力涡轮机潜在碰撞⻛险的预测来选址海上⻛电场来保护⻦类并减少碰撞[7,8,9]。

近年来，深度卷积神经网络(CNN)在目标检测方面表现出强大的适应性 [10,11,12]，并已广泛应用于⻦类检测[13]。⻦类检测和预警方法面临着诸如: 天空中的⻦类可以在蓝色背景下伪装、⻦类可以高速⻜行以及⻦类出现的距离和大小可以随机变化等挑战。

当前基于深度学习的目标检测方法分为两类: 1)基于候选区域生成的卷积网络，如R-CNN
[14]及其改进版本Faster R-CNN [15,16];但这些方法网络复杂度高、运行速度慢，不适合实时检测要求。 2)将目标位置信息视为回归问题的方法，例如 Single Shot MultiBox Detector (SSD) [17] 和 You Only Look Once (YOLO) [18]，满足实时性要求，但检测精度相对较低。近年来，出现了YOLOv4-Tiny [19]和YOLOv5 [20]等轻量级目标检测网络，提供了检测精度和速度，使其适合在嵌入式计算平台上使用.

材料和数据收集

实验环境

本研究中的所有实验均在 Linux 系统上进行，配备 Intel(R) Xeon(R) CPU E5-2680 v4 CPU @ 2.40GHz、NVIDIA GeForce GTX 3090 (24G) 显卡和 32GB RAM。我们深度使用Pytorch 1.0.1用于训练和测试⻦类检测网络的学习框架和Python 3.6。

实验数据

这项研究中使用的图像是从韩国 Shin-Wanjin 海上⻛电场和公开的低光夜行⻦类数据集收集的。总共收集了 23,432 张图像，其中随机抽取了 6,500 张⻜⻦图像。然后将这些图像的大小调整为 500x500 像素。然后使用标记软件对图像进行手动标记和注释。数据集分为 5,000 张图像用于训练，1,000 张用于验证，500 张用于测试。

方法

YOLOv5

YOLOv5-v5.0是Redmon等人提出的YOLO系列中的算法。之前的版本包括 YOLOv1、YOLOv2、YOLOv3和YOLOv4。它有四个模型:YOLOv5s、 YOLOv5m、YOLOv5l和YOLOv5x。在本研究中，我们使用YOLOv5s模型进行实验，如图1所示。由于其网络深度和特征图宽度最小[24,25,26]，训练相对方便。 YOLOv5s 由输入、⻣干、颈部和预测组成。输入使用 Mosaic 进行数据增强，与之前的 YOLO 版本不同，YOLOv5 可以重新计算并自适应缩放锚框。主干网主要由Focus结构、CSP1_x结构和空间金字塔池化(SPP)组成。 Focus 执行复制和切片操作以获得2倍下采样的特征图，而不会丢失特征信息。 CSP1_x具有残差结构，可以优化网络的梯度信息，避免因深度增加而导致梯度消失。 SPP将不同尺寸的输入图像转换为固定尺寸的图像。 Neck层使用特征金字塔(FPN)和PANet架构进行特征融合，有效地进行多尺度特征融合。它采用CSP2_x结构，并用CBL结构代替残差结构，CBL结构由卷积层、BN归一化层和ReLU激活层组成，以提高特征提取融合。在预测中，非极大值抑制 (NMS)使用CIoU_loss作为B盒损失函数来消除冗余边界框。

为了提高目标检测的准确性，我们在 YOLOv5s 网络模型中添加了卷积块注意力模块(CBAM)。 [27]

CBAM的灵感主要来自于人脑处理视觉信息的方式。[28]CBAM是一种简单、轻量级且有效的前馈卷积神经网络注意力模块。该模块改进了 SENet 在特征图通道上生成注意力的问题，只能关注某些层的反馈。 [29]

CBAM 通过将生成的注意力图与输入特征图像相乘来推断通道和空间维度的注意力，以进行自适应特征细化。 [30] CBAM 仅增加了可忽略不计的计算复杂度，显着增强了网络模型的图像特征提取能力。 [31]

CBAM 可以集成到当前大多数主流网络中，并使用基本卷积神经网络进行端到端训练。因此，我们选择将该模块集成到YOLOv5网络中，以突出本质特征，减少不必要的特征提取，有效提高检测精度。 CBAM模块的结构如图2所示。

通过一维通道注意力机制中号Cε RC×1×1。特征图在最大池化和平均池化下进行压缩，产生两种不同的空间信息描述符:平均池特征中号Cε RC×1×1和最大池功能中号Cε RC×1×1。然后将它们输入由隐藏层和多层感知器 (MLP) 组成的共享网络。隐藏层的激活大小设置为RC/r×1×1，在哪里�是用于减少的减少比率参数开销，产生两个特征向量。最后，经过累加并经过sigmoid激活函数，得到通道权重��获得。然后将这些权重乘以给定特征图的每个像素�完成自适应特征细化，产生新的特征图�1。

RetinexNet模型

用于弱光检测的图像处理算法主要分为传统方法和深度学习方法。传统方法主要利用当前环境中突出的光特征，例如利用红外和可⻅光图像融合进行图像增强[33]。然而，它们无法提供对图像细节(例如颜色)的良好描述。 Retinex[34,35]是一种有效且可行的光照图像增强算法，但大多数基于Retinex 的方法在应用于不同环境时，由于手动约束和参数问题而受到模型容量的限制。由于卷积神经网络在图像处理中得到了广泛的应用，图像中的噪声和颜色失真相关问题得到了有效的改善，而RetinexNet[36]深度网络可以提供良好的弱光增强处理方法。

两段中间继续写400字:RetinexNet的Enhance-Net组件负责调整分解后

的反射率和光照度，以增强弱光图像。它利用深度卷积神经网络来学习分解成分与相应增强输出之间的映射。[37]该网络在低光图像及其相应地面实况增强版本的大型数据集上进行训练。

在调整阶段，Enhance-Net以分解的反射率和照明作为输入，并应用一系列可学习的操作来增强图像细节并提高其整体视觉质量。[38]网络学习有效抑制噪声，校正颜色失真，并增强图像的对比度和亮度。

RetinexNet 的优点之一是能够处理各种低光环境。与通常依赖于手动设计的约束和参数的传统方法不同，RetinexNet 是一种数据驱动的方法，可以从各种低光图像中学习。[39]这使得它能够很好地适应和泛化到不同的照明条件，从而使其更加稳健和有效。

此外，RetinexNet 的深度学习性质使其能够捕获低光图像中的复杂模式和依赖性，而传统方法可能难以做到这一点。通过利用卷积神经网络的力量， RetinexNet 可以有效地利用图像中存在的固有结构和上下文信息，从而获得更准确和视觉上令人愉悦的增强结果。 [40]

值得一提的是，RetinexNet 的成功还归功于用于低光图像增强的大规模注释数据集的可用性。这些数据集为网络提供了丰富的训练样本来源，使其能够学习各种低光特征和变化。此外，在训练过程中使用先进的优化技术和正则化方法有助于防止过度拟合并提高网络的泛化能力。

RetinexNet是一种数据驱动的Retinex分解方法，包括两种网络结构: Decom-Net和Enhance-Net。[41]整个增强过程分为分解、调整和重建三个阶段。 Decom-Net将获取的图像分解为不受光照影响的反射率和结构感知平衡光照，并通过两个约束条件进行学习:低光/正常光下的相等反射率和保留主要结构的平滑光照图。在训练过程中，获取一对弱光/普通光图像，并在弱光和普通光图像之间权重相等的情况下学习弱光及其对应的普通光图像的分解。网络架构如图5所示，取弱光图像S低的

Enhance-Net用于调整光照图以保持区域一致性，并通过多尺度级联裁剪布局分布，同时引入反射去噪以去除暗区噪声或增强过程中可能放大的噪声。该网络采用编码器-解码器结构，并引入多尺度级联，从层次⻆度调整照明。该结构可以将输入图像连续下采样到更小的尺度，下采样块由步⻓为2的卷积层和ReLU激活层组成，以获得大尺度的照片光照分布透视图，提高网络的适应性。然后使用大规模信息进行上采样以重建局部照明分布。

一旦选择了初始聚类中心，就可以照常应用 k 均值算法。这涉及将数据集中的每个数据点分配给最近的质心，根据这些分配重新计算质心位置，并重复这些步骤，直到分配不再改变。

通过改进初始化质心的方法，k-means++ 可以显着改善 k-means 聚类的结果，使其成为许多机器学习和数据分析任务中的宝贵工具。该方法提供了一种有效的方法来确保初始点分散，这往往会在最终的聚类中产生更好的结果。

综上所述，k-means++聚类算法是一个强大的工具，它为k-means聚类算法中初始聚类中心选择问题提供了解决方案。它提高了算法的稳定性和性能，使其成为任何数据科学家或机器学习工程师工具箱的宝贵补充。

测试结果与分析

表中数据表明，改进后的网络相对于原始网络，对于目标的识别准确率明显更高，提升了约6%。不过改进后的网络FPS略有降低，但仍然可以满足基本的实时性要求。

表2列出了原始模型和改进模型的具体性能指标，显示了精确率、召回率和F1分数等关键指标。虽然原始模型表现出令人满意的性能，改进后的模型在所有指标上都明显优于其他模型，从而证明了改进的有效性。

改进后的模型显示识别准确度显着提高了 6%。这一显着增强可归因于使用 k-means++ 聚类进行模型初始化，从而实现更精确和准确的初始设置。虽然改进模型中的每秒帧数 (FPS) 确实略有下降，但整体性能仍然令人满意，并且处于实时执行可接受的范围内。这确保了应用程序在现实世界中仍然实用，尽管速度略有下降。

图9展示了改进模型的⻦类检测的高精度。即使在具有挑战性的条件下，该模型也能够以高置信度检测⻦类，这证明了其稳健性。图像增强技术的使用使模型能够捕捉到图像中的微小细节，否则这些细节将很难检测到。

应用 k-means++ 聚类来初始化网络中心是这一改进的关键。通过选择分布在数据空间中的初始点，该模型能够有效地最小化簇内方差并最大化簇间方差。这导致了更准确和一致的结果。

总之，与原始模型相比，改进的模型在准确性和鲁棒性方面表现出显着的进步。虽然 FPS 的小幅降低是一种权衡，但识别精度的提高证明了速度的小幅降低是合理的。借助k-means++聚类和图像增强技术，这些模型在识别和检测⻦类方面变得更加有效，使其成为⻦类检测和物种识别领域的宝贵工具。未来的工作可以进一步优化这些模型，以平衡速度和准确性，从而实现更强大、更高效的实时⻦类检测。

结论

针对弱光环境下传统检测算法准确率较低的问题，提出一种基于注意力机制和RetinexNet的检测模型。将CBAM注意力模块引入YOLOv5检测网络可以有效解决复杂环境下的⻦类检测。 RetinexNet中的Decom-Net和Enhance- Net用于分解和增强弱光图像，提高模型夜间检测⻦类的能力。实验结果表明，改进的YOLOv5s算法在⻦类检测中准确率高、推理速度快。本文提出的方法提高了弱光环境下⻦类的检测性能，能够满足当前广泛应用的要求。

RetinexNet的分解和增强能力，特别是Decom-Net和Enhance-Net，对于提高模型的检测性能起着至关重要的作用。 Decom-Net 有效地将低光图像分离为反射率和平衡照明分量，而Enhance-Net 则增强这些分量以增强图像细节和整体可⻅性。通过将这些过程合并到检测管道中，该模型可以更好地了解弱光场景，从而提高⻦类检测的准确性。

实验结果证明了该方法的有效性。改进后的YOLOv5s算法在弱光条件下的⻦类检测任务中表现出高精度和快速推理。这种增强在性能不仅满足而且超过了当前广泛应用的要求，其中在弱光环境中准确检测⻦类非常重要。

总的来说，注意力机制和基于 RetinexNet 的方法提供了一个全面的解决方案来应对弱光条件下⻦类检测的挑战。通过利用注意力机制关注相关图像特征的能力和 RetinexNet 分解和增强低光图像的能力，该模型在准确性和推理速度上取得了显着的提高。所提出的方法对于需要在弱光环境下进行可靠和高效的⻦类检测的各种应用具有巨大的潜力，从野生动物保护和监测到安全系统和空中监视。

标签：YOLOv5,鸟类,检测,模型,网络,RetinexNet,图像,弱光
From： https://blog.csdn.net/m0_68036862/article/details/139663785

YOLOv5改进策略|YOLOv5鸟类检测,准确率可以达到 87.40%，提升了21.25%,实时检测⻛力发电机附近的⻦类检测,k-means+聚类算法优化鸟类检测

简介

材料和数据收集

实验环境

实验数据

方法

YOLOv5

RetinexNet模型

测试结果与分析

结论

相关文章

赞助商

阅读排行