1.整体实验部分
实验应用了四种最先进的深度学习方法,即。两个两阶段检测器,Faster RCNN(Ren等人,2015)和Cascade RCNN,Cai和Vasconcelos,2018),以及两个一阶段检测器,SSD(Liu等人,2015年)和YOLOv3(Redmon和Farhadi,2018年)到Pest24,用于多害虫检测。按照标准实践,更快的RCNN在Caffe框架中接受70k次迭代的训练,Cascade R-CNN、SSD和YOLOv3在PyTorch框架中分别接受12次、12次和20次迭代的培训。在训练期间,共享卷积层由ImageNet上预先训练的模型初始化(Russakovsky et al.,2015),其他层通过从标准偏差为0.01的零均值高斯分布中提取权重来随机初始化。初始学习率、权重衰减和动量分别设置为0.001、0.0005和0.9。所有实验都是在Linux服务器上进行的,该服务器具有一个Nvidia Titan X(Pascal)GPU和128 GB内存。
Faster RCNN : 70个epoch
Cascede RCNN :12个epoch
SSD : 12个epoch
YOLO v3 : 20个epoch
共享卷积层 首先是在预先训练的模型初始化,其它层通过0.01均值高斯分布,进行随机初始化。
初始学习率、权重衰减和动量分别设置为0.001、0.0005和0.9。所有实验都是在Linux服务器上进行的,该服务器具有一个Nvidia Titan X(Pascal)GPU和128 GB内存。
2.细节实验
2.1
作者在超参数设置上,分别按默认参数和优化参数进行了实验
Resulting mAPs by four state-of-the-art detection methods in default and
optimal setting of hyper-parameters on Pest24. Note that, the default setting is
base_size = 16 for Faster RCNN, anchor_scales = 8 for Cascade R-CNN,
smin = 0.2 and smax = 0.9 for SSD, and scale range = [10,13], [16,30], [33,23],
[30,61], [62,45], [59,119], [116,90], [156,198], [373,326]) for YOLOv3, re-
spectively. The optimal setting is base_size = 4 for Faster RCNN, anchor_s-
cales = 4 for Cascade R-CNN, smin = 0.1 and smax = 0.7 for SSD, and scale
range = [13,17], [17,30], [21,22], [23,39], [26,29], [30,50], [35,36], [42,51],
[53,74]) YOLOv3, respectively.
并在测试集上进行了测试。对于每种方法,我们首先使用其超参数的默认设置。图9显示了得到的mAP,表明YOLOv3在这些方法中获得了61.42%的最佳mAP。然后,我们对每种方法尝试不同的超参数值,以再次检测害虫。特别是,对于Faster RCNN和Cascade R-CNN,我们分别在(2、4、8和16)之间改变base_size参数,在(2,4和8)之间改变anchorr_scales参数,这指定了用于生成提案的锚定尺度的大小。对于SSD,参数smin和smax在一组对(0.1和0.7、0.1和0.8、0.2和0.7,0.2和0.9)之间进行调整,以控制每个要素图上的锚大小。对于YOLOv3,我们使用k-means聚类算法来优化参数比例范围,该范围指定了每个特征地图中锚的大小。所有方法的训练损失在规定的时间内收敛(补充材料中的图S1–S4)。因此,YOLOv3仍然获得了63.54%的最佳mAP,分别比SSD、Faster RCNN和Cascade R-CNN的最佳结果高13.03%、11.82%和3.57%,如图9所示。图9还显示,只有当使用比默认锚尺寸更小的锚时,每种方法才能达到最佳mAP。这应该是由于Pest24中害虫的体积非常小,这表明专门用于小物体的探测器可以获得更好的检测性能。