Carion, Nicolas, et al. "End-to-end object detection with transformers." European conference on computer vision. Springer, Cham, 2020.
针对传统目标检测算法中存在的一些问题,比如需要手动设置anchors、nms等参数,即需要过多的人工干预从而给模型带来不确定性。本文首次提出了端到端的目标检测模型,通过缩减人工预处理和后续处理,尽可能使模型从原始输入到最终输出,给模型更多的自我学习空间,从而提高模型检测的准确性和泛化能力。
本文的优点在于使用object query代替了原来生成anchors的方式,利用二分图匹配代替了nms这一步,将很多不可学习的东西变得可学习,从而减少人工的干预,使得整个算法更加简单和高效。并且它是基于Transformer模型设计的,具有很强的泛化能力,在图像分割、姿态估计等其他计算机视觉任务上效果也很不错。
本文的不足是对小物体的检测效果比较差,可能是transformer是从全局建模,更容易学习到全局特征,而不像faster rcnn 使用特定大小的anchor锚框。
2023年2月24日
标签:End,泛化,检测,模型,Object,Detection,20,CCF From: https://www.cnblogs.com/FBprivacy/p/17151091.html