Mask Scoring RCNN

时间：2024-01-31 17:27:32浏览次数：37

标签：Scoring 本文 mask IoU Mask rcnn RCNN

论文：https://openaccess.thecvf.com/content_CVPR_2019/papers/Huang_Mask_Scoring_R-CNN_CVPR_2019_paper.pdf

论文翻译和解读：https://zhuanlan.zhihu.com/p/111722103?utm_id=0

这篇文章的motivation在于质疑了mask rcnn中利用mask分类的confidence来作为mask完整性指标的标准。本文认为mask分类的confidence只能用于评估分类效果，因此本文为了让模型更好地观察到mask的完整性而提出了一个新的概念Mask IoU和新的网络块Mask IoU head。

1. Mask Scoring的定义

对于传统的mask rcnn，有：

\[S_{mask} = S_{cls} \]

然而本文中，作者提出cls的置信度与mask的完整度之间关联性不大，因此引入了mask IoU，来让网络察觉到生成mask的完整度：

\[S_{mask} = S_{cls} \cdot S_{maskIoU} \]

2. 总体网络结构

mask scoring的总体网络结构如下图所示：

从图中可以看出，mask scoring rcnn和mask rcnn的主要区别在于，本文多添加了一个mask IoU Head，其中的做法是将RoI Align后得到的归一化的Region proposal和经过Mask head得到的mask进行concat（不同的合并形式在后文中有讨论），并用得到的结果计算得到预测mask和ground truth之间的MaskIoU，并作为回归任务来引导网络的训练。

3. Concat的几种形式

本文中，作者提出了几种concat方式的设想，如下图所示：

最终，作者通过实验得出，(a) 方法在几种评估指标上的表现最好，如下图所示：

4. 可视化

可视化结果表明，本文提出的mask scoring rcnn，相比于mask rcnn，能够更好地反映出mask score与mask IoU之间的关系：

标签：Scoring,本文,mask,IoU,Mask,rcnn,RCNN
From： https://www.cnblogs.com/pab-oolongtea/p/17999698

人工智能大模型原理与应用实战：从YOLO到Faster RCNN
1.背景介绍人工智能（ArtificialIntelligence,AI）是一门研究如何让计算机自主地完成人类常见任务的学科。在过去的几年里，人工智能技术的发展取得了显著的进展，尤其是在深度学习（DeepLearning）领域。深度学习是一种通过神经网络模拟人类大脑工作原理的机器学习方法，它已经被广泛应用于图......
人工智能大模型原理与应用实战：从UNet到Mask RCNN
1.背景介绍人工智能（ArtificialIntelligence,AI）是一门研究如何让计算机自主地完成人类任务的学科。在过去的几十年里，人工智能主要关注于规则引擎和知识表示。然而，随着数据量的增加和计算能力的提高，深度学习（DeepLearning）成为人工智能领域的一个热门话题。深度学习是一种通过神经网......
umask永久修改用户创建文件权限
Linux里永久设置用户创建文件权限的配置文件是/etc/profile。可以在该文件中添加umask命令来设置默认权限。具体操作步骤如下：打开/etc/profile文件：sudovi/etc/profile在文件末尾添加umask命令并设置默认权限例如设置默认权限为022：umask022保存文件并退出使配置文件生效：so......
Linux命令(110)之umask
linux命令之umask1.umask介绍linux命令umask为linux内建命令，用于设置创建文件/目录时的权限掩码。默认umask值为偶数，创建文件时，直接相减；如果有奇数，创建文件时，对应结果要加一。另外，之所以文件用666去减，表示文件默认不能有执行权限(x)；如果减得的结果中有执行权限(x)，则需要将其加一。......
Windows10+Qt+OpenCV出现“ACCESS_MASK”: 不明确的符号
一、概述背景：Qt+OpenCV一模一样的代码在Mac上运行是正常的，在Windows10上运行就会报一下错误。“ACCESS_MASK”:不明确的符号二、原因及解决方案原因：OpenCV4.5.3的命名空间usingnamespacecv;和windows中的ACCESS_MASK定义冲突，在windows.h头文件中。......
Linux中mask的作用
在计算机科学和信息安全领域，"mask"（掩码）通常指的是一种用来隐藏、保护或操作数据的技术。以下是一些常见的上下文中掩码的作用：1. **子网掩码（Subnet Mask）：**- 用于在IP地址中区分网络部分和主机部分。子网掩码中的"1"位表示网络部分，"0"位表示主机部分。它帮助路由器正确地将数据包......
m基于Faster-RCNN网络的猫脸检测和猫眼定位系统matlab仿真,带GUI界面
1.算法仿真效果matlab2022a仿真结果如下： 2.算法涉及理论知识概要猫作为一种受欢迎的宠物，其图像在互联网上大量存在。对猫脸和猫眼进行准确检测和定位，在宠物识别、情感分析等领域具有广泛的应用价值。然而，由于猫脸和猫眼的多样性以及复杂背景的干扰，传统......
systemctl mask firewalld
systemctlmaskfirewalldsystemctl--helpmaskNAME...MaskoneormoreunitsunmaskNAME...Unmaskoneormoreunits[root@hecs-98663~]#systemctlstatusfirewalld●firewalld.service-firewalld-dynamicfirewall......
mask-rcnn_swin-t-p4-w7_fpn_1x_coco.py 里面的内容
_base_=['../_base_/models/mask-rcnn_r50_fpn.py','../_base_/datasets/coco_instance.py','../_base_/schedules/schedule_1x.py','../_base_/default_runtime.py']pretrained='https://github.com/Swi......
RCNN, fastRCNN, fasterRCNN
RCNN,fastRCNN,fasterRCNN参考目录：RCNN，fast-RCNN，faster-RCNN：https://zhuanlan.zhihu.com/p/64694855RCNN参考目录：RCNN详解：https://blog.csdn.net/weixin_44338712/article/details/107343260IoU，NMS和bbox回归：https://zhuanlan.zhihu.com/p/60794316任务输入：image输......

Mask Scoring RCNN

1. Mask Scoring的定义

2. 总体网络结构

3. Concat的几种形式

4. 可视化

相关文章

赞助商

阅读排行