Decoupling Zero-Shot Semantic Segmentation论文阅读笔记

时间：2023-02-07 21:57:41浏览次数：51

标签：Segmentation Semantic Decoupling mask Zero embedding ZegFormer seen class

摘要

现有的方法将零样本语义分割（Zero-shot semantic segmentation，ZS3）视为逐像素的zs分类，并且使用仅用文本预训练的模型来完成已知类到未知类的知识迁移，而文本图像预训练模型对于视觉任务有更大的潜力。同时，人类通常进行的是区域级的语义标注，因此，作者提出了一种新的范式，将ZS3解耦为两个子任务：将像素分为分割区域，对区域进行zs分类。第一个任务不包含类别信息，可以用于聚合未知类别的像素；后一个阶段可以很自然的利用大规模的文本图像预训练模型实现ZS3。为此，作者提出了ZegFormer，在VOC和COCO Stuff上取得了突出的表现。

方法

截屏2023-01-31 17.53.42

如果熟悉MaskFormer的话模型的pipeline就很清晰了。在seen class训练时，通过N个query与backbone提取到的feature生成N个segment embedding，经过投影后与text embedding计算相似度从而计算class loss；同时pixel decoder的输出与N个mask embedding计算得到N个类不可知的mask，再计算mask loss。推理时，将mask作用于原图，预处理后送入clip的image-encoder，得到的image- embedding与text- embedding计算相似度，得到最终的分类结果。

概率分布计算：

截屏2023-02-07 20.23.57

在推理时，为了避免结果偏向seen class，需要在求类别的时候降低seen class的概率：

截屏2023-02-07 20.51.58

对于每个query，将ZegFormer-seg和ZegFormer-img的结果进行融合（代码mask_former_model.py的373行）：

截屏2023-02-07 21.25.40

实验

截屏2023-02-07 21.34.11

截屏2023-02-07 21.34.27

截屏2023-02-07 21.34.59

截屏2023-02-07 21.35.23

预处理这一部分还是比较有趣的，具体细节可以看一下代码，看看是如何进行crop的。

标签：Segmentation,Semantic,Decoupling,mask,Zero,embedding,ZegFormer,seen,class
From： https://www.cnblogs.com/lipoicyclic/p/17099920.html

The Semantics of Constructors——2.2 拷贝构造函数的构造操作
TheSemanticsofConstructors2.2.1DefaultMemberwiseInitialization(默认的逐成员初始化)如果class没有提供一个explicitcopyconstructor又当如何？当classobject......
The Semantics of Constructors——2.1 默认构造函数的构造操作
TheSemanticsofConstructors2.1DefaultConstructor的构造操作C++新手一般有两个常见的误解：任何class如果没有定义默认构造函数，就会被合成出一个来。编译器合......
The Semantics of Constructors——2.4 成员初始化列表
2.4成员初始化列表（MemberInitializationList）当你写下一个constructor时，就有机会设定classmembers的初值。要不是经由memberinitializationlist，就是在constructor函......
The Semantics of Constructors——2.3 程序转化语意学
2.3程序转化语意学#include"X.h"Xfoo(){Xxx;returnxx;}一个人可能会对代码做出以下假设：每次foo（）被调用，就传回xx的值。如果classX定义了一个co......
论文阅读笔记（一）：UNeXt MLP-based Rapid Medical Image Segmentation Network
UNeXt:MLP-basedRapidMedicalImageSegmentationNetwork论文：https://arxiv.org/abs/2203.04967代码：https://github.com/jeya-maria-jose/UNeXt-pytorch1.动机UNe......
Per-Pixel Classification is Not All You Need for Semantic Segmentation论文阅读笔
作者的解读：https://www.zhihu.com/search?type=content&q=MaskFormer摘要现有的语义分割方法将分割视为逐像素的分类，本文提出了MaskFormer，把分割转化为预测一系列的mask......
DevOps: 自动与手动部署语义化版本(Semantic Versioning)实操
本文将向您展示如何使用Buddy的流水线在任何Git存储仓中自动增加应用程序的版本。我们即将创建的流水线使用参数来定义我们想要提升的数字(主版本号/次版本号/修订号)，使用......
【AAAI2023】Head-Free Lightweight Semantic Segmentation with Linear Transformer
论文：【AAAI2023】Head-FreeLightweightSemanticSegmentationwithLinearTransformer代码：https://github.com/dongbo811/AFFormer这是来自阿里巴巴的工作，作者构建了......
ABAP 编程语言里的 Reference Semantic - 引用语义
ABAP编程语言里，对ABAP类实例（类对象）或匿名数据对象的多个引用，使用引用语义(ReferenceSemantic)解析。这意味着：引用单个类对象或匿名数据对象的所有变量，在内存中共享......
【多任务学习】Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Ge
·阅读摘要：本文提出针对CV领域的多任务模型，设置一个可以学习损失权重的损失层，可以提高模型精度。·参考文献： [1]Multi-TaskLearningUsingUncertaintytoWeig......

Decoupling Zero-Shot Semantic Segmentation论文阅读笔记

摘要

方法

实验

相关文章

赞助商

阅读排行