首页 > 其他分享 >NeurIPS 2022:基于语义聚合的对比式自监督学习方法

NeurIPS 2022:基于语义聚合的对比式自监督学习方法

时间:2022-12-19 17:47:39浏览次数:56  
标签:编码器 特征 样本 语义 2022 图像 类别 NeurIPS

摘要:该论文将同一图像不同视角图像块内的语义一致的图像区域视为正样本对,语义不同的图像区域视为负样本对。

本文分享自华为云社区《[NeurIPS 2022]基于语义聚合的对比式自监督学习方法》,作者:Hint 。

1.研究背景

近些年来,利用大规模的强标注数据,深度神经网络在物体识别、物体检测和物体分割任务中取得巨大进展。然而,强标注数据耗时又耗力。为此,自监督学习方法提出从大量的无标注数据中学习出高效的特征编码器,然后利用该特征编码器在小规模数据上进行强监督训练,以此达到和在大规模强标注数据上训练的模型相当的性能。基于对比式自监督学习方法的出发点为:从不同视角来观察图像,将来自同一图像的不同视角的图像块视为正样本对,来自不同图像的图像块视为负样本对,通过拉近正样本对的特征的距离,拉远负样本对的特征的距离来监督特征编码器的学习。

然而,以上方法的基本假设(正样本对,即同一图像的不同视角的图像块,具有相同的语义)在以物体为中心的数据集(ImageNet)中成立,在以场景为中心的数据集(同一图像中包含多个物体,如COCO)中难以成立。为此,该论文将同一图像不同视角图像块内的语义一致的图像区域视为正样本对,语义不同的图像区域视为负样本对。

2.方法

本文方法和MoCo的框架类似,不同的是,本文将每类物体定义为一个可学习的类别向量S,根据类别向量S和图像特征图的每个位置计算相识度,聚合图像中同一类别的特征,然后将聚合后的类别特征构成正负样本对来进行对比训练学习。具体的网络结构如图1所示,其步骤包括:

  1. 同一图像经过数据增强得到不同的视角图像块,并分别输入图像编码器得到特征图;
  2. 将类别特征向量S和图像特征图计算每个位置的相似度,并根据相似度聚合得到图像中每个类别的特征;
  3. 得到两个视角下的聚合的类别特征后,拉近同类别特征间的距离,拉远不同类别特征之间的距离;
  4. 与此同时,拉近两个视角下,重叠图像区域的特征间的距离。

经过迭代训练后,图像特征编码器能够建模不同类别之间的语义特征,使得图像编码器更鲁棒。

图1:SlotCon的流程图

3.实验结果:

主要实验结果如下表所示,可以看出,无论在目标检测还是分割任务上,该方法高出当前Image-level和Pixel-level的方法许多,证明了基于Object/Group-level的方法的优越性。另外,和Object/Group-level的方法相比,能够高出SOTA方法1.0%左右,表明了本文中可学习语义聚合方法的优势。

图2展示了无监督分割的定量和定性结果,该方法在此任务上取得不错性能。其mIoU值高出当前无监督分割方法3.92%。

图2:无监督语义分割

图3展示了类别向量S和图像特征之间的相似度。可以看出,学习出的类别向量和图像中相应类别物体具有较高的相似度,说明图像特征编码器编码了较高的语义特征。

图3:类别特征向量S和图像特征间的相似度,红色区域为相似度较高区域

论文链接:[2205.15288] Self-Supervised Visual Representation Learning with Semantic Grouping (arxiv.org)

 

点击关注,第一时间了解华为云新鲜技术~

标签:编码器,特征,样本,语义,2022,图像,类别,NeurIPS
From: https://www.cnblogs.com/huaweiyun/p/16992683.html

相关文章

  • 知行之桥2022版本升级之页面变化以及监控邮件答疑
    近期有些客户将知行EDI系统升级到了我们最新知行之桥2022版本,升级过程或者升级后对于新版本的使用会有些疑问,根据近期协助大家进行知行EDI系统升级遇到的问题,我们的运维团......
  • [NOIP2022] 建造军营
    [NOIP2022]建造军营题目描述A国与B国正在激烈交战中,A国打算在自己的国土上建造一些军营。A国的国土由\(n\)座城市组成,\(m\)条双向道路连接这些城市,使得任意两......
  • 【2022-12-16】连岳摘抄
    23:59爱是生命的和弦,而不是孤单的独奏曲。                                       ......
  • .NET周报【12月第2期 2022-12-15】
    国内文章九哥聊Kestrel网络编程第一章:开发一个Redis服务器https://mp.weixin.qq.com/s/HJYnBE-7wbvkAYHxQaq3eQ我和拥有多个.NET千星开源项目作者九哥一拍即合,为了让更......
  • 网关Zuul+route+Filter+Fallback+Retry笔记20221202
    一、ek20141、pom.xml<dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter......
  • 我的2022年-总结、感悟、碎碎念
    又到年底了,总结下2022吧,今年还是蛮多收获和感悟的,感觉越发活的通透了些,有些事情我们无法把握,有些事情我们能把握。淡然面对无法把握的,积极把握能把我的。工作工作上面今......
  • P8817 [CSP-S 2022] 假期计划
    #include<iostream>#include<queue>#include<cstring>#include<algorithm>usingnamespacestd;#definelllonglong#definepiipair<ll,ll>#definefirfirs......
  • 稳中求进的2022年
    2022年年初做了一份年度计划,给自己列了13条今年完成的事情,除了1条完全没有启动之外,其余12条或完成,或还在进行中。给自己还定了5个核心目标,除了个别需要......
  • 记录2022世界杯阿根廷夺冠
    2022年12月19日,在这个2022即将过去的一天,梅西终于带着阿根廷夺得了大力神杯,梅老板的最后一场世界杯也是圆满结束了,五次世界杯,16年的时光,星光不问赶路人,时光不负有心人,终于......
  • day6-2022.12.17-flex布局初识(三)
    一、作业完成如下设计图的布局   二、作业需掌握知识点1、理解模型盒子1.1<imgsrc="../assets/boxModel.png"alt="" 解释:img标签用来引入图......