首页 > 其他分享 >Context Autoencoder for Self-Supervised Representation Learning

Context Autoencoder for Self-Supervised Representation Learning

时间:2023-03-06 20:11:50浏览次数:55  
标签:编码器 Autoencoder ViT Self 任务 Context 图像 掩码 表征

0. 前言

1.针对的问题

  BEiT和ViT中的方法法均使用单一ViT结构同时进行编码和解码,将表征学习和代理任务实现耦合在一起。因此,只探索了ViT的部分编码和表示学习能力,限制了表示质量。本文希望通过解决从图像中的可见块估计掩码块这一代理任务来预训练编码器,分离表征学习和代理任务的实现,提高表征学习能力,并相应地帮助下游任务。

2.方法

  模型框架如下,包括一个编码器、一个带有一致性约束的潜在上下文回归器和一个解码器。编码器只接受可见块作为输入,并学习其表征。潜在上下文回归器根据可见块的表征预测被掩码部分的表征,同时约束预测出来的掩码块表征和编码器得到的掩码块表征一致,最后通过解码器将预测表征映射到目标上。

  整个框架被分成了三个部分,(a)把可见图像块输入到编码器中,抽取可见图像块的表征。(b) 在编码表征空间中做预测,使得掩码图像块的表征和从可见图像块预测得到表征一致。(c) 将掩码图像块的表征输入到解码器中,预测掩码图像块。通过这样的设计,作者希望编码模块 (a) 和任务解决部分 (b,c) 分离;把掩码图像建模任务转成掩码表征建模任务 (b) ,在编码表征空间中,完成预测任务。

  计算图如下:

  (a)为CAE的计算图,(b)为BEiT的计算图,(c)为DAE的计算图。浅蓝色部分代表损失函数。(a)编码器F接收可见块Xv并输出它们的潜在表示Zv。潜在上下文回归器H预测了Zv中掩码块的潜在表征Zm。该解码器预测了Zm中掩码块的目标Ym。lz和ly是损失函数。在训练过程中,不计算梯度。Qm代表掩码块。

3.与其他模型对比

  BEiT把可见图像块的颜色信息和掩码图像块掩码 token (不包含掩码图像块的颜色信息) ,输入到ViT中,然后ViT输出通过一个线性层来做预测。尽管可以把 ViT 称为编码器,不过,ViT 负责了两项任务:表征编码,以及预测掩码图像块的任务,没有把这两个任务分离。换句话中,ViT也在不停的解决任务 (也就是预测任务)。正因为如此,BEiT 预训练得到 ViT 语义表征能力一般,从其 linear probing 可以看到。

  MAE 只把可见图像块输入到编码器中,然后编码器的输出的可见图像块的表征和掩码图像块的掩码 token,输入到由 self-attention 组成的解码器中去。这样的结构比 BEiT 有了进步,但是解码器中可见图像块的表征可能会进一步更新,所以表征学习的任务没有由编码器完全负责,所以 MAE 得到的编码器能力也不足够好。

 

  相比较,CAE尽量做到编码和MIM任务分离。除此,CAE在编码表征空间中做预测。

 

标签:编码器,Autoencoder,ViT,Self,任务,Context,图像,掩码,表征
From: https://www.cnblogs.com/lhiker/p/17169661.html

相关文章

  • odoo context上下文用法总结
    环境odoo-14.0.post20221212.tarcontext用法总结获取上下文>>>self.env.context#返回字典数据,等价于self._context{'lang':'en_US','tz':'Europe/Brussels'}>......
  • Servlet Context应用
    ServletContextweb容器在启动的时候,它会为每个web程序都创建一个对应的ServletContext对象,代表了当前的web应用一、共享数据:一个Servlet中保存的数据,可以在另外一个Ser......
  • EF7DbContext池
    为什么使用DbContext池?DbContext是EntityFramework中最重要的类型之一,它提供了一种连接数据库并执行查询和更新的方式。在一个ASP.NETCore应用程序中,每次请求都可能需要......
  • spring找不到配置文件applicationContext.xml
    问题描述:报错信息为Causedby:java.io.FileNotFoundException:classpathresource[applicationContext.xml]cannotbeopenedbecauseitdoesnotexisttarget目......
  • makeself
    makeselfmakeself,在Unix上制作可自提取的存档。网站:https://makeself.io/github地址:https://github.com/megastep/makeself下载安装:在github的release页面下载.......
  • ApplicationContext和BeanFactory
    ApplicationContext和BeanFactoryBeanFactoryBeanFactory是spring的IOC容器的核心,Spring使用BeanFactory来实例化、配置和管理Bean。常用的BeanFactory核心实现有:D......
  • webapi DbContext DbSet null 警告解决
    不需要去考虑表不存在情况,也就是不需要去判断_db.Customers是否为空。因为一般来说,数据库表肯定是有的。publicclassNullableReferenceTypesContext:DbContext{......
  • how golang build itself?
    howgolangbuilditself?https://www.reddit.com/r/golang/comments/vbibey/is_golang_compiler_open_source_from_noob/?sort=confidence"Thefirstgocompilerswer......
  • VideoMAE Masked Autoencoders are Data-Efficient Learners for Self-Supervised Vid
    0.前言相关资料:arxivgithub论文解读(知乎,CSDN)论文基本信息:领域:视频自监督表示学习发表时间:NeurIPS2022(2022.3.23)1.针对的问题视频存......
  • getServletContext爆红
    看下依赖删除<dependency><groupId>javax.servlet</groupId><artifactId>servlet-api</artifactId><version>2.5</ve......