何恺明MAE论文简解

时间：2024-01-30 19:12:01浏览次数：24

MAE这篇论文在2022年发表，当年比较火。

起因是nlp一直有非常棒的预训练模型，比如bert。那么cv能不能仿照一下也得到很棒的模型呢？

为此，研究开始了。

参考资料：https://zhuanlan.zhihu.com/p/439554945

模型的结构简单易懂，就是mask一些像素块，将没有mask的像素块作为encoder的输入，输出的特征再补充一些mask特征，作为解码器的输入，最后输出重构图像。这样模型就可以学到信息密度相当高的潜在表示，可以使用encoder作为特征提取层。

作者用了一个非对称结构，encoder的参数量远大于decoder，毕竟希望得到的是encoder，decoder只是附带品，这一点很好理解。

其次，又有人讨论，拿着会以往的进行遮挡的数据增广有什么区别呢？

从目的上来讲，遮挡数据增广也就是cutout，其实就是crop out的一种，是强行把一些像素失活，置为某个值，这样做的好处主要是防止过拟合。但也有一个坏处，就是生成的特征特别容易受到这些失活的像素干扰，训练效果反而很差。这个问题grid mask有讲过，详情可以看https://arxiv.org/abs/2001.04086

而MAE有没有将一些特征失活呢？至少在编码器阶段是没有的，这意味编码器生成的特征不会受到失活的像素干扰，还能生成一些密度相当高的潜在表示。但是仔细看解码器阶段，又把这些失活的特征补上了，所以解码器阶段是极有可能会受到失活像素干扰。

标签：简解,何恺明,失活,mask,encoder,解码器,MAE,像素
From： https://www.cnblogs.com/xmds/p/17997773

R-CNN作者Ross Girshick离职，何恺明、谢赛宁回归学界，Meta CV走出了多少大神
FAIR又一位大佬级研究科学家「出走了」，这次是R-CNN作者RossGirshick。近日，Meta首席科学家YannLeCun发推宣布，RossGirshick将离开FAIR，加入艾伦人工智能研究所（AI2）。此前离职的还有 ResNeXt一作谢赛宁（加入纽约大学任助理教授）、GeorgiaGkioxari（加入Caltech任助理教授）等......
python 基础极简解释
python基础局部与全局声明全局变量global数据存储列表变量=[数据1,数据2]变量[索引]基本：方法说明列表名.index(值)输入列表值取索引列表名[索引]=数据赋值lea(列表)统计元素列表.count(数据)统计数据出现的次数排序：方法说明列表......
何恺明新作：简单框架达成无条件图像生成新SOTA！与MIT合作完成
前言大佬何恺明和MIT师生一起开发了一个自条件图像生成框架，名叫RCG。这个框架结构非常简单但效果拔群，直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技......
DMAengine controller documentation 【ChatGPT】
https://www.kernel.org/doc/html/v6.6/driver-api/dmaengine/provider.html#dmaengine-controller-documentationDMA引擎控制器文档硬件介绍大多数从DMA控制器都具有相同的操作原则。它们具有一定数量的通道用于DMA传输，并具有一定数量的请求线。请求和通道基本上是正交的......
nacos简解
Nacos是什么DynamicNamingandConfigurationService一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台可以简化服务发现，配置管理，服务治理及管理。**Nacos=Eureka(服务注册中心)+Config(服务配置中心)+Bus(消息总栈)**基本原理作为注册中心分为se......
Soil Erosion Maesures
Soilerosionisaseriousenvironmentalissue.Stepsshouldbetakentocurbthisproblem.Followingaresomeofthemethodsofsoilerosionprevention: 1.IncreasevegetationcoverIncreasingvegetationcovercaneffectivelypreventsoilerosion,impro......
maestro studio 简化编写测试worflow 的工具
对于自己编写workflow有时可能会比较复杂，maestrostudio提供了基于ai的强大能力，同时可以实时模拟器的页面与web集成对于测试人员来说是一个很不错的选择，很值得看看，同时因为maestrostudio也是开源的，代码上也值得学习参考参考资料https://maestro.mobile.dev/getting-started......
maestro ios 简单试用
主要是体验下maestro的使用预备对于ios需要以来facebook的idb需要安装参考安装命令brewtapfacebook/fbbrewinstallfacebook/fb/idb-companion试用下载示例直接使用maestro自带的 maestrodownload-samples解压......
maestro 移动ui 自动化测试框架
maestro是一个移动ui自动化测试框架，基于yaml定义就可以快速的实现移动ui的测试，支持ios，android，reactnatice，fluttermaestro安装简单，就是一个二进制文件说明对于需要进行移动端自动化测试的团队maestro是一个很值得使用的工具参考资料https://github.com/mobile-dev-inc/ma......
GraphMAE阅读笔记
GraphMAE阅读引言在摘要里，本论文提出了自监督学习有着巨大的潜力自监督学习又分为对比学习和生成学习目前比较成功的是对比学习，因为在对比学习中，有高质量的数据增强以及可以通过额外的策略来稳定训练过程而对于生成式的自监督学习，它们旨在重建数据本身的特征和信息，对图来说，图......

何恺明MAE论文简解

相关文章

赞助商

阅读排行