论文推荐：使用带掩码的孪生网络进行自监督学习

时间：2022-08-26 11:14:17浏览次数：116

最近自我监督学习被重视起来。昨天我通过LinkedIn发现了这项工作，我觉得它很有趣。kaiming大神的MAE为ViT和自监督的预训练创造了一个新的方向，本篇文章将介绍Masked Siamese Networks (MSN)，这是另一种用于学习图像表示的自监督学习框架。MSN 将包含随机掩码的图像视图的表示与原始未遮蔽的图像的表示进行匹配。

考虑一个大的未标记图像集D = (x_i)和一个小的带注释图像集S = (x_si, y_i)，其中len(D) >> len(S)。这里，S中的图像可能与数据集D中的图像重叠。我们的训练目标是通过对D进行预训练来学习视觉表示，然后使用S将表示转移/微调到监督任务中。

Masked Siamese Networks

如果你对 ViT比较熟悉，下面要讨论的内容应该很熟悉。我们通过将每个视图转换为一系列不重叠的 NxN 块“Patchs”。然后论文作者介绍了通过一些随机的掩码来遮蔽图像并获得一个该图像的增强。在上图中可以看到两种策略，无论使用那种策略我们得到了分块（Patch）后的目标序列 x{+}_i 及其对应的掩码序列 x_i,m，其中后者会明显短于目标。

编码器 ViT 的目标是学习掩码的表示。最后通过[CLS] token 得到一个序列的表示。

作者引入了一个矩阵q，它由K (K>1)个可学习原型（prototypes）组成，每个原型的维数为d。首先，我们分别得到掩码序列(patchfied & mask)和目标序列(patchfied only)的表示，z_i,m和z_i。然后使用L2归一化该表示，相应的预测(p)通过测量原型矩阵q的余弦相似度来计算。Tau表示一个温度参数，在(0,1)之间。注意，作者在计算目标预测时使用了一个更大的温度值，这隐式地引导网络产生自信的低熵锚预测。

完整文章：

https://avoid.overfit.cn/post/52333da7b60b4d079d829a8435073f13

标签：表示,孪生,论文,学习,序列,监督,图像,掩码
From： https://www.cnblogs.com/deephub/p/16626894.html

论文阅读笔记-Gen-LaneNet: A Generalized and Scalable Approach for 3D Lane Detect
Gen-LaneNet:AGeneralizedandScalableApproachfor3DLaneDetectionGen-LaneNet：一种通用且可扩展的3D车道检测方法Abstract我们提出了一种通用且可扩展的方法，......
SMO论文中文翻译
SequentialMinimalOptimization:AFastAlgorithmforTrainingSupportVectorMachinesJohnC.PlattMicrosoftResearchjplatt@microsoft.comTechnicalReportM......
【论文阅读】Faster R-CNN: Towards Real-Time Object Detection with Region Proposa
原始题目：FasterR-CNN:TowardsReal-TimeObjectDetectionwithRegionProposalNetworks中文翻译：FasterR-CNN:使用区域建议网络实现实时目标检测发表时间：2015年6......
论文阅读笔记-3D-LaneNet: End-to-End 3D Multiple Lane Detection
3D-LaneNet:End-to-End3DMultipleLaneDetection3D-LaneNet：端到端3D多车道检测Abstract我们引入了一个网络，可以直接从单个图像预测道路场景中车道的3D布局。这......
北京数字孪生外包团队：数字孪生诱人的地方，是数字模型和物联网的结合！
数字孪生诱人的地方，是数字模型和物联网的结合，而这种结合的终目的是为了将模型打磨得更加接近真实系统。物联网技术为建模提供了一种新的强有力的手段，而且在对复杂系统机理......
知识蒸馏孪生网络联邦学习
......
论文阅读笔记-MapLite 2.0: Online HD Map Inference Using a Prior SD Map
MapLite2.0:OnlineHDMapInferenceUsingaPriorSDMapMapLite2.0：使用先前SD地图的在线高清地图推断Abstract部署全自动驾驶汽车一直是工业界和学术界深入研究的......
数字孪生可视化平台
随着社会经济水平的提高，智慧城市规模不断扩大，数字孪生可视化平台基建设施愈发完备。在向小康社会前进的路上，人们对幸福有更高的向往和需求。近年来，机动车拥有量迅速增加，旅......
数字孪生相关资料
https://cloud.tencent.com/developer/article/2035435http://www.jianelec.com/product/14-cn.html数字孪生：51World：https://www.51aes.com/优锘，图扑，木棉树，中服云，RayData(......
LaTex写英文论文时如何输入单引号
在LaTex写作时发现，输入单引号时并非直接用键盘上的引号键！单引号的正确输入：左引号：按一次`（即主键盘区左上角，Tab键上方的键）。右引号：按一次'（即分号右，回车左的键）。wro......

论文推荐：使用带掩码的孪生网络进行自监督学习

Masked Siamese Networks

相关文章

赞助商

阅读排行