Contrastive Learning 对比学习 | 何恺明大神的 SimSiam

时间：2024-03-07 20:44:05浏览次数：32

标签：SimSiam 何恺明知乎 Contrastive Learning x2 z1 z2

论文题目：Exploring Simple Siamese Representation Learning，CVPR 2021。
pdf：https://arxiv.org/abs/2011.10566
相关博客：
- 知乎 | 无门槛级讲解对比学习中的自监督模型 Simsiam （通俗易懂）
- 知乎 | 对比学习（Contrastive Learning）：研究进展精要（解释了为什么 Simsiam 会演变成这样）
- 知乎 | SimSiam：孪生网络表征学习的顶级理论解释（解释 Simsiam 的 stop-gradient 与 EM / k-means 算法的联系）
- 知乎 | SimSiam 论文阅读
- 简书 | SimSiam 论文简析——笔记

算法思想

输入 x, x1, x2，其中 x 代表数据集中的一张图片，x1, x2 是数据增强（data augmentations）得到的两张图片。注意，原图片并不作为输入。
接下来，x1, x2 通过 同一个 编码器（encoder）编码，得到两个表征向量 z1=f(x1), z2=f(x2)。这个编码器一般使用经典卷积神经网络 ResNet。这一步的目的就是通过卷积神经网络提取特征，得到感受野大、维度较小的向量。
然后，我们将 z1 经过一个 MLP 映射得到 p1=h(z1) ，最大化 p1, z2 的 cosine similarity，作为目标函数去学习。其实，我们的目标函数是一个对称的（symmetric）函数，也就是不仅要算 p1, z2 的相似度，还要计算 p2=h(z2), z1 的相似度。

主要技术

collapsing：
- 既然 loss function 只想让所有相似图片彼此接近，那么就把所有人映射到一起好了（）
- 解决方案：设计不对称的 branch、训练负样本彼此远离、stop-gradient 等。
stop-gradient：
神秘的 MLP 层 h ：
- 作者发现，如果不添加 h，性能很差；如果 h 的参数无法学习，模型难以收敛。这个 MLP 层实际上是在 预测数据增强分布上的数学期望，从而试图矫正由数据增强带来的随机性而导致的误差。

标签：SimSiam,何恺明,知乎,Contrastive,Learning,x2,z1,z2
From： https://www.cnblogs.com/moonout/p/18059713

Graph Contrastive Learning with Adaptive Augmentation 论文阅读笔记
Abstract 尽管图CL方法得到了繁荣的发展，但图增强方案的设计——CL中的一个关键组成部分——仍然很少被探索。我们认为，数据增强方案应该保留图的内在结构和属性，这将迫使模型学习对不重要的节点和边缘的扰动不敏感的表示。然而，现有的方法大多采用统一的数据增强方案，如统一丢弃边......
何恺明MAE论文简解
MAE这篇论文在2022年发表，当年比较火。起因是nlp一直有非常棒的预训练模型，比如bert。那么cv能不能仿照一下也得到很棒的模型呢？为此，研究开始了。参考资料：https://zhuanlan.zhihu.com/p/439554945 模型的结构简单易懂，就是mask一些像素块，将没有mask的像素块作为encoder的输入......
AdaMCL: Adaptive Fusion Multi-View Contrastive Learning for Collaborative Filter
AdaMCL:AdaptiveFusionMulti-ViewContrastiveLearningforCollaborativeFilteringAbstract 大多数基于CL的方法只利用原始的用户-项目交互图来构造CL任务，缺乏对高阶信息的显示利用。而且即使是使用高阶信息的基于CL的方法，高阶信息的接收字段也是固定的，没有考虑到节点之......
[论文于都] SelfReg: Self-supervised Contrastive Regularization for Domain Genera
SelfReg:Self-supervisedContrastiveRegularizationforDomainGeneralization采用了自监督对比学习的方法，提出了IndividualizedIn-batchDissimilarityLoss和HeterogeneousIn-batchDissimilarityLoss。IndividualizedIn-batchDissimilarityLoss关注于在训练过程......
R-CNN作者Ross Girshick离职，何恺明、谢赛宁回归学界，Meta CV走出了多少大神
FAIR又一位大佬级研究科学家「出走了」，这次是R-CNN作者RossGirshick。近日，Meta首席科学家YannLeCun发推宣布，RossGirshick将离开FAIR，加入艾伦人工智能研究所（AI2）。此前离职的还有 ResNeXt一作谢赛宁（加入纽约大学任助理教授）、GeorgiaGkioxari（加入Caltech任助理教授）等......
LightGCL Simple Yet Effective Graph Contrastive Learning For Recommendation论文
Abstract目前的图对比学习方法都存在一些问题，它们要么对用户-项目交互图执行随机增强，要么依赖于基于启发式的增强技术（例如用户聚类）来生成对比视图。这些方法都不能很好的保留内在的语义结构，而且很容易受到噪声扰动的影响。所以我们提出了一个图对比学习范式LightGCL来减轻基于CL......
何恺明新作：简单框架达成无条件图像生成新SOTA！与MIT合作完成
前言大佬何恺明和MIT师生一起开发了一个自条件图像生成框架，名叫RCG。这个框架结构非常简单但效果拔群，直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技......
Adaptive Graph Contrastive Learning for Recommendation论文阅读笔记
Abstract在实际的场景中，用户的行为数据往往是有噪声的，并且表现出偏态分布。所以需要利用自监督学习来改善用户表示。我们提出了一种新的自适应图对比学习(AdaGCL)框架，该框架使用两个自适应对比视图生成器来进行数据增强，以更好地增强CF范式。具体的说，我们使用了两个可训练的视图生......
Generative-Contrastive Graph Learning for Recommendation论文阅读笔记
Abstract首先介绍了一下GCL的一些缺点，GCL是通过数据增强来构造对比视图，然后通过最大化对比视图之间的互信息来提供自监督信号。但是目前的数据增强技术都有着一定的缺点结构增强随机退出节点或边，容易破坏用户项目的内在本质特征增强对每个节点施加相同的尺度噪声增强，忽略的节......
【略读论文|时序知识图谱补全】Temporal Knowledge Graph Reasoning with Historical
会议：AAAI，时间：2023，学校：上海交通大学摘要：大多数时序知识图谱的推理方法高度依赖于事件的递归或周期性，这给推断与缺乏历史交互的实体相关的未来事件带来了挑战。本文提出一种新的基于历史对比学习训练框架的对比事件网络（CENET）的新事件预测模型。1.CENET学习历史和非历史依赖来区......

Contrastive Learning 对比学习 | 何恺明大神的 SimSiam

算法思想

主要技术

相关文章

赞助商

阅读排行