Contrastive Learning Is Spectral Clustering On Similarity Graph

时间：2024-10-13 17:15:50浏览次数：7

标签：Spectral Clustering frac Similarity text sum ij mathcal sim

概
主要内容
原文代码

Tan Z., Zhang Y., Yang J. and Yuan Y. Contrastive learning is spectral clustering on similarity graph. ICLR, 2024.

概

本文将对比学习与谱聚类联系在一起.

主要内容

我们知道, 一般的对比学习形如:

\[\min_{\theta} \quad \mathbb{E}_{x, x^+, \{x_k^-\}_{k=1}^K} -\log \frac{ \exp(\text{sim}(f(x; \theta), f(x^+; \theta))) }{ \sum_{k=1}^K \exp(\text{sim}(f(x; \theta), f(x_k^-; \theta))) }, \]
其中 $\text{sim}(\cdot, \cdot)$ 是相似度函数, 比如标准的 InfoNCE 采取的是

\[\text{sim}(x, y) = \frac{1}{\tau} \cdot \frac{x^T y}{\|x\|_2 \|y\|_2}. \]
这里 $\tau > 0$ 为 temperature.
现在, 令 $z = f(x)$ 为隐变量, 然后让我们简单地关注如下问题:

\[\min_{Z} \quad \mathcal{L} = \mathbb{E}_{z, z^+, \{z_k^-\}_{k=1}^K} -\log \frac{ \exp(\text{sim}(z, z^+)) }{ \sum_{k=1}^K \exp(\text{sim}(z, z^-)) }, \]
首先, 进行一些简化:

\[\begin{array}{ll} \mathcal{L} &= \underbrace{\mathbb{E}_{z, z^+, \{z_k^-\}_{k=1}^K} -\log \frac{ \exp(\text{sim}(z, z^+)) }{ \sum_{k=1}^K \exp(\text{sim}(z, z^-)) }}_{\mathcal{L}_{main}} \\ &= \mathbb{E}_{z, z^+} \Big[-\text{sim}(z, z^+) \Big] +\mathcal{L_R}. \end{array} \]
其中 $\mathcal{L_R}$ 是一正则化项.
进一步地, 假设 $\mathbb{E}_{z, z^+}$ 所服从的分布为 $P \in [0, 1]^{N \times N}$, 满足 $\sum_{ij} P_{ij} = 1$, 则

\[\mathcal{L}_{main} = -\sum_{ij} P_{ij} \text{sim}(z_i, z_j). \]
在特殊情况下, 如

\[\text{sim}(z_i, z_j) = -\|z_i - z_j\|_2^2, \]
我们有

\[\mathcal{L}_{main} =-\sum_{ij} P_{ij} \text{sim}(z_i, z_j) =\sum_{ij} P_{ij} \|z_i - z_j\|_2^2 = \text{Tr}(Z^T L Z), \]
其中 $L = \text{diag}(\mathbf{1}^T P) - P$ 为 $P$ 的 Laplacian 矩阵.
换言之, $\mathcal{L}$ 在这种情况下相当于是一个谱聚类的效果.
进一步地, 作者从谱聚类的角度解释了为什么 InfoNCE 是这个样子的 (请会看原文, 很有意思).
于是本文设计了 kernel-InfoNCE 损失:

\[\text{sim}(x, y; \gamma, \tau) = - \frac{\|x - y\|^{\gamma}}{\tau}. \]

原文代码

[official-code]

标签：Spectral,Clustering,frac,Similarity,text,sum,ij,mathcal,sim
From： https://www.cnblogs.com/MTandHJ/p/18462568

《Represent, Compare, and Learn: A Similarity-Aware Framework for Class-Agnostic
摘要论文提出了一个用于类别无关计数（Class-AgnosticCounting,CAC）的相似性感知框架。类别无关计数的目标是在给定少量示例的情况下，对查询图像中的所有实例进行计数。该框架通过联合学习表示和相似性度量来改进计数性能。作者首先提出了一个基础的双线性匹配网络（BilinearMatc......
基于Python的机器学习系列（19）：K均值聚类（K-Means Clustering）
简介 K均值聚类（K-MeansClustering）是一种常用的无监督学习算法，用于将数据样本划分为若干个“簇”，使得同一簇内的数据点彼此相似，而不同簇的数据点之间差异较大。由于K均值不依赖于标签，因此它是一种无监督学习方法。常见的应用包括客户细分、图像分割和数据可视......
Python之层次聚类/系统聚类（Hierarchical Clustering）、变量聚类
1.层次聚类简介别称：系统聚类英文名：HierarchicalClustering基本原理：假设数据类别之间存在层次结构，通过对数据集在不同层次的划分，构造出树状结构的聚类结果实现方法：聚合方法、分裂方法实现方法方向步骤描述经典算法聚合方法自底向上首先，每个样本自成一簇；然后，开始迭代，每......
题解：P10781 【MX-J1-T1】『FLA - III』Spectral
Ｐ10781【MX-J1-T1】『FLA-III』Spectral题解(非正解，正解应该是数学题。）这道题很简单，分析题意就可以得出核心代码：for(inti=1;i<=n;i++){ans=k+ans/i;}那么恭喜你获得$40$pts。为什么呢？因为题目需要的是最高温度，而烧碳获得的温度可能小于烧炭时减低的温度。简单说......
Towards Practical Binary Code Similarity Detection: Vulnerability Verification v
"迈向实用的二进制代码相似性检测：通过补丁语义分析进行漏洞验证"0x0Abstruct二进制代码相似性检测方法可以有效地搜索二进制软件中代码共享引入的重复出现的漏洞（1day）。然而，这些方法存在较高的误报率（FPR），因为它们通常将修补的函数视为易受攻击的函数，并且当使用不同的编译设置编译......
二十二、【机器学习】【非监督学习】- OPTICS (Ordering Points To Identify the Clus
系列文章目录第一章【机器学习】初识机器学习第二章【机器学习】【监督学习】-逻辑回归算法(LogisticRegression)第三章【机器学习】【监督学习】-支持向量机(SVM)第四章【机器学习】【监督学习】-K-近邻算法(K-NN)第五章【机器学习】【监督学习】-决策树(De......
SpectraLayers Pro11最新版，win& mac，绝对可用
SteinbergSpectraLayersPro11v11.0.10for Windows&Mac一。SpectraLayers 领先的音频编辑和光谱修复智能解决方案，提供行业领先的人工智能算法，丰富的工具和功能，灵活的选项，在熟悉且友好的工作环境中自由探索处理和增强您的音乐，获得全新的结果，提高质量，是光......
鲁棒核稀疏子空间聚类模型（Robust Kernel Sparse Subspace Clustering, RKSSC）
鲁棒核稀疏子空间聚类模型（RobustKernelSparseSubspaceClustering,RKSSC）引言鲁棒核稀疏子空间聚类模型（RKSSC）是一种用于处理高维数据的聚类技术，特别设计用于对抗数据中的噪声和异常值。该模型结合了稀疏表示、核方法和鲁棒优化策略，以在非线性子空间中寻找数据点的稀疏......
SciTech-Mathematics-Probability+Statistics-Dot products, cosine similarity, text
Dotproducts,cosinesimilarity,textvectorshttps://dev.to/sayemmh/dot-products-cosine-similarity-text-vectors-2lo4SayemHoque,PostedonOct20,2022Dotproducts,cosinesimilarity,textvectorsCosinesimilarityisameasurebetweentwosingledimen......
题解：P10781 【MX-J1-T1】『FLA - III』Spectral
本题的主要思路就是数学。首先，让我们先来打一个表。$i$$1$$2$$3$$4$$\dots$$T_{i}$$k$$1.5k$$1.5k$$1.375k$$\dots$易用肉眼看见，自$T_{3}$之后数越来越小，于是我们大胆猜测，若$n\ne1$，则它的最大值是$1.5k$否则$k$。......

Contrastive Learning Is Spectral Clustering On Similarity Graph

概

主要内容

原文代码

相关文章

赞助商

阅读排行