SimGRACE论文阅读笔记

标签：prime 编码器论文 GCL 笔记 SimGRACE theta 扰动

Abstract

图对比学习（GCL）已经成为图表示学习的一种主导技术，它最大限度地提高了共享相同语义的成对图增强之间的互信息。不幸的是，由于图数据的多样性，在扩充过程中很难很好地保存语义。目前，GCL的数据扩充大致可分为三种不令人满意的方式。第一，可以通过试错法手动选择每个数据集的增强量。第二，可以通过繁琐的搜索来选择增强功能。第三，这些增强可以以昂贵的领域知识作为指导来获得。所有这些都限制了现有的GCL方法的效率和更普遍的适用性。为了规避这些关键问题，我们提出了一个简单的图对比学习框架，称为SimGRACE，它不需要数据扩充。具体来说，我们将原始图作为输入，以其扰动版本的GNN模型作为两个编码器，得到两个相关的视图进行对比。SimGRACE的灵感来自于这样一种观察，即图数据可以在编码器扰动时很好地保持语义，而不需要手动试验、繁琐的搜索或昂贵的领域知识来增强选择。此外，我们设计了对抗性训练方案，称为AT-SimGRACE，以增强图对比学习的鲁棒性。

Introduction

GraphCL 首先为GCL设计了四种类型的通用增强器（节点删除、边缘扰动、属性掩蔽和子图）。然而，这些增强并不适用于所有的场景，因为图的结构信息和语义在不同的域中存在显著差异。例如，GraphCL 发现，边缘扰动有利于社会网络，但损害了GCL中的一些生化分子。更糟糕的是，即使扰动很弱，这些增强也可能会完全改变图的语义。例如，在苯环中滴下一个碳原子会改变芳香体系，形成一个烯烃链，这将极大地改变分子性质。

一个自然的问题出现了：我们能否将图形对比学习从繁琐的手工试验、繁琐的搜索或昂贵的领域知识中解放出来？为了回答这个问题，我们没有为GCL设计更先进的数据增强策略，而是尝试突破最先进的GCL框架，该框架以语义保留的数据增强作为先决条件。更具体地说，我们将原始图数据作为输入，将其扰动版本的GNN模型作为两个编码器，得到两个相关的视图。然后，我们最大化这两种观点的一致。以编码器扰动为噪声，我们可以得到两种不同的嵌入，对于相同的输入作为“正对”。与之前的工作类似，我们将同一小批处理中的其他图形数据作为“负对”。

本文的贡献如下：

重要性：我们将图对比学习从繁琐的手工试验、繁琐的搜索或昂贵的领域知识中解放出来，这些限制了现有GCL方法的效率和更普遍的适用性
框架：我们开发了一个新颖而有效的框架，SimGRACE，用于图形对比学习，它具有前所未有的灵活性、高效率和易用性。
算法：我们提出了一种新的算法AT-SimGRACE来增强图对比学习的鲁棒性。ATSimGRACE可以在引入较小的计算开销的同时实现更好的鲁棒性。

Method

模型的结构图如下：

SimGRACE

本节中，我们将详细介绍SimGRACE框架，该框架由以下三部分组成

编码器扰动

一个GNN编码器和其扰动版本首先为同一个图提取两个图级表示，可以表示为\(\mathbf{h}=f(\boldsymbol{G};\boldsymbol{\theta}),\mathbf{h}^{\prime}=f(\boldsymbol{G};\boldsymbol{\theta}^{\prime}).\)我们提出的扰动编码器f（·；θ）的方法可以在数学上描述为：\(\theta_l^{\prime}=\theta_l+\eta\cdot\Delta\theta_l;\quad\Delta\theta_l\sim\mathcal{N}\left(0,\sigma_l^2\right)\)

投影头

一个名为投影头的非线性变换g（·）将表示形式映射到另一个潜在空间可以提高性能。在我们的SimGRACE框架中，我们还采用了一个两层感知器（MLP）来获得z和z‘：

\(z=g(\mathbf{h}),z^{\prime}=g(\mathbf{h}^{\prime}).\)

对比学习

在SimGRACE框架中，我们利用归一化温度尺度的交叉熵损失作为之前的工作来加强正对z和z‘与负对之间的一致性。在SimGRACE训练过程中，随机抽取N个图，然后将它们输入GNN编码器及其扰动版本，每个图有两个表示，总共有2N个表示。负对是由相同的小批处理中的其他N−1个扰动表示生成的。将余弦相似度函数表示两个表示之间的相似性:

\(\ell_n=-\log\frac{\exp\left(\sin\left(z_n,z_n^{\prime}\right)\right)/\tau)}{\sum_{n^{\prime}=1,n^{\prime}\neq n}^N\exp\left(\sin\left(z_n,z_{n^{\prime}}\right)/\tau\right)},\)

标签：prime,编码器,论文,GCL,笔记,SimGRACE,theta,扰动
From： https://www.cnblogs.com/anewpro-techshare/p/18056721