首页 > 其他分享 >SimGRACE论文阅读笔记

SimGRACE论文阅读笔记

时间:2024-03-06 15:36:59浏览次数:30  
标签:prime 编码器 论文 GCL 笔记 SimGRACE theta 扰动

Abstract

​ 图对比学习(GCL)已经成为图表示学习的一种主导技术,它最大限度地提高了共享相同语义的成对图增强之间的互信息。不幸的是,由于图数据的多样性,在扩充过程中很难很好地保存语义。目前,GCL的数据扩充大致可分为三种不令人满意的方式。第一,可以通过试错法手动选择每个数据集的增强量。第二,可以通过繁琐的搜索来选择增强功能。第三,这些增强可以以昂贵的领域知识作为指导来获得。所有这些都限制了现有的GCL方法的效率和更普遍的适用性。为了规避这些关键问题,我们提出了一个简单的图对比学习框架,称为SimGRACE,它不需要数据扩充。具体来说,我们将原始图作为输入,以其扰动版本的GNN模型作为两个编码器,得到两个相关的视图进行对比。SimGRACE的灵感来自于这样一种观察,即图数据可以在编码器扰动时很好地保持语义,而不需要手动试验、繁琐的搜索或昂贵的领域知识来增强选择。此外,我们设计了对抗性训练方案,称为AT-SimGRACE,以增强图对比学习的鲁棒性。

Introduction

​ GraphCL 首先为GCL设计了四种类型的通用增强器(节点删除、边缘扰动、属性掩蔽和子图)。然而,这些增强并不适用于所有的场景,因为图的结构信息和语义在不同的域中存在显著差异。例如,GraphCL 发现,边缘扰动有利于社会网络,但损害了GCL中的一些生化分子。更糟糕的是,即使扰动很弱,这些增强也可能会完全改变图的语义。例如,在苯环中滴下一个碳原子会改变芳香体系,形成一个烯烃链,这将极大地改变分子性质。

​ 一个自然的问题出现了:我们能否将图形对比学习从繁琐的手工试验、繁琐的搜索或昂贵的领域知识中解放出来?为了回答这个问题,我们没有为GCL设计更先进的数据增强策略,而是尝试突破最先进的GCL框架,该框架以语义保留的数据增强作为先决条件。更具体地说,我们将原始图数据作为输入,将其扰动版本的GNN模型作为两个编码器,得到两个相关的视图。然后,我们最大化这两种观点的一致。以编码器扰动为噪声,我们可以得到两种不同的嵌入,对于相同的输入作为“正对”。与之前的工作类似,我们将同一小批处理中的其他图形数据作为“负对”。

​ 本文的贡献如下:

  • 重要性:我们将图对比学习从繁琐的手工试验、繁琐的搜索或昂贵的领域知识中解放出来,这些限制了现有GCL方法的效率和更普遍的适用性
  • 框架:我们开发了一个新颖而有效的框架,SimGRACE,用于图形对比学习,它具有前所未有的灵活性、高效率和易用性。
  • 算法:我们提出了一种新的算法AT-SimGRACE来增强图对比学习的鲁棒性。ATSimGRACE可以在引入较小的计算开销的同时实现更好的鲁棒性。

Method

模型的结构图如下:

pF0Kxeg.png

SimGRACE

​ 本节中,我们将详细介绍SimGRACE框架,该框架由以下三部分组成

编码器扰动

​ 一个GNN编码器和其扰动版本首先为同一个图提取两个图级表示,可以表示为\(\mathbf{h}=f(\boldsymbol{G};\boldsymbol{\theta}),\mathbf{h}^{\prime}=f(\boldsymbol{G};\boldsymbol{\theta}^{\prime}).\)我们提出的扰动编码器f(·;θ)的方法可以在数学上描述为:\(\theta_l^{\prime}=\theta_l+\eta\cdot\Delta\theta_l;\quad\Delta\theta_l\sim\mathcal{N}\left(0,\sigma_l^2\right)\)

投影头

一个名为投影头的非线性变换g(·)将表示形式映射到另一个潜在空间可以提高性能。在我们的SimGRACE框架中,我们还采用了一个两层感知器(MLP)来获得z和z‘:

\(z=g(\mathbf{h}),z^{\prime}=g(\mathbf{h}^{\prime}).\)

对比学习

​ 在SimGRACE框架中,我们利用归一化温度尺度的交叉熵损失作为之前的工作来加强正对z和z‘与负对之间的一致性。在SimGRACE训练过程中,随机抽取N个图,然后将它们输入GNN编码器及其扰动版本,每个图有两个表示,总共有2N个表示。负对是由相同的小批处理中的其他N−1个扰动表示生成的。将余弦相似度函数表示两个表示之间的相似性:

\(\ell_n=-\log\frac{\exp\left(\sin\left(z_n,z_n^{\prime}\right)\right)/\tau)}{\sum_{n^{\prime}=1,n^{\prime}\neq n}^N\exp\left(\sin\left(z_n,z_{n^{\prime}}\right)/\tau\right)},\)

标签:prime,编码器,论文,GCL,笔记,SimGRACE,theta,扰动
From: https://www.cnblogs.com/anewpro-techshare/p/18056721

相关文章

  • 论文阅读1--llm对于因果方向的影响
    论文1:CausalReasoningandLargeLanguageModels:  OpeningaNewFrontierforCausality文章根据LLM在因果发现、反事实推理和实际因果关系方面的评估结果表明,它们可以取得很好的效果,这是通过大量的文本训练模仿该领域知识模式的结果。虽然它也会产生错误,但是错误的次数极少......
  • pandas笔记(一)-- 大的国家(逻辑索引、切片)
    题目描述如果一个国家满足下述两个条件之一,则认为该国是大国:面积至少为300万平方公里人口至少为2500万编写解决方案找出大国的国家名称、人口和面积按任意顺序返回结果表,如下例所示测试用例输入:namecontinentareapopulationgdpAfghanistanAsia65223......
  • Java学习笔记——第七天
    面向对象编程(ObjectOrientedProgramming,OOP)基础面向过程编程开发一个一个的方法,有数据要处理了,我们就调方法来处理。此时程序类似于流水线,按照代码自上而下依次运行。面向对象编程开发一个一个的对象来处理数据,把数据交给对象,再调用对象的方法来完成对数据的处理。程序在对......
  • Rust笔记(上)
    Rust笔记(上)目录Rust笔记(上)关于为什么最终还是选择了Rust作为主力语言基本数据类型所有权与移动所有权移动注意Rc与Arc:共享所有权引用共享引用可变引用生命周期省略生命周期表达式块与分号声明if与matchiflet循环break错误处理panicResult自定义错误类型结构体泛型结构体结构体自......
  • 复试计网笔记
    第1章1.1计算机网络概述从组成部分上划分计算机网络主要由硬件、软件、协议三大部分组成,协议是核心。从工作方式上划分计算机网络可分为边缘部分和核心部分。边缘部分由用户主机组成,用来进行通信和资源共享。核心部分由大量网络和连接网络的路由器组成,为边缘部分提供连通......
  • 读算法的陷阱:超级平台、算法垄断与场景欺骗笔记01_比价
    1.      科技正在改善我们的生活1.1.        从表象看,网络世界为我们带来了诸多便利1.1.1.          比价网站的创建、各式各样的电商促销、数不尽的手机应用程序的确降低了商品的售价,提升了产品的品质,丰富了消费者的选择1.2.        ......
  • NGUI学习笔记3.5
    ScrollView练习使用场景搭建:直接在NGUI中新建ScrollView组件(与Button等其它依赖基本组件存在的组件不同,此组件是单独存在的组件)新建sprite作为其子组件,注意!子组件上需要挂在Collider和DragScrollView脚本,才可以实现鼠标拖拽查看功能ScrollView组件的参数意义:添加Scroll......
  • 论文记录
    acl论文汇总原文链接:https://blog.csdn.net/weixin_52171642/article/details/131763613顺序摘要结论导言相关工作模型实验评论ACL  WhenNottoTrustLanguageModels:InvestigatingEffectivenessofParametricandNon-ParametricMemories 自适应选择少见实体......
  • 学习笔记:CL4ST
    Spatio-TemporalMetaContrastiveLearning时空元对比学习CIKM2023作者:JiabinTang,LianghaoXia,JieHu,ChaoHuang论文地址:https://dl.acm.org/doi/10.1145/3583780.3615065代码地址:https://github.com/HKUDS/CL4ST总结是一篇使用了对比学习的模型,其中”可学习的视......
  • 树链剖分笔记
    树链剖分+线段树代码量通常在3K左右,出错的地方非常多,为了好好练手,特建立该题单,建议不要进行复制每一题都老老实实重打题单博客题单Orz1.区间加,区间修改,区间最大值#include<bits/stdc++.h>usingnamespacestd;constintMX=1e5+10;intn,m,r,p;intinput[MX]={0};intsiz[......