首页 > 其他分享 >MaskGAE论文阅读笔记

MaskGAE论文阅读笔记

时间:2024-02-23 17:58:07浏览次数:38  
标签:掩蔽 论文 笔记 学习 MGM MaskGAE 掩码 mathcal mathrm

Abstract

我们提出了掩码图自动编码器,一个图结构数据的自监督学习框架,与以往的GAEs不同,MaskGAE采用了掩码图建模(MGM)作为一个代理任务,掩蔽部分边缘,并试图用部分可见的、未掩蔽的图结构来重建缺失的部分,为了理解MGM是否能帮助GAEs学习更好的表征,我们提供了理论和经验证据来证明这一借口任务的好处,从理论上讲,我们建立了GAEs与对比学习之间的联系,表明了MGM显著提高了GAEs的自监督学习方案

Introduction

开始介绍一些缺点:尽管图对比方法有效且普遍,但是自监督学习高度依赖于专门和复杂的代理任务,数据增强对于对比图的不同结构视图至关重要。
还有另一个突出的研究方向,试图通过生成的角度来学习表示,以图自动编码器作为典型的例子。图自动编码器是一组自监督的学习模型,它以图输入本身作为自监督,并学习重建图结构。与对比方法相比,GAE通常实现的非常简单,也容易与现有框架结合,因为它们自然地利用图重构作为辅助任务,而不需要对视图的生成进行扩充,但是遵循简单的图形重建原理的GAEs可能会过分强调接近信息,而这种信息并不总是有利于自监督学习,使它不太适用于链接预测意外的其他具有挑战性的任务,因此,有必要为GAEs设计更好的辅助任务。
目前的工作:
在这项工作中,我们试图通过引入掩码图建模作为图结构数据的原则性辅助任务,MGM背后的核心思想是删除图的一部分,并学习预测被删除的内容,比如边,根据这一理念,我们提出了掩码图自动编码器(MaskGAE),这是一个自监督的学习框架,利用通过节点和边重建掩码和预测的想法,我们的框架在理论上是通过明确地将GAEs与对比学习联系起来,并展示了MGM在改进自监督学习方案方面的好处。具体地说,我们揭示了GAEs的学习目标等价于对比学习,其中成对的子图自然地形成两个结构视图来进行对比。最重要的是,在边上进行掩码可以减少GAE中两个对比子图视图的冗余,从而有利于对比学习
本文的主要贡献如下:

  • MaskGAE,一个简单而有效的图形自监督学习框架
  • 对提出的框架进行了全面的理论分析,并对GAE的辅助训练任务(即MGM)的设计进行了指导。
  • 一种新的结构化掩蔽策略,以促进MGM任务,其中相邻区域的边被掩盖在一起。

Problem Formulation

多数图自监督学习策略是学习一个图编码器,将图映射到低维的隐空间单元\(Z=\{z_{i}\}_{i=1}^{|\mathcal{V}|}\),这样\(f_\theta(\mathcal{G})=\mathbb{Z}\in\mathbb{R}^{|\mathcal{V}|\times d_h}\)就能很好的表示图中的每一个节点

Method

MaskGAE是一个由其非对称设计定制的简单框架,其中编码器将部分观察到的图映射到潜在表示,然后由两个解码器根据边缘和节点级别重建掩码结构的信息。我们的经验表明,这种非对称的编解码器结构有助于GAE容易地学习一般化和可转移的表示。接下来,我们将从掩蔽策略、编码器、解码器和学习目标四个方面详细介绍所提出的MaskGAE框架。
MaskMAE的整体框架如下:
pFUmEDI.png

掩码策略

如果我们掩码了边的一定部分,就可以显著地减少两个成对子图的冗余度,从而避免了一个平凡的重叠的子图。此外,对于节点分类等下游任务,边缘级信息通常是冗余的。

边随机掩码

形成掩蔽图的一个简单而直接的方法是采样特定分布的边子集采样,例如伯努利分布,我们将边缘随机掩蔽表示为\(\mathcal{T}_\mathrm{edge}\),于是有\(\mathcal{G}_\mathrm{mask}=\mathcal{T}_\mathrm{edge}(\mathcal{G})\)

路径随机掩码

提出了一种新的结构掩蔽策略,在采样过程中以路径作为基本处理单元。通俗地说,图中的路径是连接相邻节点序列的边序列。与简单的边缘级掩蔽相比,路径级掩蔽会破坏节点之间的短接连接,模型必须在其他地方寻找证据,以适应被屏蔽的结构。因此,它可以更好地利用结构依赖模式,并为更有意义的MGM任务捕获高阶接近性。对于路径掩蔽,我们对一组掩蔽边缘进行如下采样:
\(\mathcal{E}_{\mathrm{mask}}\sim\mathrm{Random}\mathrm{Walk}(\mathcal{R},\mathcal{l}_{\mathrm{walk}})\)
R是一组开始随机游走的根节点,\(l_{walk}\)是游走长度。
与前期工作的关系。MaskGAE和一些现有的对比方法都对图应用掩蔽。这些对比方法使用边掩蔽作为增强来生成不同的结构视图进行对比,而MaskGAE使用边掩蔽来构建有意义的监督信号,并减少成对子图视图之间的冗余,从而促进自监督学习方案

编码器

在这项工作中,我们的编码器是图卷积网络(GCN),与传统的GAE不同,我们的编码器在训练过程中只需要处理一小部分边,因为它只应用于一个可见的、未掩蔽的子图。这为设计一个高效和强大的编码器提供了一个机会,同时减轻了对大型GNN进行预训练的可伸缩性问题。

解码器

结构解码器

该结构解码器是gae的一个基本设计,它通过将成对的节点表示聚合为链接表示来解码图。设计这种解码器的方法有几种,可以使用内积或神经网络进行解码。我们将参数为

标签:掩蔽,论文,笔记,学习,MGM,MaskGAE,掩码,mathcal,mathrm
From: https://www.cnblogs.com/anewpro-techshare/p/18030088

相关文章

  • 《程序是怎么跑起来的》第5章读书笔记
    第4张介绍了内存那么第5张就是磁盘。在开篇告诉了我们内存只主存而磁盘主要指硬盘。计算机中的储存器包括内存和磁盘储存在磁盘中的程序需要先加载到内存才能运行,不能在磁盘上直接运行。内存与磁盘的联系是非常密切的。第1个体现是磁盘缓存。磁盘缓存是一块内存空间,用于临时存放从......
  • Vue学习笔记13--插值语法 + method
    插值语法示例:插值语法--实现信息拼接<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0"><title>插值语法--实现信息......
  • 《程序是怎么跑起来的》第4章读书笔记
    计算机是处理数据的机器,而处理对象的数据储存在内存和磁盘中。内存本质上是一种名为内存芯片的装置,内存芯片分为ram,rom等不同类型,但从外部来看,它们的基本原理是相同的内存芯片外部有引脚负责连接电源以及输入地址信号等等。内存芯片内部有很多能储存巴比特数据的容器,只要指定容器......
  • 《程序是怎么跑起来的》第3章读书笔记
    经过前两章对计算机内容最基本的理解之后,就迎来了对计算机的计算,而计算机也不是万能的,它也会出现错误,那么就涉及到计算机在计算小数时会出现错误的原因,首先课题通过一个问题将0.1累加100次的结果不是10这一话题成功将读者引入进去。然后告诉了我们为什么在计算机中会这样子出错的......
  • (笔记)Linux基础知识点总结
     一、从认识操作系统开始 1、操作系统简单分类Windows​目前最流行的个人桌面操作系统,不做多的介绍,大家都清楚。界面简单易操作,软件生态非常好。Unix​最早的多用户、多任务操作系统。后面崛起的Linux在很多方面都参考了Unix。目前这款操作系统已......
  • 数学笔记(1)-勾股定理与勾股数
    勾股定理,是一个基本的几何定理,指直角三角形的两条直角边的平方和等于斜边的平方。中国古代称直角三角形为勾股形,并且直角边中较小者为勾,另一长直角边为股,斜边为弦,所以称这个定理为勾股定理,也有人称商高定理。勾股定理现约有500种证明方法,是数学定理中证明方法最多的定理之一。勾......
  • BSGS学习笔记
    1.求解问题1.1.高次同余方程给定\(a,b,p\),\(a,p\)互质,求满足\(a^x\equivb(\bmod\p)\)的解\(x\)2.解法由扩展欧拉定理\(a^p\equiva^{x\mod\\varphi(p)}\(\bmod\p)\)得\(a^x\)模\(p\)意义下的最小循环节为\(\varphi(p)\)\(\because\\varphi(p)<p\)......
  • 概率学习笔记
    一些定义随机事件:某些现象,在个别试验中,其结果呈不确定性,但在大量重复试验中其结果又具有统计规律性。随机试验:可以在相同的条件下重复进行每次试验的可能结果可以不止一个,并且能事先明确试验的所有可能结果进行一次试验之前不能确定哪个结果会出现样本空间:某个随机试验的......
  • 操作系统复试笔记
    第三章进程管理进程间直接通信方式:管道、共享内存进程间间接通信方式:消息队列、文件、信箱、信号量公用队列属于临界资源CPU繁忙型作业类似于长作业,需要耗费大量处理机时间,故先到先服务算法有利于CPU繁忙型作业;IO繁忙型作业类似于短作业,需要频繁请求IO操作而被阻塞,占用CPU的......
  • 读论文-基于序列模式的电子商务推荐系统综述(A Survey of Sequential Pattern Based E
    前言今天读的论文为一篇于2023年10月3日发表在《算法》(Algorithms)的论文,这篇文章综述了基于序列模式的电子商务推荐系统,强调了通过整合用户购买和点击行为的序列模式来提高推荐准确性、减少数据稀疏性、增加推荐新颖性,并改善推荐系统的可扩展性。文章详细分析了现有推荐系统的......