GraphMAE2论文阅读笔记

时间：2024-02-23 23:44:55浏览次数：35

Abstract

第一篇论文GraphMAE的想法是用自动编码器体系结构来重建被输入随机屏蔽的节点特征。但是掩蔽特征重构的性能依赖输入特征的可辩别性，容易受到特征的干扰。所以提出了一个掩蔽的自监督学习框架GraphMAE2，目的是克服这个问题，思想是对图自监督学习的特征重构进行正则化处理。具体的说，我们设计了多视图随机重掩码解码和潜在表示预测的策略来规范特征重构。多视图随机掩码是在特征空间的重构中引入随机性，而隐空间表示预测是在嵌入空间中强制重构。

Introduction

GraphMAE的主要思想是利用自动编码体系结构重构在编码前随机掩码的输入节点特征。它的技术贡献在于 1)掩码特征重构 2)固定的重掩码解码，其中先前掩码节点的编码嵌入在输入解码器之前再次被掩码。
尽管GraphMAE具有很好的性能，但是掩蔽特征的重构本质上依赖于输入节点特征的可区分性，即节点特征的可区分程度。在实践中，图中节点的特征通常是由于每个节点相关联的数据生成的，当使用较少区别的节点特征是，GraphMAE作为一种具有特征重构的生成式SSL框架，相对更容易受到特征的干扰。
在这项工作中，我们提出了GraphMAE2，目的是改进图SSL的特征重建。其思想是对目标重建进行正则化处理。为了实现这一点，我们引入了两种解码策略：多视图随机重掩码解码以减少对输入特征的过拟合，以及具有更多信息目标的潜在表示预测。
首先，我们提出在多视图随机重掩码解码的输入特征重构中引入随机性，而不是GraphMAE中使用固定的重掩码解码——重构掩码节点的编码嵌入。也就是说，编码的嵌入被随机重新掩码多次，并将其解码结果都强制恢复输入特征。其次，我们提出了潜在表示预测，它试图在嵌入空间中重构掩蔽特征，而不是在输入特征空间中重构。掩蔽节点的预测嵌入被约束以匹配它们直接从输入图生成的表示。这两种设计都很自然地作为生成图SSL中目标构造的正则化。

Method

我们首先回顾了图SSL的掩码自编码，并确定了其不足，即掩码特征重构的有效性易受输入节点特征的可区分性的影响。然后，我们提出了GraphMAE2，通过对特征解码进行正则化来克服这个问题。
模型的整体结构如下：

掩蔽特征重建中存在的问题：尽管性能优异，但由于节点特征的语义不准确，掩蔽节点特征重构仍存在潜在的问题。最近的一项研究表明，节点特征的可区分性会显著影响gnn在下游任务上的性能。在掩蔽特征重建中，较少的鉴别重建目标可能会导致误导和损害学习

GraphMAE2 Framework

我们提出GraphMAE2来克服上述问题。它遵循掩蔽预测范式，并进一步将正则化合并到解码阶段，以提高有效性。
为了改进特征重构，我们提出对编码的表示进行多次随机重掩码，并强制解码器从损坏的表示中重构输入特征。然后，为了最小化输入特征的直接影响，我们还强制执行该模型来预测在输入特征空间之外的嵌入空间中的掩蔽节点的表示。这两种策略都可以作为正则化的方法，以避免模型对输入特征的过拟合。此外，我们将GraphMAE2扩展到大型图，并建议对密集连接的子图进行采样，以适应GraphMAE2的训练。

多视图随机重新掩码解码

从输入特征重构的角度来看，我们在解码中引入了随机性，并要求解码器从不同的和部分观察到的嵌入中恢复输入

标签：重构,掩蔽,特征,论文,笔记,掩码,GraphMAE2,节点,输入
From： https://www.cnblogs.com/anewpro-techshare/p/18030589

刘铁猛C#学习笔记18 重写与多态
重写override子类中重新定义父类中已有的方法重写语法需要在要重写的父类方法添加一个virtual修饰符（虚方法）在子类中的同名方法添加一个override修饰符子类中添加新的成员，是继承中对父类的横向扩展重写不添加新成员，而是增加已有成员的新版本，可以看着对父类的纵向扩展......
刘铁猛C#学习笔记19 抽象类、接口与SOLID五大原则
接口与抽象类是所有高阶面向对象的起点，是学习设计模式的前置条件必须有实践基础之后，才能真正掌握算法、设计模式设计模式的基础solid五大设计原则（待续）1.单一职责原则singleresponsibilityprinciple2.开放-关闭原则Open-closeprinciple，简称为开闭原则“封装确定的，......
刘铁猛C#学习笔记21 反射与依赖注入
反射对于一个现有对象，能够在不使用new操作符、不知道其具体静态类型的情况下，创建出一个同类型的对象，还能访问这个复制品对象拥有的各个成员。相当于进一步的解耦，可以不使用new操作符，就没有类型的依赖关系这样的耦合关系甚至可以弱到忽略不计反射在.NET和JAVA中非常重要 ......
刘铁猛C#学习笔记13 委托1
“幻想：如果能有一种能把方法当参数的方法就好了”一、什么是委托委托源自C、C++中的函数指针 1.C语言中的函数指针(1)函数的直接调用先准备好一个加法函数，一个减法函数可以通过函数名调用这两个函数，这种调用方法称作直接调用 (2)函数指针的声明、间接调用先按下......
刘铁猛C#学习笔记10 字段、属性
这四种东西都是用来表达数据的一、字段（成员变量）曾用名：成员变量是为一个对象或类型存储数据的变量，区别于方法体中的局部变量多个字段组合起来可以表示对象当前的状态起源：C语言中结构体的成员变量一个对象占用的内存空间会被分配给各个字段1.实例字段和静态字段可以分为......
刘铁猛C#学习笔记11 索引器、常量
一、索引器[]概述使一个对象可以像数组一样用方括号[]去访问其元素ex：字典的声明 1.索引器的声明首先像上文那样声明一个字典Dictionary<,>在VS中输入indexer，然后敲两下tab就能得到：（按下tab可以跳到下一个可编辑项上）第一个类型参数为返回值的类型，第二个类型参数为......
刘铁猛C#学习笔记12 参数种类详解
一、值参数（传值参数、值传递）指参数的种类为值参数，而非参数数据类型为值类型1.值类型的传值参数类似一个新声明的局部变量，或传进来的实参的一个副本可以在方法体内重现赋值，但其在方法体内被赋值时，不会影响传进来的本体 2.引用类型的传值参数引用类型变量存储的是实例......
『数学记录』测度论学习笔记（一）：测度与常见测度基本定义
在数学中，测度(measure)是对长度、面积、体积等概念的一般化。对于一个可测的(measurable)集合，一个集合可以给出这个集合的“大小”。本文将从简介绍测度的基本定义与一些常见测度。Part1 基本定义测度通常定义在一个集合的\(\sigma\)-代数(sigma-algebra)上的......
杜教筛学习笔记
杜教筛是求一个数论函数f的前缀和，令其为S我们考虑构造一个数论函数g，根据狄利克雷卷积\[\begin{aligned}\sum_{i=1}^{n}(f*g)(i)&=\sum_{i=1}^{n}\sum_{d\midi}g(d)f\left(\frac{i}{d}\right)\\&=\sum_{i=1}^{n}g(i)S\le......
wqs二分学习笔记
wqs二分wqs是用来处理一类带有恰好选K个这种限制的问题我们如果发现这个答案关于k的函数是凸函数，那么就可以二分出斜率，然后拿它去切这个函数设这个直线为\(y=ax+b\)，以上凸为例，我们要求截距最大，就是b最大，等价于\(y-ax\)最大，也就是把k限制对应的贡献-a，然后再算答案，然后就可以去......