首页 > 其他分享 >GraphMAE阅读笔记

GraphMAE阅读笔记

时间:2023-09-25 16:48:30浏览次数:40  
标签:误差 GraphMAE 特征 笔记 放缩 阅读 掩码 节点

GraphMAE阅读

引言

在摘要里,本论文提出了自监督学习有着巨大的潜力

自监督学习又分为对比学习和生成学习

目前比较成功的是对比学习,因为在对比学习中,有高质量的数据增强以及可以通过额外的策略来稳定训练过程

而对于生成式的自监督学习,它们旨在重建数据本身的特征和信息,对图来说,图自动编码器(Graph Autoencoder, GAE)可以重建图的结构信息或者节点特征,但是目前基于图自动编码器的发展远远落后于对比学习

所以,本文提出了GraphMAE,GraphMAE发现仅仅重建节点特征便能够使得模型学到充分的信息,从而有助于下游分类等任务。

GraphMAE的主要改进包括:

  • 带掩码的节点特征重建
  • 使用放缩余弦误差
  • 带重掩码的解码过程

GraphMAE的结构

pPIUEl9.md.png

1.带有MASK的节点特征重建

​ 对于一个图\(G=(V,\varepsilon,X)\)

​ 从图中采样部分节点\(\tilde{V}\subset V\),用一个掩码标识[MASK]来替换它们的输入节点特征,记经过mask之后的节点特征矩阵为\(\tilde{X}\),那么

pP7wLiq.png

2.带重掩码的解码过程

​ 传统的decoder的表现力较差,导致encoder得到的节点表示H与输入特征几乎相同,所以GraphMAE采用了单层图神经网络作为decoder,GNN decoder可以根据一个节点周围的节点分布恢复其自身的输入特征,可以帮助解码器学习高层次的信息

​ GraphMAE采用一种新的重掩码的方式,用另一个掩码标识[DMASK],再次替换最初采样到的节点的表示。即

pP70Kwd.png

这样就可以迫使从邻近的未遮盖的节点中重构它的输入特征

3.使用放缩余弦误差

​ 之前的图自动编码器大多数采用均方误差作为损失函数,但是均方误差在训练中最小化到接近零或者很难优化,不足以进行有意义的特征重建。所以GraphMAE采用了余弦误差,同时引入了放缩因子来进一步改进余弦误差。当放缩因子大于1时误差能够更快的衰减到0,从而能够调整难度不同样本的权重,放缩余弦误差的定义为:

pP7DLFA.png

放缩因子也是一个在不同数据集上可调整的超参数

标签:误差,GraphMAE,特征,笔记,放缩,阅读,掩码,节点
From: https://www.cnblogs.com/anewpro-techshare/p/17728234.html

相关文章

  • 《软件需求十步走》阅读笔记
    软件需求是什么?是客户最基本的要求,是开发人员如何针对开发的基准,若软件开发没有了这一步,也就失去了此次开发的必要性,也就如同做了无用功。有需求的存在,对客户、开发团队双方来言是互利的存在,所以我们作为软件工程的学生,自当做好对需求的正确、准确分析。软件需求是软件项目和产品......
  • 阅读计划
    《软件需求十步走》阅读笔记发布时间:9月25号、10月25号、11月25号、12月25号《需求分析与系统设计》阅读笔记发布时间:10月5号·、11月5号、12月5号《实例化需求》阅读笔记发布时间:10月15号、11月15号、12月15号......
  • 考试笔记
    考试笔记从暑假集训开始。质量不等。后面的笔记质量要高一些。2023.08.22T1T2一个很显然的思路是先预处理,把所有图形搜出来,并算出它们所占据的空间,然后对于每组询问做到\(O(1)\)查询(二维前缀和)。难点就在于如何去重相同的图形。T3这么喜欢出矩阵乘法吗。一眼\(O(n^3\l......
  • 机器学习笔记
    机器学习笔记mAP(meanAveragePrecision)在机器学习中的目标检测领域,是十分重要的衡量指标,用于衡量目标检测算法的性能。一般而言,全类平均正确率(mAP,又称全类平均精度)是将所有类别检测的平均正确率(AP)进行综合加权平均而得到的。李课理论部分损失函数(LossFunction)是定义在单个......
  • 雾里滑雪笔记(三)热力学第一定律
    热一律及其衍生物一、热力学第一定律的基本内容热力学第一定律是能量守恒定律在一定条件下的表现形式。为了理解这种说法,我们考虑所有可能的形式的能量。系统的总能量可以分为三部分:系统在外力场中的势能或位能$V$,系统整体运动的动能$T$,和系统的内能,即热力学能$U$。$$E=......
  • SDTM初学笔记 - [001] - SDTM基础概念学习
    SDTM,全称StudyDataTabulationModel,围绕着observations的概念构建,observations由研究期间收集的一些离散信息组成,通常对应于数据集中的rows。1Domains一个domain是关于一个特定topic的观测的集合。SDTM的首要目的是展示关于研究受试者的数据(可能是humans,或animals,或medical......
  • gdb调试应用笔记
    GDB介绍(来自man手册):ThepurposeofadebuggersuchasGDBistoallowyoutoseewhatisgoingon"inside"anotherprogramwhileitexecutes--orwhatanotherprogramwasdoingatthemomentitcrashed.翻译就是:调试器(如GBD)的目标工作就是让你看看程序执行时在......
  • Linux笔记(1)
    文件操作命令1.创建文件命令:touch-创建文件touch命令主要用于创建普通文件,用法为 touchtest.txt2.查看文件命令:cat-查看文件内容cat命令主要用于查看内容较少的文件,用法为cat路径 命令:more-查看文件内容more命令主要用于查看内容多的文件,可以......
  • 微积分 学习笔记
    1.函数,图形在高中,我们学过圆锥曲线,大学对它进行了拓展。要学习微积分,首先要先学习函数。在数学中,函数的定义是:给定两个集合\(S1,S2\),一个规则\(f\),对于每个\(S1\)中的元素\(x\),\(f\)都把它变化成\(S2\)中的元素。\(S2\)的所有元素都对应至少一个\(S1\)的元素。\(S1\)被称为定......
  • 学习笔记三
    sh编程sh脚本sh脚本是一个包含sh语句的文本文件,命令解释程序sh要执行该语句,所有的sh基本都执行相同的任务,脚本在语法上略有不同,shebang允许允许主sh调用适当版本的sh来执行脚本。如果未指定shebang,默认执行sh,即下列程序的第一行。例:创建一个一个文本文件mysh,包含:#!/bin/bash......