首页 > 其他分享 >LightGODE论文阅读笔记

LightGODE论文阅读笔记

时间:2024-08-28 11:16:10浏览次数:12  
标签:嵌入 mathbf 训练 卷积 论文 笔记 GCN LightGODE mathcal

Do We Really Need Graph Convolution During Training? Light Post-Training Graph-ODE for Efficient Recommendation论文阅读笔记

Abstract

现存的问题:

​ 图卷积网络(GCN)在训练推荐系统(RecSys)中的效率和可扩展性一直是令人担忧的问题,阻碍了它们在现实世界中的应用。

提出方法:

​ 本文对训练阶段图卷积的必要性进行了批判性研究,并介绍了一种创新的替代方法:轻型后训练图常微分方程(LightGODE)。我们的调查显示,GCN 的优势在测试阶段比在训练阶段更明显。受此启发,LightGODE 采用了一种新颖的训练后图卷积方法,该方法绕过了 GCNs 的计算密集型消息传递,并采用了非参数连续图常微分方程 (ODE) 对节点表示进行动态建模。这种方法大大缩短了训练时间,同时实现了细粒度的训练后图卷积,避免了原始训练嵌入空间的失真,即嵌入差异问题。我们在几个不同规模的真实数据集上验证了我们的模型,结果表明LightGODE不仅在效率和效果上优于基于GCN的模型,而且还显著缓解了通常与更深的图卷积层相关的嵌入差异问题。

Introduction

​ 尽管在基于图的推荐方面取得了令人鼓舞的进展,但这些方法在本质上受到了效率和可扩展性问题的挑战。在现有的基于图的推荐培训范例中,图卷积的信息传递计算密集,这本质上引发了这些问题。在大规模图的实际应用中,这些问题会进一步加剧,因为时间/计算复杂度会随着用户和项目数量的增加而呈指数增长。

​ 最近的研究表明,简单的 MLP 作为图模型的初始化,或通过对比学习、知识提炼进行训练,与 GCN 模型相比,只要它们共享相等的权重空间,就能表现出有竞争力的性能。考虑到在矩阵因式分解(MF)权重的情况下,人们可以轻易地推导出对应的轻图模型,我们自然而然地提出了一个有意义的重要问题: 我们真的需要在推荐训练过程中进行计算量巨大的图卷积吗?

​ 为了解决这个问题,我们首先进行了一项初步实验,研究图卷积的作用。结果显示,图卷积在测试中的作用比在训练中更关键。值得注意的是,如果在训练后实施类似的轻量级图卷积,MF 模型就能与 GCN 的性能相媲美。为了从训练的角度揭示其根本原因,我们研究了使用 MF 和 LightGCN 模型进行训练时的监督对齐力,发现在两种不同的训练范式中,正用户-项目对的对齐属性是近似的。这促使我们进一步探索 MF 和 GCN 模型的训练过程,并得出结论:基于 GCN 的训练本质上是 MF 训练的度加权形式。

​ 直观地说,从深度优先搜索(DFS)的角度来看,通过遵循成对排列力,MF 训练产生的效果类似于基于广度优先搜索(BFS)的信息聚合的 GCN 训练。考虑到这些过程的时间需求,我们认为在训练过程中可能不需要图卷积。然而,目前的图卷积方法并不理想,因为我们根据经验发现,层数的增加会显著扩大卷积前后的嵌入差异,即嵌入差异(Embedding Discrepancy)。

​ 假设MF模型经过良好的训练,任何训练后的操作都不应该显著地改变原始的嵌入空间,而现有的具有高嵌入差异的卷积策略可能会潜在地抵消高阶信息的好处。此外,现有的粗粒度图卷积方法由于其离散特性,无法找到最优的卷积深度。这促使我们寻找一种更细粒度的方法来集成高阶的用户-项目交互,同时避免在训练过程中计算密集的信息传递。

​ 在本文中,我们介绍了一种基于图的新方法--Light Post-Training Graph-ODE (LightGODE),该方法专为精细高效的大规模 RecSys 而设计。具体来说,我们首先提出了一种新颖的训练后图卷积(PTGC)范式,通过跳过最耗时的操作(包括邻接矩阵归一化和逐层图卷积)来显著提高训练效率,使训练过程与传统的 MF 模型一样高效。为了解决嵌入差异问题,我们开发了一种非参数图卷积,在信息更新过程中加入了自循环。这种直接的操作将优先考虑前面的层,从而隐含地赋予浅层更大的重要性,尤其是图卷积过程中的初始嵌入,这有助于最大限度地减少图卷积前后嵌入空间之间的差异。因此,它有助于减少嵌入空间之间的分布差异。在此基础上,我们提出了由离散无参数图卷积衍生的连续图常微分方程。连续性具有以下几个优点。

​ 首先,它描述了用户/项目在双元图中的连续动态表示,使传统的图卷积成为无缝层向嵌入变换的特定离散化。此外,它还能实现精确和细粒度的图卷积,以实现与连续时间值的最佳权衡,从而在平衡嵌入差异的同时捕捉高阶信息。

​ 本文的主要贡献如下:

  • 据我们所知,我们是第一个对基于图的推荐中的长期权威--图卷积的必要性--提出质疑的人,而且我们通过经验和分析揭示了它在测试而非训练中的决定性作用。
  • 我们开发了一种新颖的训练后图卷积框架,以实现极其高效的训练,并设计了一种具有自循环功能的非参数 GCN,从而缓解了嵌入差异问题。
  • 最初,我们提出了一种连续图常微分方程(LightGODE),它可以对节点表示进行动态建模,实现高阶信息和嵌入差异的最优权衡。

Method

​ 在本节中,我们提出了后训练图卷积框架,包括预训练用户/项目嵌入,以实现极其高效的图推荐。为了平衡高阶信息的整合和嵌入差异的风险,我们设计了一种带有自循环的非参数图卷积。在此基础上,我们提出了 LightGODE--一种基于常微分方程的连续后训练图卷积,旨在实现最佳权衡。最后,我们展示了详细的时间复杂性分析以及与其他强 GCN 基线的比较。

pAkvbyd.png

预训练用户/物品嵌入

​ 在此,我们将概述我们为实现极其高效的基于图的推荐而设计的整体训练流程。如第 2 节所示,由于图卷积在训练阶段被证明是不必要的,因此我们放弃了图卷积相关操作,只专注于训练随机初始化的 ID 嵌入,如图 4 的训练部分所示。在损失计算方面,我们按照文献中的方法直接优化对齐和均匀性,使中频嵌入训练达到最佳状态,为后续的图卷积阶段打下理想基础。具体来说,对齐损失最小化批次 B 中正对(u

标签:嵌入,mathbf,训练,卷积,论文,笔记,GCN,LightGODE,mathcal
From: https://www.cnblogs.com/anewpro-techshare/p/18384227

相关文章

  • 学习笔记:基础动态规划
    线性DP定义具有线性“阶段”划分的动态规划算法被统称为线性动态规划入门线性动态DPLIS问题最长上升子序列问题。问题:给定一个长度为\(N\)的数列\(A\),求数值单调递增的子序列的长度最长是多少(子序列不需要连续)。经典的线性动态规划问题。分析:容易发现,对于某一个位......
  • java计算机毕业设计校园跑腿服务平台(开题+程序+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景在快速发展的数字时代,校园生活日益多元化与快节奏,学生们对于便捷高效的生活服务需求日益增长。传统的校园服务模式已难以满足学生群体对于时间管理......
  • java计算机毕业设计疫情防控信息管理系统(开题+程序+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景:在全球化日益加深的今天,突发公共卫生事件如疫情的爆发,对各国社会经济及民众生活构成了前所未有的挑战。疫情防控成为各国政府及社会各界关注的焦点。......
  • Java计算机毕业设计社区智能诊疗服务系统(开题+源码+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着信息技术的飞速发展和人口老龄化趋势的加剧,医疗资源分布不均、就医难、看病贵等问题日益凸显。传统诊疗模式面临巨大挑战,患者往往需要长时间排队......
  • java计算机毕业设计智能汽车租赁系统的设计与实现(开题+程序+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着科技的飞速发展和城市化进程的加速,智能出行已成为现代社会的重要趋势。传统汽车租赁行业面临着效率低下、管理复杂、用户体验不佳等挑战。随着物......
  • Java学习笔记9-数据类型的转化
    一.显示转化在Java中,数据类型的转换主要分为两种:自动类型转换(也称为隐式类型转换)和强制类型转换(也称为显式类型转换)。1.自动类型转换(隐式类型转换)自动类型转换是指在赋值或运算过程中,较小的数据类型自动转换为较大的数据类型。Java编译器会自动进行这种转换,不需要程序员显式指......
  • Java学习笔记10-运算符
    Java运算符是用于执行各种数学、逻辑和位运算的符号。Java中的运算符可以分为以下几类:一、算术运算符用于执行基本的数学运算,如加、减、乘、除和取模。常用的算术运算符包括+、-、*、/和%。算数运算符详解Java中的算术运算符包括加、减、乘、除、取模等,下面分别详细介绍。1.1......
  • Datawhale AI夏令营 Task 1 《深度学习详解》 - 1.1 通过案例了解机器学习的学
        一、学习目标通过具体案例深入理解机器学习的概念、工作原理以及在实际应用中的作用。二、主要内容案例介绍:详细阐述了图像识别、语音识别、自然语言处理等领域的具体案例,如人脸识别系统、智能语音助手、文本......
  • C:回调函数的介绍-学习笔记
    前言:本篇文章我们将继续指针相关知识:回调函数希望大家在看完后能够有所收获!回调函数 定义与概念回调函数是一个通过指针调用的函数。如果把函数指针作为参数传递给另一个函数,当这个指针被用来调用其所指向的函数时,被调用的函数就是回调函数,回调函数不是有该函数的实现方......
  • 基于ssm+vue党员管理系统设计与实现【开题+程序+论文】
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着信息化技术的飞速发展,传统的手工党员管理模式已难以满足当前复杂多变的党务工作需求。党员作为党组织的基石,其信息的准确性、管理的效率性直接关......