MixGCF: An Improved Training Method for Graph Neural Network-based Recommender Systems论文阅读笔记
Abstract
现存问题:
基于gnn的CF中的负采样在很大程度上尚未被探索。
提出方法:
我们建议通过同时利用用户-项图结构和gnn的聚合过程来研究负抽样。我们提出了MixGCF方法——一个一般的负采样插件,可以直接用于训练基于gnn的推荐系统。在MixGCF中,我们设计了原始负样本,而是采用跳跃混合技术来合成硬样本。具体来说,跳混合的想法是通过聚合来自不同层的原始负邻域的嵌入来生成合成负值。利用理论支持的硬选择策略对层和邻域选择过程进行了优化。
Introduction
从根本上说,负样本对(基于 GNN 的)推荐模型的性能起着决定性作用。负样本通常使用均匀分布 。为了提高负样本的质量,有研究尝试设计新的采样分布,以优先考虑有信息的负样本 。这样,模型就会面临挑战,被迫以更精细的粒度区分它们之间的差异。为了改进 GNN 中的负面采样,PinSage根据负面的 PageRank 分数对其进行采样,而 MCNS 则在考虑其结构相关性的基础上重新设计了正面和负面的采样分布。然而,这些在 GNN 中的尝试只关注了改进离散图空间中的负采样,而忽略了 GNN 在嵌入空间中独特的邻域聚合过程。
在这项工作中,我们提出设计负采样策略来更好地训练基于gnn的推荐系统。我们提出了一个简单的MixGCF框架来生成硬负样本。MixGCF没有直接从数据中采样真实的负数据,而是从数据增强和度量学习中获得灵感,通过利用底层的基于gnn的推荐器来合成负样本。
为了使合成负样本难以用于推荐模型,MixGCF 设计了两种策略:正向混合和跳跃混合。在正向混合中,我们引入了一种插值混合方法,通过注入正向样本的信息来污染原始负向样本的嵌入。在跳数混合中,我们对图 1 中的几个原始负样本(如
标签:采样,论文,mathbf,样本,笔记,混合,MixGCF,嵌入 From: https://www.cnblogs.com/anewpro-techshare/p/18196052