Abstract
说明现有的问题:现有的gnn平等地对待用户和项目,不能区分每个节点的不同局部模式,这使得它们在推荐场景中并不理想。
提出本文的工作:为了解决这一挑战,我们提出了一个节点级自适应图神经网络框架ApeGNN。ApeGNN开发了一种用于信息聚合的节点级自适应融合机制,使每个节点能够根据局部结构(如度)自适应地决定其融合权值。
Introduction
开始详细说明现有的问题:在基于gnn的模型中仍存在一些需要推荐的问题。首先,在基于gnn的推荐中没有区分节点类型。用户-项目交互网络是一种特殊类型的图,其边缘只能存在于用户和项目的中间。换句话说,在两个用户或项目之间没有直接的交流。到目前为止,现有的基于gnn的推荐方法与处理其他普通图的一般gnn没有什么区别,如参考图,社交网络等。也就是说,对所有用户和项目都采用了相同的建模策略。通常,在高阶邻域聚合设置中,用户从(仅)第0层嵌入的1跳项目邻居、第1层表示的2跳用户以及第2层嵌入的3跳项目聚合信息。在基于gnn的推荐系统中,将所有层相同的聚合步骤忽略了每个子图结构中用户和项目之间的语义差异,并扩展了它们的嵌入。其次,不同的用户/项目的本地结构在推荐上是不同的。我们认为不同度节点在每个跳传播上的平均结果分布非常不平衡,每个节点的最优传播数是不确定的,这意味着每个用户/项目都有其局部结构。这表明,具有不同结构的不同节点应该具有不同的重要性。考虑到这些问题,我们认为推荐gnn中的节点自适应聚合是学习层间节点级差异的必要步骤。因此,我们建议研究在基于gnns的推荐方法的聚合过程中,每个节点是否应该在不同的层中进行不同的处理。
下一段介绍现有的工作以及存在的问题,这里就不详细展开了
然后提出本文的方法:在这项工作中,我们提出了一个新的自适应模型(ApeGNN),它在gnn中进行节点级自适应聚合以供推荐。而不是对待每个用户和项目在每一层在高阶聚合和传播,我们利用图扩散过程自适应地分配一个独特的权重(内层权重)的邻居和区分信息从不同的gnn层,促进聚合方法的发展从固定的聚合到节点级别的聚合。对于ApeGNN的想法是对于每个用户u和每个用户i都有一个独立的聚合权重:\(\theta(t(u_i),l),\theta(t(v_j),l)\),这些权重代表了每个用户和项目在每层的贡献
Method
本节设计了一个基于gnn的推荐系统ApeGNN。其主要思想是在聚合过程中区分每个用户以及节点的项目,并以节点的方式计算gnn中的影响。为了实现这一点,我们将基于图扩散的自适应操作的思想整合到聚合中。
模型的流程如下:
基于节点的GNN自适应聚合
为了将节点重要性整合到基于gnns的模型中的现有聚合中以进行推荐,我们设计了一种基于节点的自适应聚合机制。对于用户u和它的邻居节点\(N_{u_i}\),带有权重系数的聚合函数可以表示为:
\(\mathbf{h}_{u_i}=AGG(\{\mathbf{h}_{v_j},\forall v_j\in\mathcal{N}_{u_i}\};\theta(t_{u_i})).\)
\(t_{u_i}\)是用户u的自适应操作参数
类似地,项目的聚合函数可以表示为:
\(\mathbf{h}_{v_{j}}=AGG(\{\mathbf{h}_{u_{i}},\forall u_{i}\in\mathcal{N}_{v_{j}}\};\theta(t_{v_{j}})),\)
权重系数\(\theta\)
如前所述,在GNN中,在不同层的嵌入中所包含的语义往往是不同的。对于二部图上的gnn,每一层都由用户或项目组成,这自然使每一层的语义有所不同。换句话说,应该通过设置不同的权值来捕获聚合过程中每个层的唯一语义来明确地处理不同层上的嵌入。特别地,我们提出了热核(HT)和个性化PageRank(PPR)两种方法来模拟图的扩散过程,提供更好的重要性选择支持,接下来是介绍两种不同的相关系数的方法
热核方法
在基于gnn的模型中,节点之间的特征传播可以看作是牛顿冷却定律(也称为热核)的实践,其中热量从温度较高的区域转移到温度较低的区域。也就是说,两个节点之间的嵌入传播自然与它们的表示成正比。
然后是一堆复杂的数学推导,最后计算出相关系数为:
\(\theta_{(t_{u_i}^{(l)})}^{HT}=\frac{t_{u_i}^{l}e^{-t_{u_i}}}{l!}.\)
t是前面提到的自适应操作参数
Personal PageRank方法
ApeGNN旨在从每个节点的图结构中识别局部模式。为了实现这一目标,我们利用PageRank和APPNP中使用的PPR来构建图结构信息,并为每个节点分配唯一的权重。
\(\theta_{(t_{u_{i}}^{(l)})}^{PPR}=t_{u_{i}}^{(l)}(1-t_{u_{i}}^{(l)})^{l}.\)
ApeGNN和APPNP的共同点是,我们将GCN与个性化的PageRank连接起来,以进行远程传播,降低过平滑风险,并适当地利用传送概率来保留初始特征,以获得更好的性能。通过利用热核和个性化的页面排名,我们可以为每个节点分配适当的权重,以增强低频侧翼,并加强图的平滑性。
中心重要性
最好的传播方式是不确定的,因此,在建模节点的重要性时,应考虑每层的邻居权重,在聚合过程中获得节点的表示时,应对用户和项目节点之间的不同注入进行建模。以往关于节点重要性估计的研究表明,节点的重要性与其在图中的中心性呈正相关。一般来说,节点的入度表示其中心性和流行程度。因此我们使用入度作为初始层的权重来对用户和项目的差异进行建模。
\(t_{u_i}^{(0)}=\varphi(D(u_i))=\sigma(log(D(u_i)+\epsilon))\)
在ApeGNN中,通过给出一个用户-项目交互二部图作为输入,将每个用户和每个项目的嵌入通过自适应聚合进行区分,并将该嵌入进行节点参数化,形成最终表示。
传播过程
通过在聚合过程中使用增强的表示,我们可以将每个嵌入层添加到传播层中,以挖掘高阶连接信息。
\[\begin{gathered} \mathbf{h}_{u_{i}}^{(l)} =\theta(t_{u_i}^{(l)})\sum_{v_j\in\mathcal{N}_{u_i}}p_{(u_iv_j)}\mathbf{h}_{v_j}^{(l-1)}, \\ \mathbf{h}_{v_j}^{(\boldsymbol{l})} =\theta(t_{v_j}^{(l)})\sum_{u_i\in\mathcal{N}_{v_j}}P_{(v_ju_i)}\mathbf{h}_{u_i}^{(l-1)}. \end{gathered}\]通过利用卷积核扩展嵌入的聚合和传播函数,得到了自适应图的卷积矩阵,矩阵的形式为:
\[\begin{gathered} \mathbf{E}_u^{(\boldsymbol{l})} =\sum_{l=0}^{L}\Theta_{t_{u}}^{(l)}\mathbf{T}^{l}\mathbf{E}_{u}^{(l-1)}, \\ \mathbf{E}_v^{(\boldsymbol{l})} =\sum_{l=0}^L\Theta_{t_v}^{(l)}\mathbf{T}^l\mathbf{E}_v^{(l-1)}. \end{gathered}\]
标签:Node,聚合,GNNs,用户,ApeGNN,mathbf,Wise,gnn,节点 From: https://www.cnblogs.com/anewpro-techshare/p/18071061