[WSDM 2021]Bipartite Graph Embedding via Mutual InformationMaximization

时间：2022-09-23 10:24:54浏览次数：82

标签：Mutual via cdot Graph sum widetilde mathcal rm sigma

总结

利用生成对抗网络实现无监督的二部图嵌入方法，聚合时先聚合二跳邻居到一跳再聚合到自己身上以规避不同类型的问题

二部图嵌入方式

随机游走法
重构法，包含协同过滤和特征聚合

本文的重点

以前的算法都只停留在比较局部的范围内处理信息，这篇提出的模型可以提取整体的属性，包含同构顶点间的社区结构和异构顶点的远程依赖关系。呈现的形式是顶点嵌入。

互信息最大化

定义：

\(I(X;Y)=D_{KL}(p(x,y)||p(x)p(y))=\mathbb{E}_{p(x,y)}\left[ \log\frac{p(x,y)}{p(x)p(y)} \right]\)

二部图编码器

二部图中直接用一跳邻居聚合肯定有问题，因此可以先将两跳邻居聚合到一跳中，再聚合到目标节点中：

\(\hat{v}^k_j = \delta(\hat{W}^k_v \cdot {\rm MEAN}(\{u^{k-1}_i:u_i \in \mathcal{N}(v_j)\}))\)

\(\bar{u}^k_i=\delta(\bar{W}^k_u \cdot {\rm MEAN({\hat{v}^k_j:v_j \in \mathcal{N}(u_i)})})\)

\(u_i^k = W^k_u \cdot [\bar{u}^k_i | u^{k-1}_i]\)

全局表示

\(p_u={\rm MEAN}(\{u_i:u_i \in U\}),\ p_v={\rm MEAN}(\{v_i:v_i \in V\}),\)

\(g = {\rm COM}(p_u,p_v)=[\sigma(p_u)|\sigma(p_v)]\)

局部表示

H-hop包围子图

对于一条边的两端u，v两个点来说

\(G^h(u)=\{v_i|dis(v_i,u)\leq h\},G^h(v)=\{u_i|dis(u_i,u)\leq h\}\)

然后可以获得注意力权重：

\(\alpha_{u,i}=\frac{{\rm exp}\{(W_a \cdot v_i)^T \cdot (W_a^{'} \cdot u)\}}{\sum_{v_j \in G^h(u)} {\rm exp}\{(W_a \cdot v_j)^T \cdot(W_{a}^{'} \cdot u)\}},\ v_i \in G^h(u)\)

\(g^h_{(u,v)}=[\sigma(\sum_{v_i \in G^h(u)} \alpha_{u,i}v_i+u) | \sigma(\sum_{u_i \in G^h(v)} \alpha_{v,i}u_i+v)]\)

信息最大化目标

基本思想是利用生成对抗网络，即一份真图，一份假图，让模型可以分辨真假。

需要建立改变部分边的corrupted graph

\(S_{i,j}={\rm Bernoulli}(\beta)\)，伯努利分布，应该是概率变0或1

\(\widetilde{G}=(U,V,\widetilde{E}) = C(G,\beta) = A \oplus S\)

其中，\(\beta\)是腐化概率，\(\oplus\)是异或操作

\(\mathcal{L}_m = -\frac{1}{|E| + |\widetilde{E}|}(\sum_{i=1}^{|E|}\mathbb{E}_G[\log\mathcal{D}(g^h_{(u,v)_i},g)]+\sum_{i=1}^{|E|}\mathbb{E}_{\widetilde{G}}[\log(1-\mathcal{D}(\widetilde{g}^h_{(u,v)_i},g))])\)

\(\mathcal{D}(g^h_{(u,v)_i},g)=\sigma((g^h_{(u,v)_i})^TW_bg)\)

训练

\(\mathcal{L} = \lambda\mathcal{L}_m+(1-\lambda)\mathcal{L}_r\)

\(\mathcal{L}_r=\sum_{(u,v)\in E}\sum_{(u^{'},v^{'})\in E^{'}_{(u,v)}}[\gamma + \phi([u^{'}|v^{'}])-\phi([u|v])]_+\)

其中\(\phi\)为两层全连接层来获取等级，\([x]_+\)表示x中的正的部分，\(\gamma\)是边界。

\(E^{’}_{(u,v)}=\{(u^{'},v)|u^{'}\in U\} \cup \{(u,v^{'}|v^{'} \in V)\}\)

整个模型是端到端的模型。

数据集

都是推荐系统的数据集，MovieLens，Wikipedia，DBLP。

DBLP，MovieLens测试由预测top-k推荐进行，Wikipedia为边预测。

实验

值得借鉴的地方

利用生成对抗网络去进行无监督学习，在标签过少的数据集上也适用

弊端

当图过大时，mean pooling所有顶点特征作为图特征可能会过于简单，以至于模型无法区分真假图

原文

https://dl.acm.org/doi/abs/10.1145/3437963.3441783

标签：Mutual,via,cdot,Graph,sum,widetilde,mathcal,rm,sigma
From： https://www.cnblogs.com/yujianke/p/16720238.html

[TKDE 2021]Fast Semi-Supervised Learning WithOptimal Bipartite Graph
总结损失函数中保证结构接近的同时让目标图中的标签和真实标签拟合，而结构接近的判断依据是顶点和锚点之间的关联程度普通图上的半监督学习亲和力矩阵：\(W_{ij}=\left\{......
[AAAI 2022]Graph Convolutional Networks with Dual Message Passing for Subgraph I
总结GNN实现子图匹配。利用线图（边变点）让模型训练时将点和边的特征反复映射到对方领域参与训练。定义常规符号Graph,Edge,Vertex,。X,Y表示点标签和边标签：\(\mathca......
Codeforces Round #813 (Div. 2) - D. Empty Graph
构造Problem-D-Codeforces题意给\(n(1<=n<=10^5)\)个点，与权值\(a_i\)，这\(n\)个点组成一个完全图，\(a_l\)与\(a_r\)连的边的权值为\(min(a_l,a_{l+1}...a_{r......
A Graph Convolutional Network with Adaptive Graph Generation and Channel Selecti
motivation图神经网络已经被证明可以很好的解决长距离的语义依赖。但是之前的方法大多使用固定的图，如依赖于外部解析器生成的图（句法依存图等）图是固定的无法使用梯度......
C++ populate template array via random generator and finally sort,print
#pragmaonce#pragmacomment(lib,"rpcrt4.lib")#include<algorithm>#include<cstring>#include<iostream>#include<random>#include<vector>#include<Windo......
AMD radeon vega 8 graphics外接显示器模糊问题
打开显卡设置软件调节合适的颜色深度即可......
Guided sampling for large graphs
介绍提出了一种根据图的度和聚类系数来指导图采样。现有的采样算法可以将原图缩小到10%，但是，如果再进一步缩小就会对子图的结构造成破坏。工作的主要特点将样本量减......
src/delly.h:8:10: fatal error: boost/graph/adjacency_list.hpp: No such file or d
001、问题src/delly.h:8:10:fatalerror:boost/graph/adjacency_list.hpp:Nosuchfileordirectory 002、解决方法，安装boost库 Linux下boost库的编译及......
C - Friend-Graph HDU - 6152 三元环 & 拉姆齐定理
原题链接题意：判断图和补图是否含有三元环拉姆齐定理拉姆齐定理：在>=6个点的完全图中，用红蓝两色染色，一定存在一个红色或者蓝色的三角形。所有n>=6的话直接输出badte......
Application of wireless technology in aviation IPQ6018/IPQ6000/IPQ6010/Wallys
ApplicationofwirelesstechnologyinaviationIPQ6018/IPQ6000/IPQ6010/WallysThisarticlediscussessomekeyrecentdevelopmentsintheareaofwirelessnetwo......