目录
概
'图'用于精排, 但是这里的图的使用主要是基于图抽取 triangles 作为'特征', 这么做可以避免在大规模图数据集上推理所带来的时间成本 (当然代价是额外的存储开销).
TGIN
Motivation: Triangle 的重要性
-
图上的推理, 很大程度上依赖于 homophily 假设, 即彼此连接的结点相似. 这个假设可以推广到 k-Clique (k-Clique 指的是结点数为 \(k\) 的完全子图).
-
作者做了一个统计: 可以发现, 4-Clique (即 triangle) 对于 homophily 的假设是最好的. 即倘若三个角度彼此连接, 则它们大概率具有相同的属性特征.
- 但是, 不同的 triangles 之间的特征往往是不同的, 这实际上就说了 triangle 是很好的特征, 应当被加以好好利用.
Model
-
首先, 每个结点周围的 triangles 需要提前抽取出来, 然后 triangles 的采样是通过经典的 DPP (Determinatal Point Process) 实现的 (主要是为了满足采样的 triangles 的多样性的需求).
-
之后的处理, 如上图所示, 分为 user 和 item 的建模.
-
item 的建模利用到 k-order triangles, 每一阶的 triangles 经过类似的处理.
-
user 的建模就是普通的 embedding 加上一些上下文信息.
-
item 的最后建模时不同阶的 triangles 以及 user 的 embedding 共同融合而成.
-
最后通过简单的 MLP 进行预测.
代码
[official]
标签:Triangle,Network,Graph,建模,item,through,Clique,triangles From: https://www.cnblogs.com/MTandHJ/p/17765823.html