目录
概
结合 social influence 和 geographical influence 的 (location) 序列推荐.
符号说明
-
\(S_u = \langle (l_1, t_1), (l_2, t_2), \ldots, (l_n, t_n) \rangle\), sequence, 其中 \((l, t)\) 分别别是地点和对应的时间戳;
-
若 \(t_{i+1} - t_i \le \Delta T\), 则称 \(l_i \rightarrow l_{i+1}\) 为一 transition;
-
若 \(l_i \rightarrow l_{i+1}\), 则 \(l_i\) 为 \(l_{i+1}\) 的 predecessor, \(l_{i+1}\) 为 \(l_i\) 的 successor;
-
\(L\), a set of nodes;
-
\(E \subset L \times L\), a set of edges;
-
\(G = (L, E)\), \(\mathbf{L^2TG}\), 我们形如下图的方式定义该图:
- 每个顶点记录了从 location \(l_i\) 出发的 transition 的次数 \(OCount(l_i)\);
- 每条边记录了 \(l_i \rightarrow l_j\) 的次数 \(TCount(l_i, l_j)\).
-
\(u \in U\), a set of users;
-
\(F(u)\), 与 \(u\) 存在直接社交关系的用户集合.
序列推荐
序列信息
-
定义转移概率:
\[TP(l_i \rightarrow l_j) = \frac{TCount(l_i, l_j)}{OCount(l_i)}, \: OCount(l_i) \not = 0, \]对于 \(OCount(l_i) = 0\) 的特殊情况, 仅 \(TP(l_i \rightarrow l_i) = 0\) 其余为 0.
-
我们可以直接用此来预测 \(l_{n+1}\), 即
\[p^{seq}(l_{n+1}|S_u) = TP(l_n \rightarrow l_{n+1}), \]但是这显然并不是一个标准的序列推荐, 因为我们仅考虑了前一个 location 的影响, 即短期兴趣, 但有些时候长期兴趣也是十分重要的;
-
所以作者考虑 n 阶的 additive Markov chain:
\[p^{seq}(l_{n+1}|S_u) = \frac{\sum_{i=1}^n W(l_i) \cdot TP(l_i \rightarrow l_{n+1})}{\sum_{i=1}^n W(l_i)}, \]其中 \(W(l_i)\) 是分配的权重, 作者采用的是指数衰减的方式:
\[W(l_i) = 2^{-\alpha \cdot (n - i)}. \]
Social Influence
-
POIs (point-of-interests) 的推荐往往有可用的社交网络可以应用. 作者认为, 朋友间往往有共同的趋势去同一个地方玩, 所以作者希望能够利用这部分信息.
-
对于任意的 \(u \in U\), \(l \in L\), 令 \(r_{u,l} \in \{0, 1\}\) 表示 \(u\) 是否去过 \(l\) (1 表示去过, 0 表示没去过);
-
再定义:
\[\hat{r}_{u,l}^{soc} = \frac{\sum_{u' \in U \wedge u' \not = u} SocSim(u, u') \cdot r_{u', l}}{\sum_{u' \in U \wedge u' \not = u} SocSim(u, u')}, \]其中
\[SocSim(u, u')= \left \{ \begin{array}{ll} 1 - \frac{distance(u, u')}{\max_{u'' \in F(u)} distance(u, u'')} & u' \in F(u) \\ 0 & u' \not \in F(u). \end{array} \right . \]\(distance(\cdot)\) 为某种距离函数.
-
直观上, 用户 \(u\) 和 location \(l\) 的紧密程度取决于那些访问过 \(l\) 的用户与 \(u\) 紧密程度. 比如, \(u\) 的所有朋友都访问过 \(l\), 那么 \(u\) 应当也会有很大概率访问 \(l\).
Geographical Influence
-
地理是一个十分重要的因素, 比如你在外国的朋友们经常访问一个地方, 但总不能也给 \(u\) 推荐此处.
-
作者是在二维视角下考虑这个问题的, 利用核函数进行密度估计:
\[p^{geo}(l_{n+1}|S_u) = \frac{1}{n\sigma^2} \sum_{i=1}^n K(\frac{l_{n+1} - l_i}{\sigma}), \]这里 \(l \in \mathbb{R}^n\) 表示 location 的经纬度. 作者利用一般的高斯核进行估计:
\[K(\bm{x}) = \frac{1}{2\pi} \exp(-\frac{1}{2} \bm{x}^T\bm{x}), \: \sigma = n^{-1/6} \sqrt{\frac{1}{2} \hat{\sigma}^T \hat{\sigma}}. \]其中
\[\hat{\sigma} = \sqrt{\frac{1}{n}\sum_{i=1}^n (l_i - \hat{\mu})^2}, \: \hat{\mu} = \frac{1}{n} \sum_{i=1}^n l_i. \]
整合
最后作者利用如下公式整合三部分的信息:
\[\hat{s}_{u, l_{n+1}} = p^{seq}(l_{n+1}|S_u) \cdot \hat{r}_{u, l_{n+1}}^{soc} \cdot p^{geo} (l_{n+1}|S_u). \] 标签:frac,cdot,exploiting,sum,influence,sequential,location,hat,rightarrow From: https://www.cnblogs.com/MTandHJ/p/17040125.html