首页 > 其他分享 >LORE: exploiting sequential influence for location recommendations

LORE: exploiting sequential influence for location recommendations

时间:2023-01-10 14:14:53浏览次数:63  
标签:frac cdot exploiting sum influence sequential location hat rightarrow

目录

Zhang J., Chow C. and Li Y. In ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems (SIGSPATITAL), 2014.

结合 social influence 和 geographical influence 的 (location) 序列推荐.

符号说明

  • \(S_u = \langle (l_1, t_1), (l_2, t_2), \ldots, (l_n, t_n) \rangle\), sequence, 其中 \((l, t)\) 分别别是地点和对应的时间戳;

  • 若 \(t_{i+1} - t_i \le \Delta T\), 则称 \(l_i \rightarrow l_{i+1}\) 为一 transition;

  • 若 \(l_i \rightarrow l_{i+1}\), 则 \(l_i\) 为 \(l_{i+1}\) 的 predecessor, \(l_{i+1}\) 为 \(l_i\) 的 successor;

  • \(L\), a set of nodes;

  • \(E \subset L \times L\), a set of edges;

  • \(G = (L, E)\), \(\mathbf{L^2TG}\), 我们形如下图的方式定义该图:

    1. 每个顶点记录了从 location \(l_i\) 出发的 transition 的次数 \(OCount(l_i)\);
    2. 每条边记录了 \(l_i \rightarrow l_j\) 的次数 \(TCount(l_i, l_j)\).
  • \(u \in U\), a set of users;

  • \(F(u)\), 与 \(u\) 存在直接社交关系的用户集合.

序列推荐

序列信息

  • 定义转移概率:

    \[TP(l_i \rightarrow l_j) = \frac{TCount(l_i, l_j)}{OCount(l_i)}, \: OCount(l_i) \not = 0, \]

    对于 \(OCount(l_i) = 0\) 的特殊情况, 仅 \(TP(l_i \rightarrow l_i) = 0\) 其余为 0.

  • 我们可以直接用此来预测 \(l_{n+1}\), 即

    \[p^{seq}(l_{n+1}|S_u) = TP(l_n \rightarrow l_{n+1}), \]

    但是这显然并不是一个标准的序列推荐, 因为我们仅考虑了前一个 location 的影响, 即短期兴趣, 但有些时候长期兴趣也是十分重要的;

  • 所以作者考虑 n 阶的 additive Markov chain:

    \[p^{seq}(l_{n+1}|S_u) = \frac{\sum_{i=1}^n W(l_i) \cdot TP(l_i \rightarrow l_{n+1})}{\sum_{i=1}^n W(l_i)}, \]

    其中 \(W(l_i)\) 是分配的权重, 作者采用的是指数衰减的方式:

    \[W(l_i) = 2^{-\alpha \cdot (n - i)}. \]

Social Influence

  • POIs (point-of-interests) 的推荐往往有可用的社交网络可以应用. 作者认为, 朋友间往往有共同的趋势去同一个地方玩, 所以作者希望能够利用这部分信息.

  • 对于任意的 \(u \in U\), \(l \in L\), 令 \(r_{u,l} \in \{0, 1\}\) 表示 \(u\) 是否去过 \(l\) (1 表示去过, 0 表示没去过);

  • 再定义:

    \[\hat{r}_{u,l}^{soc} = \frac{\sum_{u' \in U \wedge u' \not = u} SocSim(u, u') \cdot r_{u', l}}{\sum_{u' \in U \wedge u' \not = u} SocSim(u, u')}, \]

    其中

    \[SocSim(u, u')= \left \{ \begin{array}{ll} 1 - \frac{distance(u, u')}{\max_{u'' \in F(u)} distance(u, u'')} & u' \in F(u) \\ 0 & u' \not \in F(u). \end{array} \right . \]

    \(distance(\cdot)\) 为某种距离函数.

  • 直观上, 用户 \(u\) 和 location \(l\) 的紧密程度取决于那些访问过 \(l\) 的用户与 \(u\) 紧密程度. 比如, \(u\) 的所有朋友都访问过 \(l\), 那么 \(u\) 应当也会有很大概率访问 \(l\).

Geographical Influence

  • 地理是一个十分重要的因素, 比如你在外国的朋友们经常访问一个地方, 但总不能也给 \(u\) 推荐此处.

  • 作者是在二维视角下考虑这个问题的, 利用核函数进行密度估计:

    \[p^{geo}(l_{n+1}|S_u) = \frac{1}{n\sigma^2} \sum_{i=1}^n K(\frac{l_{n+1} - l_i}{\sigma}), \]

    这里 \(l \in \mathbb{R}^n\) 表示 location 的经纬度. 作者利用一般的高斯核进行估计:

    \[K(\bm{x}) = \frac{1}{2\pi} \exp(-\frac{1}{2} \bm{x}^T\bm{x}), \: \sigma = n^{-1/6} \sqrt{\frac{1}{2} \hat{\sigma}^T \hat{\sigma}}. \]

    其中

    \[\hat{\sigma} = \sqrt{\frac{1}{n}\sum_{i=1}^n (l_i - \hat{\mu})^2}, \: \hat{\mu} = \frac{1}{n} \sum_{i=1}^n l_i. \]

整合

最后作者利用如下公式整合三部分的信息:

\[\hat{s}_{u, l_{n+1}} = p^{seq}(l_{n+1}|S_u) \cdot \hat{r}_{u, l_{n+1}}^{soc} \cdot p^{geo} (l_{n+1}|S_u). \]

标签:frac,cdot,exploiting,sum,influence,sequential,location,hat,rightarrow
From: https://www.cnblogs.com/MTandHJ/p/17040125.html

相关文章