Optimizing Top-N Collaborative Filtering via Dynamic Negative Item Sampling

时间：2023-02-19 14:22:12浏览次数：65

标签：Optimizing via partial Collaborative ij ui uj frac hat

概
符号说明
Motivation
Dynamic Negative Sampling

Zhang W., Chen T., Wang J. and Yu Y. Optimizing top-n collaborative filtering via dynamic negative item sampling. In International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR, 2013).

概

一种动态选取负样本的策略.

符号说明

\(I\), items;
\(I_u\), positive items for user \(u\);
\(\hat{r}_{ui}\), \((u, i)\) 的 ranking score;
\(C(\langle i, j \rangle_u) = z_u \delta(\hat{r}_{ui} - \hat{r}_{uj})\), cost, 其中 \(\delta\) 通常为:
\[\delta (\hat{r}_{ui} - \hat{r}_{uj}) = \frac{1}{1 + e^{\hat{r}_{ui} - \hat{r}_{uj}}}; \]

Motivation

通常我们会用一个模型来建模 ranking score, 比如

\[\hat{r}_{ui} = h(u, i; \theta), \]
然后通过最小化 cost \(C(\langle i, j \rangle_u)\) 来最大化 \(\hat{r}_{ui} - \hat{r}_{uj}\).
这一步通常需要计算梯度:

\[\frac{\partial C}{\partial \theta} = \frac{\partial C}{\partial (\hat{r}_{ui} - \hat{r}_{uj})} \frac{\partial (\hat{r}_{ui} - \hat{r}_{uj})}{\partial w} =: \lambda_{ij}(\frac{\partial \hat{r}_{ui}}{\partial w} - \frac{\partial \hat{r}_{uj}}{\partial w}). \]
\(\lambda_{ij}\) 可以看成是 \((i, j)\) 这一对应的权重, 当然了我们也可以将这一部分复杂化, 人为给定权重:

\[\frac{\partial C}{\partial \theta} = f(\lambda_{ij}, \zeta_u) (\frac{\partial \hat{r}_{ui}}{\partial w} - \frac{\partial \hat{r}_{uj}}{\partial w}), \]
其中 \(\zeta_u\) 是 \(u\) 的 item list.
比如, NDCG 是推荐中一个评价排序质量的一个重要指标, 我们可以令 \(\Delta NDCG_{ij}\) 表示排序的 list 中 (i, j) 交换次序后的 NDCG 的变化的绝对值, 则

\[f(\lambda_{ij}, \zeta_u) = \lambda_{ij} \Delta NDCG_{ij} \]
会对于那些变化很大的 pair 赋予更多的权重, 如下图所示:

此时会分配更多权重给 (6, 1) 这一 pair. 不过, 这图看似合理, 也有一点问题, 比如 6 本身排得很靠前, 而 1 拍得很靠后, 此时 (6, 1) 的权重依旧是非常大的 (因为衡量的是绝对值), 所以我感觉这可能就不是太合理了.
然后这种做法还有一个计算量上的问题, 每次都排序是对于计算量的需求过于庞大了.

Dynamic Negative Sampling

作者退而求其次, 只是希望采样一个和相对排序 \(x_j = \text{Pr}(s(j) \le s(i)) \in [0, 1]\) 的采样方式, 即满足:

\[p_j \propto f(\lambda_{ij}, \zeta_u) / \lambda_{ij} = g(x_j), \]
注: 严格来说, \(p_j\) 应该为 \(p_{uj}\).
这个可以通过如下算法实现:

可以发现, 每一次, 我们只需要均匀采样连个 unobserved items, 并再进行一次拒绝采样即可 (方便很多), 可以发现这种情况下

\[p_j = \frac{1}{1 + \beta} \text{Pr}(s(j) > s(l)) + \frac{\beta}{1 + \beta} \text{Pr}(s(j) \le s(l)) \propto (1 - x_j) + \beta x_j =: g(x_j). \]
更一般地, 作者提出更复杂一点的算法:

此时,
\[p_j \propto 1C_n^0 (1 - x_j)^n + \sum_{k=1}^n \beta_k C_n^k x_j^k (1 - x_j)^{n-k}. \]

标签：Optimizing,via,partial,Collaborative,ij,ui,uj,frac,hat
From： https://www.cnblogs.com/MTandHJ/p/17134696.html

联邦学习论文阅读笔记07 Collaborative Fairness in Federated Learning
这篇论文提出CFFL框架，根据参与者的声誉收敛到不同模型，实现联邦学习公平协作参考笔记：https://zhuanlan.zhihu.com/p/600343559 ......
SpringBoot 使用 @ConfigurationProperties 异常 Not registered via @EnableConfigur
最近，我们在使用 @ConfigurationPropertiesNotregisteredvia@EnableConfigurationProperties,markedasSpringcomponent,orscannedvia@ConfigurationPropertiesSc......
SpringBoot 使用 @ConfigurationProperties 异常 Not registered via @EnableConfigur
最近，我们在使用 @ConfigurationProperties 进行注解的时候，遇到了Notregisteredvia@EnableConfigurationProperties,markedasSpringcomponent,orscannedvia@C......
How to Avoid Trivial Solutions in Physics-Informed Neural Networks
未发表（2021）本文也是关注采样点的一篇工作。主要从PINN的性能与采样点数量的关系方面入手考虑。提出了一个新的惩罚项，并对采样策略提出了一点看法。本文的工......
Efficient training of physics-informed neural networks via importance sampling
因为看着作者是英伟达的，便看了一下。总体感觉没有什么新意，改进幅度也很小，但是理论推导可以看一下。可以借鉴一下。本文通过重要性采样对PINN进行高效计算，本文提出的......
Error running Application. Command line is too long.Shorten the command line via
idea启动报错，错误信息：ErrorrunningApplication.Commandlineistoolong.ShortenthecommandlineviaJARmanifestorviaaclasspathfileandrerun.解决方法......
浏览器报Mixed Content错误的解决：Mixed content: load all resources via HTTPS to im
https地址中，如果加载了http资源，浏览器将认为这是不安全的资源，将会默认阻止，这就会给你带来资源不全的问题了，比如：图片显示不了，样式加载不了，JS加载不了。控制台报错：Mixed......
【推荐系统论文精读系列】(七)--AutoRec Autoencoders Meet Collaborative Filtering
文章目录一、摘要二、介绍三、AUTOREC模型四、实验评估References论文名称：AutoRec:AutoencodersMeetCollaborativeFiltering......
【推荐系统论文精读系列】(五)--Neural Collaborative Filtering
文章目录一、摘要二、介绍三、准备知识3.1从隐式数据中进行学习3.2矩阵分解四、神经协同过滤4.1总体框架......
2021 ACL Parameter-efficient Multi-task Fine-tuning for Transformers via Shared
Parameter-efficientMulti-taskFine-tuningforTransformersviaSharedHypernetworks阅读这篇文章的目的是为了了解hypernet，相关代码https://github.com/rabeehk/hyp......

Optimizing Top-N Collaborative Filtering via Dynamic Negative Item Sampling

概

符号说明

Motivation

Dynamic Negative Sampling

相关文章

赞助商

阅读排行