这个领域不熟悉,是看的第一篇论文,记录细一点
Abstract
单类协作过滤(OCCF)的目标是识别出与之呈正相关但尚未交互的用户-项目对,其中只有一小部分积极的用户-项目交互被观察到,对于积极和消极交互的区分建模,以往的工作在一定程度上依赖于负抽样,即将未观察到的用户项目对视为负对,因为实际的负对是未知的。然而,负抽样方案有关键的局限性,因为它可能选择“正但未观察到”的对作为负的。本文提出了一种新的OCCF框架,即BUIR,它不需要负采样。为了使正相关用户和项目的表示相互相似,同时避免崩溃的解决方案。BUIR采用了两个不同的编码器网络,相互学习,第一个编码器被训练预测第二个编码器的输出作为其目标,而第二个编码器通过缓慢逼近第一个编码器提供一致的目标。此外对编码器输入应用了随机数据增强。BUIR基于用户和项目的邻域信息,在每次编码是随机生成每个积极交互的增强视图
Introduction
介绍一下OCCF的目标是通过只使用少量观察到的交互来识别大量未观察到的交互中最有可能的积极的用户-项目交互
解决OCCF问题最主要的方法是区分性建模,它明确地旨在区分积极的用户-项目交互和消极的对应交互。
但是OCCF存在一个问题,就是假设所有未观察到的交互作用都是负的,会造成尚未交互的项目会被认为不如有交互的项目。所以目前的方法要么使用所有未观察到的用户-项目交互作为负抽样,要么采用负抽样,以随机的方式随机抽样未观察到的用户-项目交互。最后为了更好的效果和更快的速度还提出了从非均匀分布中采样的策略
但是负采样在以下方面有严重的局限性,首先,随着用户-项目交互变得更加稀疏,关于负面交互的基本假设变得不那么有效。因为随着观察到的积极交互作用较少,“积极但未观察到的”交互作用的数量就会增加,因此,取样正确的消极交互作用变得更加困难。这种监管的不确定性最终会降低top-