A Causal View for Multi-Interest User Modeling in News Recommendation论文阅读笔记
Abstract
存在的问题:
过去的方法往往忽视了用户偏好的多样性。近期的研究探索了多兴趣模型来解决这一局限。然而,兴趣对点击行为的影响各不相同,直接建立兴趣与候选人之间的匹配模型会导致虚假相关性问题。具体来说,当高度相关的兴趣掩盖了真正的点击动机时,模型就无法区分真正导致点击的兴趣。
提出方法
为解决这一问题,本文从因果角度重新建模兴趣与点击行为之间的关系。我们提出的用户多兴趣建模反事实加权法(CWMI)由一个分离的多兴趣提取器和一个兴趣再加权模块组成。具体来说,我们首先从因果角度建立兴趣对点击行为的影响模型。然后,我们学习仅包含当前聚类新闻信息的分解用户兴趣。最后,在反事实世界中,我们对当前兴趣进行干预,并通过比较候选者排名的变化对其重新加权。
Introduction
我们的工作源于以下观察。面对众多新闻,用户的不同兴趣会对最终点击产生不同的影响。如图 1 所示,一位漫威电影的粉丝与新闻进行了互动,因为新闻提到了漫威电影《复仇者联盟》的主题。在这个例子中,是用户对漫威电影的兴趣导致了点击,而不是电脑游戏。然而,现有模型无法区分真实动机,只能根据新闻与游戏兴趣之间的高度相关性推荐更多游戏新闻。事实上,现实世界的驱动力是因果关系而非单纯的相关性,相关性并不意味着因果关系。例子中的虚假相关性反过来又会损害用户体验,遗憾的是,目前还没有解决这一问题的成熟方案。
我们认为,推荐模型应该能够揭示导致点击行为的真正兴趣动机。因此,必须从因果关系的角度重新建模兴趣和点击之间的关系。这就提出了两个关键挑战。首先,因果关系图中的每个因素都应是独立的,并能相互分离。然而,现有的方法不能有效地根据兴趣对项目进行聚类,从而使兴趣受到属于其他兴趣的新闻噪音的污染。其次,我们缺乏点击动机的真实标签,这使得了解导致点击的兴趣具有挑战性。幸运的是,反事实推理的最新进展为解决数据噪声和缺失的难题提供了可能。反事实推理可以估计特定路径的因果效应,并消除某些用户/项目特征的因果效应。
具体来说,它沿着特定路径想象一个没有该功能的反事实世界,然后与事实世界进行比较,以估计特定路径的因果效应。当我们将用户的多重兴趣建模为导致点击的因素时,通过干预不同的兴趣并观察其变化,我们就能找出引发点击行为的兴趣。换句话说,我们可以回答反事实问题: 如果这种兴趣不存在,点击行为会怎样?在本文中,我们假设图 1 中的用户在反事实世界中没有电影兴趣,然后观察用户是否还会与这则新闻互动。该新闻在推荐列表中的排名下降得越多,干预带来的影响就越大,这表明对电影的兴趣在激励用户点击方面更为重要。
基于上述分析,我们的工作提出了一种用于用户多兴趣建模的反事实加权方法(CWMI),该方法仅从当前的点击新闻集群中学习兴趣嵌入,并利用反事实推理来模拟不同兴趣对点击行为的重要性。具体来说,CWMI 由两个主要模块组成:分离的多兴趣提取模块和兴趣再加权模块。首先,我们对用户点击的新闻进行聚类,确保具有相似主题的文章根据语义信息紧密分组。然后,为每个聚类的新闻独立计算上下文权重,以确保关注机制只关注当前感兴趣的新闻,从而将学习到的兴趣进行分离。
接下来,在兴趣再加权模块中,我们从两个角度量化了不同兴趣的重要性。从因果角度来看,我们构建了一个因果图来解释用户兴趣对点击的因果影响。通过比较候选条目在反事实世界中排名的下降情况,我们估算出每种兴趣对点击行为的直接影响。从时间角度来看,我们自适应地学习了时间戳在点击行为中的作用,进一步模拟了用户兴趣的演变。
本文的主要贡献如下:
- 我们设计了一个分离的多兴趣提取器来学习兴趣表示,并从因果的角度建模兴趣对点击行为的影响。
- 我们提出了一种基于反事实推理的多兴趣再加权方法,以识别用户点击背后的真实动机。
问题定义
用户点击行为的因果关系视图
在我们的研究中,我们通过因果图对每个用户的点击行为进行建模,如图 2 所示,其中
标签:CWMI,新闻,论文,用户,笔记,我们,mu,点击,兴趣 From: https://www.cnblogs.com/anewpro-techshare/p/18364600