首页 > 其他分享 >CWMI论文阅读笔记

CWMI论文阅读笔记

时间:2024-08-17 16:37:58浏览次数:5  
标签:CWMI 新闻 论文 用户 笔记 我们 mu 点击 兴趣

A Causal View for Multi-Interest User Modeling in News Recommendation论文阅读笔记

Abstract

存在的问题:

​ 过去的方法往往忽视了用户偏好的多样性。近期的研究探索了多兴趣模型来解决这一局限。然而,兴趣对点击行为的影响各不相同,直接建立兴趣与候选人之间的匹配模型会导致虚假相关性问题。具体来说,当高度相关的兴趣掩盖了真正的点击动机时,模型就无法区分真正导致点击的兴趣。

提出方法

​ 为解决这一问题,本文从因果角度重新建模兴趣与点击行为之间的关系。我们提出的用户多兴趣建模反事实加权法(CWMI)由一个分离的多兴趣提取器和一个兴趣再加权模块组成。具体来说,我们首先从因果角度建立兴趣对点击行为的影响模型。然后,我们学习仅包含当前聚类新闻信息的分解用户兴趣。最后,在反事实世界中,我们对当前兴趣进行干预,并通过比较候选者排名的变化对其重新加权。

Introduction

​ 我们的工作源于以下观察。面对众多新闻,用户的不同兴趣会对最终点击产生不同的影响。如图 1 所示,一位漫威电影的粉丝与新闻进行了互动,因为新闻提到了漫威电影《复仇者联盟》的主题。在这个例子中,是用户对漫威电影的兴趣导致了点击,而不是电脑游戏。然而,现有模型无法区分真实动机,只能根据新闻与游戏兴趣之间的高度相关性推荐更多游戏新闻。事实上,现实世界的驱动力是因果关系而非单纯的相关性,相关性并不意味着因果关系。例子中的虚假相关性反过来又会损害用户体验,遗憾的是,目前还没有解决这一问题的成熟方案。

​ 我们认为,推荐模型应该能够揭示导致点击行为的真正兴趣动机。因此,必须从因果关系的角度重新建模兴趣和点击之间的关系。这就提出了两个关键挑战。首先,因果关系图中的每个因素都应是独立的,并能相互分离。然而,现有的方法不能有效地根据兴趣对项目进行聚类,从而使兴趣受到属于其他兴趣的新闻噪音的污染。其次,我们缺乏点击动机的真实标签,这使得了解导致点击的兴趣具有挑战性。幸运的是,反事实推理的最新进展为解决数据噪声和缺失的难题提供了可能。反事实推理可以估计特定路径的因果效应,并消除某些用户/项目特征的因果效应。

​ 具体来说,它沿着特定路径想象一个没有该功能的反事实世界,然后与事实世界进行比较,以估计特定路径的因果效应。当我们将用户的多重兴趣建模为导致点击的因素时,通过干预不同的兴趣并观察其变化,我们就能找出引发点击行为的兴趣。换句话说,我们可以回答反事实问题: 如果这种兴趣不存在,点击行为会怎样?在本文中,我们假设图 1 中的用户在反事实世界中没有电影兴趣,然后观察用户是否还会与这则新闻互动。该新闻在推荐列表中的排名下降得越多,干预带来的影响就越大,这表明对电影的兴趣在激励用户点击方面更为重要。

​ 基于上述分析,我们的工作提出了一种用于用户多兴趣建模的反事实加权方法(CWMI),该方法仅从当前的点击新闻集群中学习兴趣嵌入,并利用反事实推理来模拟不同兴趣对点击行为的重要性。具体来说,CWMI 由两个主要模块组成:分离的多兴趣提取模块和兴趣再加权模块。首先,我们对用户点击的新闻进行聚类,确保具有相似主题的文章根据语义信息紧密分组。然后,为每个聚类的新闻独立计算上下文权重,以确保关注机制只关注当前感兴趣的新闻,从而将学习到的兴趣进行分离。

​ 接下来,在兴趣再加权模块中,我们从两个角度量化了不同兴趣的重要性。从因果角度来看,我们构建了一个因果图来解释用户兴趣对点击的因果影响。通过比较候选条目在反事实世界中排名的下降情况,我们估算出每种兴趣对点击行为的直接影响。从时间角度来看,我们自适应地学习了时间戳在点击行为中的作用,进一步模拟了用户兴趣的演变。

​ 本文的主要贡献如下:

  • 我们设计了一个分离的多兴趣提取器来学习兴趣表示,并从因果的角度建模兴趣对点击行为的影响。
  • 我们提出了一种基于反事实推理的多兴趣再加权方法,以识别用户点击背后的真实动机。

问题定义

用户点击行为的因果关系视图

pACgVln.png

​ 在我们的研究中,我们通过因果图对每个用户的点击行为进行建模,如图 2 所示,其中

标签:CWMI,新闻,论文,用户,笔记,我们,mu,点击,兴趣
From: https://www.cnblogs.com/anewpro-techshare/p/18364600

相关文章

  • 基于nodejs+vue面向移动端的房屋租赁系统的设计与实现[程序+论文+开题]-计算机毕业设
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容研究背景随着城市化进程的加快和人口流动性的增强,房屋租赁市场日益繁荣,成为解决居民居住需求的重要途径。然而,传统的房屋租赁方式往往存在信息不对称、效率低下、交......
  • 基于nodejs+vue面向社区的洗衣店智能服务系统设计与实现[程序+论文+开题]-计算机毕业
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容研究背景随着城市化进程的加速和生活节奏的日益加快,社区居民对于便捷、高效的生活服务需求日益增长。传统洗衣店服务模式面临着顾客排队等待时间长、取送衣物不便、......
  • 基于nodejs+vue面向移动端的线上作业系统的设计与实现App[程序+论文+开题]-计算机毕业
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容研究背景随着信息技术的飞速发展和智能手机的普及,教育领域正经历着深刻的变革。传统的作业提交与批改方式逐渐显现出效率低下、反馈不及时等问题,难以满足现代教育的......
  • 基于flask+vue框架的基于mybatis的医用器械管理系统[开题+论文+程序]-计算机毕设
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着医疗技术的飞速发展,医用器械在医疗机构中的重要性日益凸显。然而,传统的手工或简单信息系统管理方式已难以满足现代医院对器械管理的高......
  • 基于flask+vue框架的基于B_S架构的兰州市旅游网站的设计与实现[开题+论文+程序]-计算
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着互联网的飞速发展和普及,旅游业作为全球经济的重要支柱之一,正经历着前所未有的变革。兰州市,作为甘肃省的省会城市,不仅拥有丰富的历史文......
  • 基于flask+vue框架的车辆理赔系统[开题+论文+程序]-计算机毕设
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着汽车保有量的持续增长,车辆事故频发,车辆保险理赔成为保险公司和车主共同关注的焦点。传统的车辆理赔流程繁琐、效率低下,涉及多方沟通、......
  • 基于flask+vue框架的基于uniapp的酒店订房系统的设计与实现[开题+论文+程序]-计算机毕
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着移动互联网技术的飞速发展和普及,智能手机已成为人们日常生活中不可或缺的一部分,移动应用(App)以其便捷性、实时性等特点,深刻改变着人们......
  • Linux学习笔记:systemd配置文件
    本文更新于2024-08-15,使用systemd252,操作系统为Debian12.6(bookworm)。以为Nginx编写配置文件为例,配置文件路径为/lib/systemd/system/nginxd.service(亦即服务名为nginxd),所有者为root,权限通常为0644。文件内容如下:[Unit]Description=NginxAfter=network.target[Service]......
  • 基于django+vue家政保洁预约系统【开题报告+程序+论文】计算机毕设
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着现代生活节奏的加快和人们生活品质的提升,家政保洁服务已成为城市居民日常生活中不可或缺的一部分。然而,传统家政保洁服务预约方式存在......
  • 基于django+vue家用健身器材租赁管理系统【开题报告+程序+论文】计算机毕设
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着人们健康意识的不断提升,家庭健身逐渐成为了一种流行的生活方式。然而,高昂的健身器材购买成本及空间限制,使得许多家庭难以拥有完备的健......