首页 > 其他分享 >uCTRL论文阅读笔记

uCTRL论文阅读笔记

时间:2024-05-19 22:09:27浏览次数:22  
标签:函数 论文 用户 笔记 无偏 ui 对齐 mathcal uCTRL

uCTRL: Unbiased Contrastive Representation Learning via Alignment and Uniformity for Collaborative Filtering论文阅读笔记

这篇文章应该是关于无偏推荐的

Abstract

​ 由于协作过滤(CF)模型的隐式用户反馈偏向于流行的项目,CF模型倾向于产生带有流行偏差的推荐列表。先前的研究使用了逆倾向加权(IPW)或因果推理来缓解这一问题。然而,他们只使用点态或成对损失函数,而忽略了采用对比损失函数来学习有意义的用户和项表示。在本文中,我们提出了无偏压缩表示学习(uCTRL),优化了CF模型的InfoNCE损失函数的对齐和一致性函数。具体来说,我们制定了一个在uCTRL中使用的无偏对齐函数。我们还设计了一种新的IPW估计方法,消除了用户和项目的偏差。

Introduction

​ 因为用户-项目交互通常偏向于流行的用户/项目,所以学习无偏见的用户/项目表示并非简单。用户-项目交互矩阵自然地遵循帕累托数据分布。虽然一些头部项目经常与用户互动,但许多尾部项目很少与用户互动。因此,CF模型很容易偏向于流行的用户/项目。因此,有偏差的用户/项目表示偏离了真正的用户偏好,导致较差的泛化性能。更糟糕的是,它们可以通过过度推荐流行商品而带来偏见放大。

​ 现存方法的一些局限性有:

  • (i)现有的关于在推荐系统中消除流行偏差的研究尚未积极地纳入对比损失函数,尽管它已被广泛地用于不同领域的更好的表示学习。
  • (ii)现有的去偏策略在估计倾向权重时没有考虑用户和项目,即使推荐模型从用户/项目交互中学习潜在的嵌入向量。

​ 本文提出了无偏压缩表示学习(uCTRL)。基于DirectAU ,对比表示学习被分解为两个损失函数:对齐和一致性。对齐函数表示正用户-项目交互的用户和项目向量之间的距离。一致性函数表示每个用户和项目分布的平均距离之和。虽然DirectAU 比现有的点级和成对损失函数显示出更好的性能,但可以观察到,对齐函数仍然偏向于用户/项目的流行程度

​ 为了解决这个问题,我们提出了一种无偏对齐函数,并设计了一种估算 IPW 的新方法,在对齐函数中去除了用户和项目流行度。

​ 本文的贡献有:

  • 我们引入了一种新的损失函数的无偏对比表示学习(uCTRL)通过对齐和一致性函数。
  • 我们还开发了一种新的倾向加权估计方法来消除用户/项目的偏差,并将其纳入无偏对齐函数中。

Background

​ 现有的研究将用户项目点击分解为两个组成部分:观察和相关性。如果用户知道该项目,并且她也对该项目感兴趣,那么用户就会点击一个项目。

​ \(P(y_{ui}=1)=P(o_{ui}=1)\cdot P(r_{ui}=1)=\omega_{ui}\cdot\rho_{ui}.\)

​ \(o_{ui}\)和\(r_{ui}\)它们分别代表了观察的伯努利随机变量和相关性的伯努利随机变量。为简单起见,让

标签:函数,论文,用户,笔记,无偏,ui,对齐,mathcal,uCTRL
From: https://www.cnblogs.com/anewpro-techshare/p/18200834

相关文章

  • 软考高项八大绩效域及论文纲要
    转载请注明出处:不确定性绩效域软考高项(高级信息系统项目管理师)中,不确定性的绩效域要点包括风险、模糊性、复杂性和不确定性本身。以下是对这些绩效要点特征的说明,以及项目经理在应对这些要点时的常用实践:1.风险特征:风险是指潜在的不利事件或情况,可能会......
  • 【PB案例学习笔记】-02 目录浏览器
    写在前面这是PB案例学习笔记系列文章的第二篇,该系列文章适合具有一定PB基础的读者,通过一个个由浅入深的编程实战案例学习,提高编程技巧,以保证小伙伴们能应付公司的各种开发需求。文章中设计到的源码,小凡都上传到了gitee代码仓库https://gitee.com/xiezhr/pb-project-example.git......
  • FFmpeg开发笔记(二十二)FFmpeg中SAR与DAR的显示宽高比
    ​《FFmpeg开发实战:从零基础到短视频上线》一书提到:通常情况下,在视频流解析之后,从AVCodecContext结构得到的宽高就是视频画面的宽高。然而有的视频文件并非如此,如果按照AVCodecContext设定的宽高展示视频,会发现画面被压扁或者拉长了。比如该书第10章源码playsync.c在播放meg.vob时......
  • 数据结构学习笔记-判断是否为无向图
    判断是否为无向图问题描述:设图G用邻接矩阵A[n+1,n+1]表示,设计算法以判断G是否是无向图。【算法设计思想】遍历矩阵使用两层嵌套的for循环,外层循环变量......
  • 读人工智能时代与人类未来笔记07_人工智能往何处去
    1.      人工智能的限制和管理1.1.        在前几代人工智能中,人们将社会对现实的某种理解提炼为程序代码,而当下的机器学习人工智能与之不同,它们在很大程度上是靠自己对现实进行建模1.2.        虽然开发人员可以检验人工智能生成的结果,但人工智能并......
  • Living-Dream 系列笔记 第57期
    hashfunction(哈希函数)将一个规模很大的字符串用特定规则转化为特定数值,这种特定规则,我们称之为hashfunction。hashvalue(哈希值)字符串由哈希函数生成的数值。hashcollision(哈希冲突)多个字符串得到了相同的hashvalue。算法竞赛中的hashfunction通常将字符......
  • 软考高项十大管理领域及论文纲要
    转载请注明出处:1.整合管理整合管理是项目管理中的关键过程之一,它涉及协调项目的各个方面以确保项目顺利进行。制定项目章程过程:明确项目与组织战略目标之间的直接联系,确立项目的正式地位,展示组织对项目的承诺。作用:为项目提供基础框架和权威,确保项目与组织的战略目标保......
  • 热更学习笔记10~11----lua调用C#中的List和Dictionary、拓展类中的方法
    [10]Lua脚本调用C#中的List和Dictionary调用还是在上文中使用的C#脚本中Student类:lua脚本:print("------------访问使用C#脚本中的List和Dictionary-----------")student.list:Add(2024)student.list:Add(5)student.list:Add(18)locallistSize=student.list.Countprin......
  • 旧笔记本装UbuntuServer用作家庭媒体服务器
    目标:将UbuntuServer系统安装到U盘,笔记本从U盘启动自动进入系统,共享笔记本USB外接大容量硬盘中的电影到家庭局域网。准备:1.ventoy引导U盘2.UbuntuServer20.04LTS镜像ISO3.U盘16G或更大步骤:1.16GU盘格式化为FAT32后插入笔记本;2.下载的ISO镜像放入ventoy引导U盘,设置笔记本......
  • 【论文笔记-55~】多语言实体对齐
    2012~2018MultilingualKnowledgeGraphEmbeddingsforCross-lingualKnowledgeAlignment文章核心观点:这篇文章介绍了一种名为MTransE的多语言知识图谱嵌入模型,旨在实现跨语言知识对齐。该模型由知识模型和匹配模型两部分组成,其中知识模型采用TransE对每个语言的实体和关系......