首页 > 其他分享 >RecDCL论文阅读笔记

RecDCL论文阅读笔记

时间:2024-05-15 10:33:41浏览次数:23  
标签:BCL 嵌入 mathbf CL 论文 笔记 目标 FCL RecDCL

RecDCL: Dual Contrastive Learning for Recommendation论文阅读笔记

Abstract

提出问题:

​ 现有的基于cl的方法大多集中于批处理的对比,没有利用特征维度中潜在的规律性。这导致了在用户和项目的表示学习过程中的冗余解决方案。

解决方法:

​ 在这项工作中,我们研究了如何同时使用批处理CL(BCL)和特性处理CL(FCL)作为推荐。我们从理论上分析了BCL和FCL之间的关系,发现BCL和FCL的结合有助于消除冗余解,但永远不会错过最优解。我们提出了一个双对比学习推荐框架-RecDCL。在RecDCL中,FCL目标旨在消除用户-项目正对上的冗余解,并使用多项式核优化用户和项目内的均匀分布,从而使表征能够有正交性;BCL目标用于在输出向量上生成对比嵌入,以增强表示的鲁棒性。

Introduction

​ 一般来说,基于cl的协同过滤方法侧重于批处理目标函数。批处理目标的目标是最大限度地提高正对(对角线)之间嵌入的相似性,同时最小化负对之间嵌入的相似性(非对角线)。一种典型的基于批处理的CF方法应用BPR损失预测用户的偏好在多个交互网络平台,如图神经网络(gnn)的模型和基于自监督学习(SSL)的模型。特别是,这些方法通常同时需要用户-项目交互对和由负抽样产生的负对等物。然而,由于负抽样方案可能会错误地将“正但未观察到的”对视为负对,因此这些方法的性能存在严重的限制。此外,一些最近的批处理CL(BCL)推荐方法指出,Web推荐系统在不需要负抽样的情况下可以获得更稳健的改进。然而,这些BCL方法可能会导致简单的常数解决方案,因为它们不能利用来自Web平台的用户和项目的嵌入信息,如图1所示。FCL就是基于特征的对比学习

pkmuYlt.png

​ 为了解决这个问题,我们研究了不同领域的基于cl的方法,并在表1中总结了它们的关键差异。CL的目标函数通常分为两类:分组目标和特征目标。在特征目标方面,现有的工作在计算机视觉(CV)领域引起了充分的关注。特别是,特征级CL方法,已经致力于研究嵌入向量的重要性,并提出新的特征级目标函数。这些方法通过在特征维度上将组件去关联来最大限度地提高嵌入的可变性,这可以避免崩溃并产生期望的性能。然而,如图1所示,这些FCL方法忽略了在批处理目标中提供的重要信息,并导致了正交分布。有鉴于此,就有一个有意义的问题出现了: 在自监督推荐中,批次性 CL 和特征性 CL 之间是否存在有效的优化目标?关于这一点,CL4CTR 提出了特征对齐和字段均匀性,并屏蔽了特征和维度信息,以解决 CTR 预测中特征频率的 "长尾 "分布问题。然而,以往的研究只探讨了 BCL 和 FCL 之间的联系,缺乏将它们联系起来的本机解释,也很少有人去了解将它们结合起来的效果。

​ 为了回答上述问题,我们研究了批处理CL和特征处理CL之间的目标的原生联系(图1和观察3.1),并从理论和实验的角度提出了一个通过使用它们(观察3.2)来显示合作利益的视角。基于这些分析,我们提出了一种双CL方法,称为RecDCL。RecDCL联合了自监督建议的特性级目标和批处理级目标。一方面,RecDCL通过消除用户和项目之间的冗余来优化特性级的CL目标(FCL)。特别是,FCL通过测量一个互相关矩阵来捕获用户-项目正对的分布,并通过一个多项式核来优化用户(项目)的分布。另一方面,作为一个批处理维度,我们设计了基本的BCL和高级的BCL来增强表示的鲁棒性,后者将历史嵌入与当前嵌入相结合,通过在线和目标网络生成对比视图。大量的实验验证了RecDCL的性能优于最先进的基于gnn和基于ssl的模型(在Beauty上高达5.34%),显示了联合优化特性和批处理目标的有效性。

​ 本文的主要贡献如下:

  • 我们从理论上揭示了特征级CL和批处理级CL之间目标的原生联系,并从理论和实验的角度使用它们,证明了它们的合作效益。
  • 基于上述分析,我们提出了一种名为RecDCL的双CL方法,并以特征级级别和分组级别的方式实现联合训练目标来学习信息表示。

理解BCL和FCL

​ 我们揭示了两个CL原理之间的原生联系,并发现结合BCL和FCL直观地形成了一个更好的正则化,可以受益于高嵌入维数。

我们的解释

​ 本部分旨在探讨两个问题:BCL和FCL之间的关系是什么。以及为什么将它们结合起来会有效。

​ 从直观上看,BCL 和 FCL 具有相同的机制,即拉近正数对,同时推远负数对。两者的区别在于构成配对的对象不同。BCL 所考虑的对象是样本,而 FCL 所考虑的对象是特征。在优化模型时,这种差异似乎赋予了这两个 CL 目标不同的效果。有趣的是,在某些条件下,它们会引导模型向相似的方向优化。通过 A.1 中提供的理论分析,我们得出以下结论。

​ 观察3.1: 如果对这两个嵌入矩阵进行标准化处理(即它们的均值为零,标准差为一),那么 BCL 和 FCL 的目标就可以近似地相互转化

​ 观察结果 3.1 表明,BCL 和 FCL 之间存在着内在联系。一个后续问题是,是否有必要同时使用它们?下面我们将从一个角度来部分回答这个问题。我们的观点的关键在于考虑负对在这两个目标中的作用。就 BCL 而言,我们已经知道,将负配对推远实际上近似于鼓励样本在嵌入空间中均匀分布,这与正配对约束一起隐性地扩大了分类余量。对于FCL,在特征级空间中推开负对的原因可能并不明显。虽然信息论已经做出了一些解释,但一个更直观的解释可以帮助理解这种正则化如何有助于最终的嵌入。因此,我们提供了一个说明性的例子来解释图1中BCL、FCL和BCL+FCL的影响,主要观察结果见观察3.2。

​ 观察3.2: 对于归一化样本嵌入,BCL 和 FCL 将负对推开对嵌入学习的影响不同。对于 BCL,它鼓励样本在嵌入空间中均匀分布。而对于 FCL,它倾向于使样本的表示正交。这种差异主要是因为 BCL 鼓励负对的内积(在批次维度上)越小越好;而 FCL 只强制要求负对的内积(在特征维度上)接近于零,这就暗中鼓励样本的表示(在批次维度上)是正交的。 如果我们将 BCL 和 FCL 结合起来,将负对推开不仅会促使样本表征在嵌入空间中均匀分布,还有助于消除冗余解 。随着嵌入维度的增加,这种规律性有利于嵌入学习。

推荐的直觉

​ 为了验证第3.2节中的规律性的有效性,我们进行了一项消融研究,看看BCL和FCL的结合是否能产生更理想的嵌入分布。具体来说,我们比较了在Yelp数据集上的FCL、BCL和BCL+FCL之间的嵌入的平均熵。设x表示一个样本的嵌入。我们通过两种方法选择x的top-

标签:BCL,嵌入,mathbf,CL,论文,笔记,目标,FCL,RecDCL
From: https://www.cnblogs.com/anewpro-techshare/p/18193292

相关文章

  • 软件测评师笔记10--安全测试相关
    常见安全攻击手段1、冒充:一个实体假装成一个不同的实体,常和消息篡改和重演一起使用2、重演:当消息为了产生非授权效果而被重复时,就出现重演了3、消息篡改:数据所传送的内容被改变而未被发觉,并导致非授权后果4、服务拒绝:通过向认证/授权服务发送大量虚假请求,占用系统带宽造成关键......
  • 【论文笔记-44~】多语言实体链接
    ~20111.Cross-LanguageEntityLinking文章核心观点:本文介绍了一种新的跨语言实体链接任务,旨在将不同语言的文档中的命名实体与英文知识库中的实体描述进行匹配。作者提出了一种利用统计音译和跨语言信息检索的方法来解决这一任务,并在21种语言上进行了实验验证。实验结果显示,......
  • r3 mini 折腾笔记
     刷机相关  先切换到nand开机下恢复原厂固件echo0>/sys/block/mmcblk0boot0/force_roddif=bl2_emmc-r3mini.imgof=/dev/mmcblk0boot0ddif=mtk-bpi-r3mini-EMMC-20230719.imgof=/dev/mmcblk0成功后刷入im固件ddif=gpt.binof=/dev/mmcblk0bs=512seek=0count=34......
  • 《Linux内核完全注释》学习笔记:2.1 Linux内核模式和体系结构
    2.1Linux内核模式和体系结构操作系统主要由4部分组成:硬件、操作系统内核、操作系统服务用户应用程序图2-1操作系统组成部分用户应用程序:指那些字处理程序、互联网浏览器程序或用户自行编制的各种应用程序;操作系统服务程序:指向用户提供的服务,被看作是操作系统部分功能......
  • 《Linux内核完全注释》学习笔记:2.2 Linux中断机制
    在使用80x86组成的PC中,采用了两片8259A可编程中断控制芯片。每片可以管理8个中断源。通过多片的级联方式,能构成最多管理64个中断向量的系统。在PC/AT系列兼容机中,使用了两片8259A芯片,共可管理15级中断向量。其级联示意图见图2-5。其中从芯片的INT引脚连接到主芯片的IR2引......
  • 论文阅读:融合外部知识的生成式实体关系联合抽取方法
    祝振赫,武虹,高洁,等.融合外部知识的生成式实体关系联合抽取方法[J].计算机技术与发展,2023,33(08):124-130.引言基于传统的机器学习的关系抽取方法主要通过领域专家制定实体关系范式,通过统计和规则等方式进行抽取。许多经典的关系抽取方法都是使用监督学习来获得较好的性能表......
  • 软件评测师笔记09--性能测试相关
    并发性能测试过程是一个负载测试和压力测试的过程,逐渐增加并发负载,直到系统的瓶颈或不能接收到的性能点,通过性能指标、资源监控指标来确定系统并发性能的过程 性能测试类型疲劳强度测试:采用稳定运行情况下能够支持的最大并发用户数,持续执行一段时间业务,保证达到系统疲劳强度......
  • Laravel实战笔记
    Laravel中默认时间格式为:"updated_at":"2024-05-14T03:16:43.000000Z"Date要修改Laravel模型中updated_at字段的输出格式,可以通过以下两种方式实现:使用toDateString()方法:$user=User::find(1);$updatedAt=$user->updated_at->toDateString();//输出:"2024......
  • 项目管理之八大绩效域-------笔记(一)
    绪论一、核心术语1.预期目标给干系人绩效域一个KPI(预期目标)来对其衡量其做的好不好,这个KPI就叫做预期目标.2.指标及检查方法要对目标是否做好进行评价,这个评价就是指标及检查方法3.绩效要点为了完成预期目标的三个KPI,应该做什么工作或者应该关注哪几个方面的活动......
  • java基础 韩顺平老师的 枚举和注解 自己记的部分笔记
    424,枚举类引出 packagecom.hspedu.enum_;publicclassEnumeration{publicstaticvoidmain(String[]args){//使用Seasonspring=newSeason("春天","温暖");Seasonsummer=newSeason("夏天","炎热&quo......