Towards Representation Alignment and Uniformity in Collaborative Filtering论文阅读笔记

Abstract

现存的问题：

现有的研究主要集中在设计更强大的编码器（如图神经网络）来学习更好的表示。然而，很少有人努力致力于研究CF中表示的期望属性，这对于理解现有CF方法的基本原理和设计新的学习目标很重要。

提出方法：

在本文中，我们从超球面上的对齐和均匀性的角度来衡量CF中的表示质量。我们首先从理论上揭示了BPR损失和这两个性质之间的联系。然后，我们从量化对齐和一致性方面对典型CF方法的学习动态进行了实证分析，结果表明，更好的对齐或均匀性都有助于更高的推荐性能。基于分析结果，提出了一个直接优化这两个属性的学习目标，即DirectAU。

Introduction

为了学习信息丰富的用户和项目表示，对齐和一致性都是非常重要的。如果只考虑对齐，那么通过将所有用户和项映射到同一嵌入中，就很容易实现完全对齐的编码器。在CF中现有的损失函数的目标可以看到，以避免这种琐碎的常数（即，保持均匀性），同时优化以更好的对齐。在实践中，通常使用负样本来实现这一目标。例如，BPR损失将每个正交互与一个随机抽样的负项目配对，并鼓励交互项目的预测得分高于负项目。

在这项工作中，我们分析了CF的对齐和一致性性质的启发，在对比表示学习。我们首先从理论上证明了BPR损失实际上有利于这两个性质，并且完全对齐和均匀的编码器形成了BPR损失的精确最小化器。然后，我们通过中提出的相应的量化指标，对典型CF方法的学习动态的对齐和一致性进行了实证分析。我们发现不同的CF方法显示出不同的学习轨迹，并且更好的对齐或更好的一致性都有利于表示质量。例如，最简单的BPR可以快速收敛到有希望的对齐，并主要在之后提高均匀性。其他先进的方法通过各种技术，如硬负样本和基于图的编码器，可以实现更好的对齐或一致性，从而获得更好的性能。基于分析结果，我们提出了一个直接优化这两个属性的学习目标，称为DirectAU。

本文的主要贡献如下：

我们从理论上证明了完全对齐和均匀的编码器形成了BPR损失的精确最小值。我们还从量化对齐和一致性方面分析了典型CF方法的学习动态。

基于分析结果，提出了一个简单但有效的学习目标，直接优化这两个属性，称为DirectAU

Preliminaries

Alignment and Uniformity

最近，在无监督对比表示学习中的研究表明，表示的质量与两个关键属性高度相关，即对齐和一致性。给定数据\(p_{data}(\cdot)\)的分布和正对\(p_{\mathrm{pos}}(\cdot,\cdot)\)的分布，对齐直接定义为正对的归一化嵌入之间的期望距离：

\(l_{\mathrm{align}}\triangleq\underset{(x,x^+)\sim p_{\mathrm{pos}}}{\operatorname*{\mathbb{E}}}||\tilde{f(x)}-f(\tilde{x^+})||^2,\)

其中，\(f\tilde{(}\cdot)\)表示

标签：论文,CF,笔记,BPR,均匀,一致性,对齐,DirectAU,mathrm
From： https://www.cnblogs.com/anewpro-techshare/p/18180032

cmd 使用笔记
基础rem是注释set命令用于设置变量（注意不要与已存在的环境变量同名）脚本参数echo%%0=%0echo%%1=%1echo%%2=%2echo%%3=%3echo%%4=%4echo%%5=%5REMecho%%1=%1REM上面这句表示：%%1转义为%1,而%1表示第一个命令行参数setlocal开启局部......
Redis 学习笔记
1.redis基本数据结构Redis基础数据结构包括：字符串（String）简单动态字符串列表（List）压缩列表快速链表集合（Set）整型数组字典哈希表有序集合（SortedSet，或称为ZSet）压缩列表跳表哈希（Hash）压缩列表字典哈希表位图（Bitm......
GO语言学习笔记
导图：GO语言四大模块 1.调度器2.netpoll3.内存管理4.GC 垃圾回收算法有很多,主要有:引用计数、标记-清除、分代收集口述，gogc的原理三色标记发+混合写屏障思路尽量减少stw的时间，1.只在开始标记阶段和标记结束阶段使用stw，2.标记阶段采用写屏障，将新建和修改的放入单......
【文化课学习笔记】【物理】功与能
【物理】功与能功基础概念定义一个物体在力的作用下，沿力的方向，通过一段距离（位移），则称这个力做了功。公式功的定义式：\[W=Fx\]这里的\(x\)指的是物体沿力的方向上发生的位移。由于力\(F\)和位移\(x\)都是矢量，所以得到的功\(W\)是标量。注意：虽然\(W\)是标量，但是......
QBXT五一集训DAY4笔记
\(Day\)\(4\)图论图论主要分为\(4\)个方面1.最短路2.二分图匹配3.生成树4.强连通（这个超纲了，不讲）在介绍完理论知识后，我们会逐一讨论它们图图是由点和边构成的边又分为有向边和无向边，因此图可以分为有向图和无向图无向图的度指的是一个点连了多少条边有向图的入度指的......
学习笔记：FFT与拉格朗日插值
多项式的表示形式系数表示与点值表示假设\(f(x)\)是一个\(n\)次多项式，则\(f(x)\)的系数表示为\(f(x)=a_nx^n+a_{n-1}x^{n-1}+\cdots+a_0\)\(f(x)\)的点值表示为\((x_0,f(x_0)),\(x_1,f(x_1)),\dots,(x_n,f(x_n))\)，其中\(\foralli\neqj,\x_i......
推荐几款AI写作工具：智能在线一键文章创作、代码编写、论文等
在五一节的休假期结束之后，广大员工常常体验到了显著的疲劳，对立即恢复工作状态感到抗拒。虽然这种心态在职场中并不罕见，但工作的责任与需求仍需要我们去面对。在这种背景下，如何能够既保证工作效率与质量，又能为自己争取到宝贵的调整时间，成为了许多人士所关心的问题。确实，在长假过后......
mit6.828 - lab2笔记
目标：重点学习内存管理的相关知识，包括内存布局、页表结构、页映射任务：完成内存管理的相关代码lab2中，完全可以跟着实验手册的节奏走，逐步完善内存管理的代码。环境准备：实验2包含以下新的源文件：inc/memlayout.hkern/pmap.ckern/pmap.hkern/kclock.hkern/kclock.cmemlay......
程序员修炼之道阅读笔记2
在工作中我们总会遇到难以解决的问题，这本书给我提供了一个思路。最重要的不是你在盒子里思考，还是在盒子外面思考，而是找到盒子-确定真正的约束，详细一点的解释就是面对棘手的问题时，列出所有在你面前的可能途径，不要排除任何东西，不管它看起来有多正确或微不足道。然后逐一检查每一项。......
程序员修炼之道阅读笔记3
读完《程序员修炼之道：从小工到专家》的第三章和第四章后，我不禁被这本书所揭示的思维方式和工作方法所震撼。这两章的内容围绕着软件开发过程中的团队合作、沟通和管理等方面展开，不仅直指开发中的痛点，还给出了实用的解决方案和建议。在第三章中，作者强调了团队中的每个成员都要成......

DirectAU论文阅读笔记

Towards Representation Alignment and Uniformity in Collaborative Filtering论文阅读笔记

Abstract

Introduction

Preliminaries

Alignment and Uniformity

相关文章

赞助商

阅读排行