Generative Adversarial Zero-Shot Learning for Cold-Start News Recommendation论文阅读笔记
Abstract
现存的问题:
新闻推荐模型极其依赖用户与新闻文章之间的交互信息来进行个性化推荐。因此,冷启动问题(CSP)是其面临的最严峻挑战之一。对于新用户或新新闻,它们的性能会急剧下降。
提出方法
zero-shot学习有助于在各种应用任务中合成缺失数据的虚拟表示。因此,为新用户或新新闻文章生成虚拟交互行为是解决冷启动问题的一个很有前途的方法。在本文中,我们利用生成对抗zero-shot学习建立了一个框架,即 GAZRec,它能够解决纯新用户或新新闻引起的 CSP 问题。GAZRec 可以灵活地应用于任何神经新闻推荐模型。
Introduction
当前的 CSP 解决方案的总体思路是寻找额外信息,为冷用户/冷项目的推荐决策过程预热。这些额外信息可以是研究领域内或研究领域外冷门用户/项目的一些相关样本。
最近,人们注意到 CSP 的处理方法类似于zero-shot学习(ZSL)。CSP 与 ZSL 类似,都是在缺少数据的情况下进行预测。在 ZSL 中,缺少的是未见类别的样本,而在 CSP 中,缺少的是冷用户/冷项目的用户-项目交互(即行为)。ZSL 使用已见类和未见类的一些基本属性,将已见类的知识转化为未见类的知识。因此,可以生成未见类别的虚拟样本。直观地说,在 CSP 任务中也可以采用这种想法,利用用户/项目属性将旧样本中的行为概括到新样本中,从而获得虚拟行为表示。
我们提出了一种zero-shot学习方法来缓解新闻推荐领域的 CSP,从而解决纯冷用户和冷新闻的 CSP 问题。具体来说,我们利用生成对抗zero-shot学习开发了一个框架,即 GAZRec,该框架可应用于任何基于用户/新闻嵌入的神经新闻推荐模型,通过从冷用户和冷新闻的相应属性数据中构建冷用户和冷新闻的虚拟行为表示来克服 CSP。
实际上,GAZRec 由三座塔组成,即推荐塔、零镜头用户塔和零镜头新闻塔。第一个塔是根据用户和候选新闻的行为表现进行推荐。另外两个塔是通过条件 Wasserstein GAN 开发的,用于为冷用户/新闻生成虚拟表示,该表示以给定的属性数据为条件。本文的贡献概述如下:
- 我们为新闻推荐系统提出了一个名为 GAZRec 的三塔框架,以条件 Wasserstein GAN 为基础,提供纯冷用户和冷新闻的合成行为表示。它适用于任何基于嵌入的新闻推荐基线,以解决 CSP 问题。
- 端到端协同训练程序考虑了不同的冷启动情况,使三个塔同时学习,并在冷样本到达时向推荐塔提供来自zero-shot塔的合成表示。
Method
这里先进行一下背景知识的介绍
零镜头学习
零镜头学习(Zero-shot Learning,ZSL)主要解决的是对属于以前未见过的类别的样本进行分类的问题。其目的是利用共享属性空间(其中包含一些辅助数据),将知识从有训练数据的已见类别转移到未见类别。针对图像分类问题的现有 ZSL 模型的思路可分为三类: 1) 将视觉空间映射到属性空间 ;2) 将属性空间映射到视觉空间 ;3) 将两者映射到共享潜空间。因此,视觉样本可以被预测为未见类别。最近,变分自动编码器(VAE)和生成对抗网络(GAN)等生成模型被大量用于在许多零镜头分类问题中实施映射策略,因为它们能够有效地解决数据不足的问题。本文基于 GAN 构建了 GAZRec 框架的zero-shot塔,将用户/新闻的属性特征映射到其行为特征上。
总体结构
拟议的 GAZRec 框架结构如下图所示。其中有三个塔:推荐者塔、zero-shot用户塔和zero-shot新闻塔。中间的推荐塔采用用户和新闻表征,通过点击预测模块计算用户对新闻的偏好程度预测得分。这个推荐塔可以用任何基于嵌入的新闻推荐模型来实现。如果用户/新闻是热的,则由位于推荐塔中的用户/新闻编码器计算表征;反之,如果是冷的,则由位于左侧和右侧零镜头用户/新闻塔中的用户/新闻生成器获得表征。
由于缺乏冷用户的行为数据,用户编码器无法生成冷用户的表征,因此零镜头用户塔旨在为冷用户生成合成行为表征。同样,"零镜头新闻塔 "也用于生成未被用户点击的冷新闻文章的合成表征。请注意,冷暖新闻的表征学习是不同的。冷/暖新闻门控制着新闻表征的生成方式。对于暖新闻,门切换到中间塔的编码器,该编码器使用新闻与用户之间的交互。如与用户编码器的连接所示,"点击新闻 "可以多次包含一条热门新闻,因此暖新闻表示法是通过用户交互历史学习的,与 "冷 "新闻不同。使用 "塔 "而不是新闻编码器来处理 "冷 "新闻,是为了在其表征中考虑从类似的 "暖 "新闻中转移过来的虚拟行为。这两个 "zeroshot 塔 "是由生成式对抗网络实现的,特别是条件 Wasserstein GAN,用于合成以给定属性数据为条件的行为表征。三个塔的共同训练使该框架不受用户和新闻 CSP 的影响。
问题定义
暖和冷新闻/用户的符号
我们认为暖的新闻/用户有至少十条以上的交互,而冷的是没有任何交互。以用户为例,暖用户表示为\(i_w=\{r_w,h_w,t\}\),冷用户表示为:\(i_c=\{r_c,h_c=\phi,t\}\),其中r是一个用户属性向量,其大小等于主要新闻类别的数量(
标签:编码器,新闻,推荐,论文,生成器,用户,笔记,GZERec,属性 From: https://www.cnblogs.com/anewpro-techshare/p/18304955