首页 > 其他分享 >GZERec论文阅读笔记

GZERec论文阅读笔记

时间:2024-07-16 12:41:21浏览次数:14  
标签:编码器 新闻 推荐 论文 生成器 用户 笔记 GZERec 属性

Generative Adversarial Zero-Shot Learning for Cold-Start News Recommendation论文阅读笔记

Abstract

现存的问题:

​ 新闻推荐模型极其依赖用户与新闻文章之间的交互信息来进行个性化推荐。因此,冷启动问题(CSP)是其面临的最严峻挑战之一。对于新用户或新新闻,它们的性能会急剧下降。

提出方法

​ zero-shot学习有助于在各种应用任务中合成缺失数据的虚拟表示。因此,为新用户或新新闻文章生成虚拟交互行为是解决冷启动问题的一个很有前途的方法。在本文中,我们利用生成对抗zero-shot学习建立了一个框架,即 GAZRec,它能够解决纯新用户或新新闻引起的 CSP 问题。GAZRec 可以灵活地应用于任何神经新闻推荐模型。

Introduction

​ 当前的 CSP 解决方案的总体思路是寻找额外信息,为冷用户/冷项目的推荐决策过程预热。这些额外信息可以是研究领域内或研究领域外冷门用户/项目的一些相关样本。

​ 最近,人们注意到 CSP 的处理方法类似于zero-shot学习(ZSL)。CSP 与 ZSL 类似,都是在缺少数据的情况下进行预测。在 ZSL 中,缺少的是未见类别的样本,而在 CSP 中,缺少的是冷用户/冷项目的用户-项目交互(即行为)。ZSL 使用已见类和未见类的一些基本属性,将已见类的知识转化为未见类的知识。因此,可以生成未见类别的虚拟样本。直观地说,在 CSP 任务中也可以采用这种想法,利用用户/项目属性将旧样本中的行为概括到新样本中,从而获得虚拟行为表示。

​ 我们提出了一种zero-shot学习方法来缓解新闻推荐领域的 CSP,从而解决纯冷用户和冷新闻的 CSP 问题。具体来说,我们利用生成对抗zero-shot学习开发了一个框架,即 GAZRec,该框架可应用于任何基于用户/新闻嵌入的神经新闻推荐模型,通过从冷用户和冷新闻的相应属性数据中构建冷用户和冷新闻的虚拟行为表示来克服 CSP。

​ 实际上,GAZRec 由三座塔组成,即推荐塔、零镜头用户塔和零镜头新闻塔。第一个塔是根据用户和候选新闻的行为表现进行推荐。另外两个塔是通过条件 Wasserstein GAN 开发的,用于为冷用户/新闻生成虚拟表示,该表示以给定的属性数据为条件。本文的贡献概述如下:

  • 我们为新闻推荐系统提出了一个名为 GAZRec 的三塔框架,以条件 Wasserstein GAN 为基础,提供纯冷用户和冷新闻的合成行为表示。它适用于任何基于嵌入的新闻推荐基线,以解决 CSP 问题。
  • 端到端协同训练程序考虑了不同的冷启动情况,使三个塔同时学习,并在冷样本到达时向推荐塔提供来自zero-shot塔的合成表示。

Method

这里先进行一下背景知识的介绍

零镜头学习

​ 零镜头学习(Zero-shot Learning,ZSL)主要解决的是对属于以前未见过的类别的样本进行分类的问题。其目的是利用共享属性空间(其中包含一些辅助数据),将知识从有训练数据的已见类别转移到未见类别。针对图像分类问题的现有 ZSL 模型的思路可分为三类: 1) 将视觉空间映射到属性空间 ;2) 将属性空间映射到视觉空间 ;3) 将两者映射到共享潜空间。因此,视觉样本可以被预测为未见类别。最近,变分自动编码器(VAE)和生成对抗网络(GAN)等生成模型被大量用于在许多零镜头分类问题中实施映射策略,因为它们能够有效地解决数据不足的问题。本文基于 GAN 构建了 GAZRec 框架的zero-shot塔,将用户/新闻的属性特征映射到其行为特征上。

总体结构

​ 拟议的 GAZRec 框架结构如下图所示。其中有三个塔:推荐者塔、zero-shot用户塔和zero-shot新闻塔。中间的推荐塔采用用户和新闻表征,通过点击预测模块计算用户对新闻的偏好程度预测得分。这个推荐塔可以用任何基于嵌入的新闻推荐模型来实现。如果用户/新闻是热的,则由位于推荐塔中的用户/新闻编码器计算表征;反之,如果是冷的,则由位于左侧和右侧零镜头用户/新闻塔中的用户/新闻生成器获得表征。

pkImPat.png

​ 由于缺乏冷用户的行为数据,用户编码器无法生成冷用户的表征,因此零镜头用户塔旨在为冷用户生成合成行为表征。同样,"零镜头新闻塔 "也用于生成未被用户点击的冷新闻文章的合成表征。请注意,冷暖新闻的表征学习是不同的。冷/暖新闻门控制着新闻表征的生成方式。对于暖新闻,门切换到中间塔的编码器,该编码器使用新闻与用户之间的交互。如与用户编码器的连接所示,"点击新闻 "可以多次包含一条热门新闻,因此暖新闻表示法是通过用户交互历史学习的,与 "冷 "新闻不同。使用 "塔 "而不是新闻编码器来处理 "冷 "新闻,是为了在其表征中考虑从类似的 "暖 "新闻中转移过来的虚拟行为。这两个 "zeroshot 塔 "是由生成式对抗网络实现的,特别是条件 Wasserstein GAN,用于合成以给定属性数据为条件的行为表征。三个塔的共同训练使该框架不受用户和新闻 CSP 的影响。

问题定义

暖和冷新闻/用户的符号

​ 我们认为暖的新闻/用户有至少十条以上的交互,而冷的是没有任何交互。以用户为例,暖用户表示为\(i_w=\{r_w,h_w,t\}\),冷用户表示为:\(i_c=\{r_c,h_c=\phi,t\}\),其中r是一个用户属性向量,其大小等于主要新闻类别的数量(

标签:编码器,新闻,推荐,论文,生成器,用户,笔记,GZERec,属性
From: https://www.cnblogs.com/anewpro-techshare/p/18304955

相关文章

  • AIGC降痕:论文降AI率的高效工具与方法
    在数字化时代,AI正以其卓越的能力重塑学术写作的面貌。AI论文工具的兴起,为研究者们提供了前所未有的便利,但同时也引发了关于学术诚信和原创性的热烈讨论。当AI辅助写作成为常态,如何确保论文的独创性和个人思想的体现,成为了一个亟待解决的问题。接下来我将为大家推荐一款AIGC降......
  • AI降痕工具揭秘:降低论文AI痕迹的有效策略
    随着人工智能技术的突飞猛进,AI生成内容(AIGC)已被广泛用于学术论文撰写中,提高效率同时也带来了原创性的挑战。面对日益严格的学术审查,一个突出的问题是:使用AI代写的论文能否通过内容检测?因此查重和查AIGC疑似度都至关重要!查重是基于文本相似度来检测论文是否存在重复或抄袭的问......
  • java学习笔记
    //单行注释/**/多行注释/** */文档注释byte:-128~127short:正负三万int:正负21亿long:如果表示的数超过int需要加L 123456789123456Lfloat:后面加fdouble:char:单引号引起来的单个字符增强for循环:for(intnum:arr)创建新的构造器,要保留空构造器,构造器也......
  • 动手学深度学习6.4 多输入多输出通道-笔记&练习(PyTorch)
    以下内容为结合李沐老师的课程和教材补充的学习笔记,以及对课后练习的一些思考,自留回顾,也供同学之人交流参考。本节课程地址:21卷积层里的多输入多输出通道【动手学深度学习v2】_哔哩哔哩_bilibili本节教材地址:6.4.多输入多输出通道—动手学深度学习2.0.0documentation(......
  • DIY系列——自制简易笔记本电脑散热器
    前言:为什么要自制笔记本电脑散热器?夏天到了,电脑的使用频率也在增加。尤其是笔记本电脑,长时间运行后很容易发热,影响性能和寿命。市场上有很多散热器产品,但价格不菲且效果参差不齐。如果你动手能力强,又想节省一笔开支,自制一个简易的笔记本电脑散热器是一个不错的选择。材料准备......
  • 基于web的宠物商城设计与实现 毕业论文终稿+初稿+修改版论文+开题报告+答辩PPT+论文检
    !!!有需要的小伙伴可以通过文章末尾名片咨询我哦!!! ......
  • 基于Java中的SSM框架实现娱乐影视公司管理系统项目【项目源码+论文说明】
    基于Java中的SSM框架实现娱乐影视公司管理系统演示摘要电脑的出现是一个时代的进步,不仅仅帮助人们解决了一些数学上的难题,如今电脑的出现,更加方便了人们在工作和生活中对于一些事物的处理。应用的越来越广泛,通过互联网我们可以更方便地进行办公,也能够在网上就能处理很多日......
  • 基于Java中的SSM框架实现在线考试系统项目【项目源码+论文说明】
    摘要本楚水高中在线考试系统是针对目前楚水高中在线考试的实际需求,从实际工作出发,对过去的楚水高中在线考试系统存在的问题进行分析,结合计算机系统的结构、概念、模型、原理、方法,在计算机各种优势的情况下,采用目前最流行的B/S结构和java中流行的MVC三层设计模式和eclipse编辑......
  • 信创学习笔记(三),信创之操作系统OS思维导图
    创作不易只因热爱!!热衷分享,一起成长!“你的鼓励就是我努力付出的动力”title!!#f1c232点击上方蓝色小字即可一键关注!!!!#f1c232创作不易只因热爱!!:::primary!18热衷分享,一起成长!:::^**你好呀,我是卫码士。一个医信行业工程师,喜欢学习,喜欢搞机,喜欢......
  • 杂乱无章的sql注入学习笔记(应该会持续更新)
    关于注入点:注入点不仅仅有.php?id=xxx只要是后端有交互的点都可能存在sql注入,黑盒情况下不知道后端,所以得fuzz,有的数据库会对你的cookieua进行查询操作,甚至是别的请求头,所以要都fuzz试试.甚至对图片的查询操作都可能存在注入点,思路要打开.学习sql语句:参考SQL通配符......