首页 > 其他分享 >NPA论文阅读笔记

NPA论文阅读笔记

时间:2024-07-15 15:07:25浏览次数:22  
标签:信息量 新闻 论文 NPA 用户 笔记 词语 不同 表征

NPA: Neural News Recommendation with Personalized Attention论文阅读笔记

这个又是一篇很老但是很经典的论文,这里来读一下

Abstract

现存的问题:

​ 不同的用户通常有不同的兴趣爱好,同一用户也可能有不同的兴趣爱好。因此,不同的用户点击同一篇新闻时可能会关注不同的方面。

提出方法:

​ 本文提出了一种具有个性化关注的神经新闻推荐模型(NPA)。我们方法的核心是新闻表示模型和用户表示模型。在新闻表征模型中,我们使用 CNN 网络根据标题学习新闻文章的隐藏表征。在用户表征模型中,我们根据用户点击新闻文章的表征来学习用户表征。

​ 由于不同的单词和不同的新闻文章对于代表新闻和用户来说可能具有不同的信息量,因此我们建议应用单词和新闻级别的关注机制来帮助我们的模型关注重要的单词和新闻文章。此外,同一新闻文章和同一词语对不同用户的信息量也可能不同。因此,我们提出了一种个性化关注网络,利用用户 ID 的嵌入来生成单词和新闻级关注的查询向量。

Introduction

​ 在新闻推荐场景中有两个共同点。首先,用户点击的所有新闻并不能反映用户的偏好。此外,同一新闻对不同用户的信息量也应不同。其次,新闻标题中的不同词语通常对学习新闻表征具有不同的信息量。此外,新闻标题中的相同词语对于揭示不同用户的偏好也可能具有不同的信息量。因此,对不同用户而言,词语和新闻的不同信息量建模可能有助于学习更好的用户表征,从而实现准确的新闻推荐。

​ 在本文中,我们提出了一种用于新闻推荐的个性化关注神经方法(NPA)。我们方法的核心是新闻表示模型和用户表示模型。在新闻表征模型中,我们使用 CNN 网络学习新闻标题的上下文表征;在用户表征模型中,我们从用户点击的新闻中学习用户表征。由于在学习新闻和用户表征时,不同的词语和新闻文章通常具有不同的信息量,因此我们建议在词语和新闻层面应用注意力机制,以选择并突出信息量大的词语和新闻。此外,由于不同用户对相同词语和新闻的信息量可能不尽相同,我们提出了个性化关注网络,将用户 ID 嵌入作为词语级和新闻级关注网络的查询向量,根据用户偏好对重要词语和新闻进行差异化关注。

Method

​ 模型的框架如下:

pk5hCAe.png

​ 在本节中,我们将介绍针对新闻推荐的个性化关注 NPA 方法。我们的模型有三个主要模块。第一个是新闻编码器,旨在学习新闻的表征。第二个模块是用户编码器,旨在根据用户点击新闻的表征学习用户表征。第三个是点击预测器,用于预测一系列候选新闻的点击得分。在新闻编码器和用户编码器模块中,我们在词级和新词级应用了个性化注意力网络,以根据用户偏好选择不同的信息词和新闻。我们的方法架构如上图所示。下面我们将详细介绍我们的方法

新闻编码器

​ 这里分为三个模块

​ 第一个模块是新闻编码器,这里就不多解释了。

​ 第二个模块是CNN,是用来捕捉新闻标题中单词的局部语境来学习其上下文表征。非常经典,具体实现见论文

​ 第三个模块是单词级注意力网络,具体实现如下图:

pk5oJG4.png

​ 在普通非个性化注意力网络中,注意力权重只是通过一个固定的注意力查询向量根据输入表示序列计算出来的,并没有将用户的偏好纳入其中。为了模拟每个词对不同用户推荐的信息量,我们建议使用个性化关注网络,根据用户偏好识别并突出显示新闻标题中的重要词语。

​ 实现的具体公式见论文,这个也是比较简单的注意力机制。

用户编码器

​ 我们方法中的用户编码器模块旨在从用户点击新闻的表征中学习用户表征。在该模块中,新闻级个性化关注模块用于建立信息丰富的用户表征。在学习用户表征时,同一用户点击的新闻通常具有不同的信息量。为了模拟同一新闻对不同用户的不同信息量,我们还对同一用户点击新闻的表征应用了个性化注意力机制。最后获得用户向量。

​ 这个个性化注意力机制也比较简单,具体实现见论文。

点击预测器

​ 用的是比较传统的损失函数计算方式

\(\hat{y}_{i}^{\prime}=\mathbf{r}_{i}^{'T}\mathbf{u},\\\hat{y}_{i}=\frac{\exp(\hat{y}_i^{\prime})}{\sum_{j=0}^K\exp(\hat{y}_j^{\prime})}\)

\(\mathcal{L}=-\sum_{y_j\in\mathcal{S}}\log(\hat{y}_j),\)

总结

​ 这篇文章因为比较老,是五年前的论文了,方法都比较传统,但是写的比较清晰,这里贴一下原文的conclusion

在本文中,我们提出了一种具有个性化关注(NPA)的神经新闻推荐方法。在我们的 NPA 方法中,我们使用 CNN 从标题中学习新闻表示模型,并使用用户表示模型从用户点击的新闻中学习用户表示。由于不同的单词和新闻文章通常对表示新闻和用户具有不同的信息量,我们建议在单词和新闻中同时应用注意力机制,以帮助我们的模型关注重要的单词和新闻文章。此外,由于同样的词语和新闻对不同用户的重要性不同,我们提出了一种个性化的注意力网络,利用用户 ID 的嵌入作为词语级和新闻级注意力网络的查询。

标签:信息量,新闻,论文,NPA,用户,笔记,词语,不同,表征
From: https://www.cnblogs.com/anewpro-techshare/p/18303195

相关文章

  • 硬件开发笔记(二十六):AD21导入电感原理图库、封装库和3D模型
    前言  电阻,电容,电感还有各种基础的电子元器件、连接器和IC构成了各种实现功能的电子电路。  本篇介绍电感,并将贴片电感封装导入AD21,预览其三维模型。 贴片电感  贴片电感作为电子元件中的重要一员,因其小型化、高品质、高能量储存和低电阻等特性,在电子线路中发挥......
  • 大数据之路 读书笔记 Day5 数据同步遇到的问题与解决方案
    回顾Day4数据同步Day3无线客户端的日志采集1.分库分表的处理分库分表(Sharding)是数据库水平扩展的一种策略,当单个数据库的性能和存储能力无法满足应用需求时,可以采用分库分表来分散数据和查询负载。它通常包括两个方面:分库(DatabaseSharding)和分表(TablePartitio......
  • 大数据之路 读书笔记 Day6 离线数据开发之数据开发平台
    回顾Day5数据同步遇到的问题与解决方案Day4数据同步1.统一计算平台1.1MaxCompute概述MaxCompute(原名ODPS,OpenDataProcessingService)是阿里云提供的一种快速、完全托管的EB级数据仓库解决方案。它为用户提供了海量数据存储和实时计算的能力,适用于离线数据处理......
  • Java计算机毕业设计教学资料管理系统(开题+源码+论文)
    本系统(程序+源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景:在教育信息化的大潮中,教学资料作为知识传播的重要载体,其管理与利用效率直接影响到教学质量与学生学习效果。传统的教学资料管理方式多依赖于纸质文档......
  • 基于SpringBoot+MySQL+SSM+Vue.js的购物商城系统(附论文)
    获取见最下方名片获取见最下方名片获取见最下方名片演示视频基于SpringBoot+MySQL+SSM+Vue.js的购物商城系统(附论文)技术描述开发工具:Idea/Eclipse数据库:MySQLJar包仓库:Maven前端框架:Vue/ElementUI后端框架:Spring+SpringMVC+Mybatis+SpringBoot文字描......
  • 基于SpringBoot+MySQL+SSM+Vue.js的家政公司服务平台系统(附论文)
    获取见最下方名片获取见最下方名片获取见最下方名片演示视频基于SpringBoot+MySQL+SSM+Vue.js的家政公司服务平台系统(附论文)技术描述开发工具:Idea/Eclipse数据库:MySQLJar包仓库:Maven前端框架:Vue/ElementUI后端框架:Spring+SpringMVC+Mybatis+SpringBoo......
  • Java毕业设计-基于springboot开发的医院后台管理系统设计与实现-毕业论文(附毕设源代码
    https://download.csdn.net/download/u014740628/88922529医院后台管理系统设计与实现应用技术概述在信息时代背景下,医院后台管理系统的开发成为提升医疗信息处理效率的关键。本文介绍的系统采用B/S架构,结合了MySQL数据库和Java语言进行实现,确保了系统的稳定性和数据的安......
  • Java毕业设计-基于springboot开发的医院药品管理系统设计与实现-毕业论文(附毕设源代码
    Java毕业设计-基于springboot开发的医院药品管理系统设计与实现-毕业论文(附毕设源代码)https://download.csdn.net/download/u014740628/88922533医院药品管理系统开发实践应用技术概述在数字化时代背景下,医院药品管理系统的开发利用了当前流行的技术栈,以满足现代医疗行业......
  • 第七天学习笔记(经验测试,白盒测试)
    经验测试法错误推测法基于经验的测试技术之错误推测法错误推测法也叫错误猜测法,就是根据经验猜想,已有的缺陷,测试经验和失败数据等可能有什么问题并依此设计测试用例.异常分析法基于经验的测试技术之异常分析法系统异常分析法就是针对系统有可能存在的异常操作、软硬件缺陷......
  • 动态图连通性笔记
    首先离线的话有几种方法:线段树分治动态维护最大生成树:边的权值为他的(下一次)删除时间,加边正常做,询问时问路径最小值是否小于当前时刻.动态图连通性Holm-deLichtenberg-Thorup(HLT)暴力:维护生成森林,若删树边则暴力找另一条边能替代这条树边.思想:给每条边赋一个“不重......