首页 > 其他分享 >基于强化学习的推荐系统相关研究进展、经典论文整理分享

基于强化学习的推荐系统相关研究进展、经典论文整理分享

时间:2023-06-22 22:03:25浏览次数:49  
标签:推荐 论文 学习 RLS 模块 强化 分享 研究进展


基于强化学习的推荐系统相关研究进展、经典论文整理分享_自然语言处理




基于强化学习的推荐系统相关研究进展、经典论文整理分享_深度学习_02


深度学习与NLP

专注深度学习、NLP相关技术、资讯,追求纯粹的技术,享受学习、分享的快乐。

677篇原创内容

公众号

    推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。推荐系统有3个重要的模块:用户建模模块、推荐对象建模模块、推荐算法模块。

    强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

    目前强化学习在推荐系统拥有非常丰富的应用场景。本资源整理了基于强化学习(RL)推荐系统相关的研究和经典论文。由于相关性高,此处还列出了几篇learning-to-rank(LTR)的研究论文。所有的论文都按时间排序。

 

论文资源列表

基于强化学习的推荐系统相关研究进展、经典论文整理分享_强化学习_03

基于强化学习的推荐系统相关研究进展、经典论文整理分享_强化学习_04


标签:推荐,论文,学习,RLS,模块,强化,分享,研究进展
From: https://blog.51cto.com/u_13046751/6535821

相关文章

  • 2022年最新目标跟踪顶会论文及模型整理分享
        啥是ObjectTracking(目标追踪)?    简单点,一幅画面,指定里面一个目标,比如人、动物、车、飞机等等,然后一直死死锁定这个目标,不丢。    有啥用?    相机跟踪对焦,车辆跟踪,人体、人脸跟踪,手势跟踪等等;    比如:    经常看见电视上,警察叔叔要抓一些犯事儿的人,监......
  • 文本风格迁移(TST)相关算法、领域、数据集及应用场景整理分享
        自然语言的文本风格,可以是比风格更广泛的东西。文本风格迁移的应用,是可以比你想象中的应用更大。图像的风格转换,大家都很熟悉。    文本的风格转换(TextStyleTransfer)可以有很多不同的面相。比如,我们可以把负面的句子转换为正面的句子。这个问题,如果我们有成对的数据,......
  • 创造性自然语言生成(NLG)最新研究论文整理分享
    什么是自然语言生成(NLG)?自然语言处理(NLP)分为自然语言理解(NLU)和自然语言生成(NLG),NLU负责理解文本内容而NLG负责根据信息生成文本内容,该信息可以是语音、视频、图片、文字等等。总共分为两种方式:1、文本到语言生成。2、数据到语言生成。NLG的三个级别(Level)1、简单的数据合并,将数据转换......
  • 历史最全GAN模型PyTorch代码实现整理分享
        如果你是第一次接触AE自编码器和GAN生成对抗网络,那这将会是一个非常有用且效率的学习资源。所有的内容使用PyTorch编写,编写格式清晰,非常适合PyTorch新手作为学习资源。本项目的所有模型目前都是基于MNIST数据库进行图片生成。MNIST数据集是一个比较小,一个光CPU就能跑起来的......
  • 深度学习网络架构搜索(NAS)最新必读论文分享
        在过去的很多年深度学习在视觉、语音等方面都已经取得了巨大的成功,其中一个很大的原因就是出现了很多新颖的网络结构——ResNet、MobileNet、ShuffleNet等。随着网络结构越来越复杂,人工设计网络的试错成本和时间成本会难以承受。    超参数的自动搜索优化是一个古老的......
  • 口语机器翻译(ST)相关算法、论文、数据集、代码库等资源分享
       本资源整理了口语自动翻译(SpeechTranslation,SpokenLanguageProcessing,NaturalLanguageProcessing)相关的经典端到端算法,经典论文,公开数据集,学术会议及代码库等资源。目录内容截图......
  • 目标姿态估计与重建相关经典论文、数据集、研讨会和挑战赛整理分享
       本资源整理了6d物体姿态估计相关精选的资源列表,包括相关经典论文、数据集、研讨会和挑战赛等,从单个视图重建3d物体和手-物体重建。由于人体的重建类似于物体的重建,所以我也收集了一些关于人体姿态重建相关的资源。目录内容截图......
  • 历史最全Java资源大全中文版整理分享
       很多程序员应该记得GitHub上有一个Awesome-XXX系列的资源整理。本资源对Java相关的资源列表进行翻译和整理,内容包括:构建工具、数据库、框架、模板、安全、代码分析、日志、第三方库、书籍、Java站点等。分享给需要的朋友。目录内容截图......
  • Transformer及其变体模型在计算机视觉领域应用论文盘点
       AttentionIsAllYouNeed是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个全新的模型,叫Transformer,抛弃了以往深度学习任务里面使用到的CNN和RNN,目前大热的Bert就是基于Transformer构建的,这个模型广泛应用于NLP领域,例如机器翻译,问答系统,文本......
  • 七年音视频开发呕心沥血之作:《Android音视频开发进阶指南》开源分享
    前言前两天在脉脉看到这么一条动态:作为Android开发者,真的是深有感触,Android开发越来越卷,越来越多人唱衰Android,还有很多人一直在思考是否要转行,大家都越来越焦虑。。。但与其深陷焦虑,**我们更应该积极寻求出路,通过提升自己来更好地端好Android这碗饭:5G的浪潮全面袭来,其实为Android......