首页 > 其他分享 >读论文-基于会话的推荐系统研究

读论文-基于会话的推荐系统研究

时间:2024-02-18 10:34:01浏览次数:22  
标签:基于 推荐 论文 会话 序列 SBRSs 互动 SBRS

前言

今天读的一篇论文名为《基于会话的推荐系统研究》(A survey on session-based recommender systems),文章于2021年发表于ACM Computing Surveys (CSUR);要引用这篇论文,请使用以下格式:

[1]Wang, Shou**, et al. "A survey on session-based recommender systems." ACM Computing Surveys (CSUR) 54.7 (2021): 1-38.

摘要

Recommender systems (RSs) have been playing an increasingly important role for informed consumption, services, and decision-making in the overloaded information era and digitized economy. In recent years, session-based recommender systems (SBRSs) have emerged as a new paradigm of RSs. Different from other RSs such as content-based RSs and collaborative filtering-based RSs which usually model long-term yet static user preferences, SBRSs aim to capture short-term but dynamic user preferences to provide more timely and accurate recommendations sensitive to the evolution of their session contexts. Although SBRSs have been intensively studied, neither unified problem statements for SBRSs nor in-depth elaboration of SBRS characteristics and challenges are available. It is also unclear to what extent SBRS challenges have been addressed and what the overall research landscape of SBRSs is. This comprehensive review of SBRSs addresses the above aspects by exploring in depth the SBRS entities (e.g., sessions), behaviours (e.g., users’ clicks on items) and their properties (e.g., session length). We propose a general problem statement of SBRSs, summarize the diversified data characteristics and challenges of SBRSs, and define a taxonomy to categorize the representative SBRS research. Finally, we discuss new research opportunities in this exciting and vibrant area.

在过载的信息时代和数字化经济时代,推荐系统(RSs)在信息消费、服务和决策方面发挥着越来越重要的作用。近年来,基于会话的推荐系统(session-based recommender systems, SBRSs)成为一种新的RSs范式。不同于基于内容的RSs和基于协同过滤的RSs通常对长期而静态的用户偏好进行建模,SBRSs旨在捕获短期但动态的用户偏好,从而提供对会话上下文变化更及时、更准确的推荐。尽管SBRSs已被深入研究,但目前还没有统一的SBRSs问题描述,也没有深入阐述SBRSs的特点和挑战。也不清楚SBRS的挑战在多大程度上得到了解决,以及SBRSs的总体研究状况是什么。本文通过深入探讨SBRS的实体(如会话)、行为(如用户对物品的点击)及其属性(如会话长度),解决了上述问题。文中提出了SBRSs的一般性问题陈述,总结了SBRSs的多样化数据特征和挑战,并定义了一个分类体系来分类代表性的SBRSs研究。最后,讨论了这一令人兴奋和充满活力的领域的新研究机会。

引言

推荐系统(RSs)已成为一个基本工具,用于在生活的各个方面——工作、商业运作、学习、娱乐和社交--做出更有信息量、更高效和更有效的选择和决策。

在数字经济日益超载的时代,它们的角色变得尤为重要,用户需要从通常庞大且快速增长的内容、产品和服务(统称为项目)中做出选择。各种RS研究领域已成功涌现,例如基于内容的RS、基于协同过滤的RS以及结合前两者的混合RS。

然而,这些RS倾向于利用所有历史用户-项目互动来学习每个用户对项目的长期和静态偏好。这种实践通常与一个潜在假设相关,即用户的所有历史互动对她当前偏好同等重要。但在现实世界案例中,这可能并非现实,原因有二:首先,用户对项目的选择不仅取决于她的长期历史偏好,还取决于她的短期近期偏好和时间敏感的上下文(例如,最近浏览或购买的项目)。这种短期偏好嵌入在用户最近的互动中,通常只占她历史互动的一小部分。其次,用户对项目的偏好往往是动态的而非静态的,即随时间演变。为了弥合RS中的这些差距,基于会话的推荐系统(SBRSs)近年来引起了越来越多的关注。与上述RS不同,SBRS从消费过程中关联和生成的会话中学习用户偏好。每个会话由多个用户-项目互动组成,这些互动在连续的时间内一起发生,例如,一次交易访问中购买的一篮子产品,通常持续几分钟到几小时。通过将会话作为基本输入单位,SBRS能够捕捉用户的短期偏好以及从一个会话到另一个会话偏好变化的动态,以提供更准确和及时的推荐。

在本文中,我们使用SBRSs一词指的是所有以会话数据为中心的RS,以推荐当前会话中的下一个互动或下一个部分会话(即,剩余互动),或者具有多个互动的下一个会话。这个定义涵盖了一些研究中狭义上的SBRS,仅推荐当前会话中的下一个互动。此外,它还涵盖了基于会话和会话感知的RS。文献中有各种用不同术语描述的SBRS研究,针对不同的应用场景和假设。例如,Hidasi等人在匿名会话数据上构建了一个SBRS,假设每个会话内的互动(例如,点击一个项目或观看一部电影)有严格的顺序,以预测下一个要点击的项目或要观看的视频。胡等人在非匿名会话数据上构建了另一个SBRS,没有会话内部的顺序假设,以推荐下一个要购买的项目。

景等人设计了一个基于非匿名会话数据的SBRS,假设会话内部有顺序,用于推荐下一首音乐或电影。尽管SBRS在各个领域广泛存在,并且已经进行了许多相关研究,但由于描述、设置、假设和应用领域的多样性,SBRS领域存在许多不一致之处。目前还没有一个统一的框架可以很好地对它们进行分类,也没有针对SBRS的统一问题陈述。更重要的是,关于SBRS的独特特性(包括它们的问题和会话数据)、由特性引起的研究挑战以及解决挑战的研究现状和差距,还没有系统的讨论。还没有对代表性和最先进方法的SBRS进行系统的分类。这些差距限制了SBRS的理论发展和实际应用。

SBRSs vs. SRSs

SBRS(基于会话的推荐系统)和SRS(序列推荐系统)分别建立在会话数据和序列数据之上,但有些读者常常将这两者混淆。因此,首先澄清会话数据和序列数据之间的区别是必要的。

会话是具有明确边界的一系列互动,这些互动可能是按时间顺序排列的(在有序会话中),或无序的(在无序会话中)。

边界指的是开始和结束特定会话的交易事件中的起始-结束互动对。有序(无序)会话指的是会话中的互动是(不是)按时间顺序排列的。

给定用户的会话数据通常包含在不同时间发生并通过多个边界分隔的多个会话,并且会话之间的时间间隔不相同(参见图1(a))。序列是具有明确顺序的历史元素(例如,项目ID)列表。给定用户的序列数据通常包含只有一个边界的单个序列(参见图1(b))。在大多数序列数据中,时间戳仅用于对序列内的元素进行排序,而没有明确包含和考虑时间间隔。边界通常表示基于共同出现的依赖关系在互动或元素之内。基于共同出现的依赖关系构成了SBRS的基础,特别是那些基于无序会话数据建立的SBRS。顺序意味着会话或序列内的互动或元素之间有明确的序列依赖性。我们在表1中展示了某个用户的会话数据和序列数据之间的区别。

SBRS的目标是通过学习会话内或会话间的依赖关系,预测给定已知部分的会话的未知部分(例如,一个项目或一批项目),或给定历史会话的未来会话(例如,下一个购物篮)。这种依赖关系通常在很大程度上依赖于会话内互动的共同出现,它们可能是序列的或非序列的。原则上,SBRS不一定依赖于会话内的顺序信息,但对于有序会话,自然存在的序列依赖关系可以用于推荐。相比之下,SRS通过学习它们之间的序列依赖关系,预测给定一系列历史元素的后续元素。有几篇综述文章特别关注SRS,包括序列感知推荐系统、深度学习用于序列推荐和序列推荐系统。在这项调查中,我们特别关注SBRS领域,强调会话数据的独特特性以及它们给SBRS带来的相应挑战,以及SBRS的代表性和最先进方法。

图1如下:
image

总结一下,这部分主要说了:
SBRS(基于会话的推荐系统)和SRS(序列推荐系统)分别基于会话数据和序列数据建立,但常被混淆。

  • 会话是有明确边界的互动列表,可能是有序或无序的。
  • 有序会话中,互动按时间顺序排列;无序会话则不然。
  • 会话数据由多个在不同时间和不同时间间隔内发生的会话组成。
  • 序列是具有明确顺序的历史元素列表,通常包含仅一个边界。
  • 序列数据中的时间戳用于排序,但不包含时间间隔信息。
  • 边界表示共同出现依赖关系,对SBRS尤其重要。
  • SBRS通过学习会话内外依赖关系,预测会话未知部分或未来会话。
  • SBRS依赖关系可以是序列的或非序列的,有序会话的天然序列依赖性有助于推荐。
  • SRS通过学习历史元素序列依赖关系来预测后续元素。
  • 综述文献关注于SRS的不同方面,本文专注于SBRS领域的特性、挑战和先进方法。

A Framework for Organizing SBRS Work 组织SBRS工作的框架

现存关于SBRS(基于会话的推荐系统)的工作可以大致分为三个子领域,这些子领域适合一个统一的分类框架以减少上述的不一致性和混淆。根据推荐任务的不同,子领域包括下一个互动推荐、下一部分会话推荐和下一个会话推荐。给定会话的已知部分(即已发生的互动),下一个互动推荐旨在通过主要建模会话内的依赖关系,推荐当前会话中可能的下一个互动。这通常简化为预测下一个要互动的项目,例如点击或购买的产品。给定会话的已知部分,下一部分会话推荐旨在推荐所有剩余的互动以完成当前会话,例如,在给定已购买商品的情况下,预测所有后续商品以完成购物篮,主要是通过建模会话内的依赖关系。尽管研究较少,但这个子领域在实际案例中甚至更加实用,因为用户通常不会只与下一个项目互动一次,而是与多个项目互动直到她结束整个会话。给定历史会话,下一个会话推荐旨在通过主要建模会话间的依赖关系推荐下一个会话,例如下一个购物篮。有时,会话间的依赖关系也被整合进前两个子领域以改善推荐性能。这些子领域的比较在表2中展示。

总结一下,这部分主要讲了:

  • SBRS(基于会话的推荐系统)的研究工作可以分为三个子领域,以适应一个统一的分类框架。
  • 子领域根据推荐任务的不同分为:下一个互动推荐、下一部分会话推荐和下一个会话推荐。
  • 下一个互动推荐关注在当前会话中推荐可能的下一个互动,主要通过建模会话内的依赖关系。
  • 下一部分会话推荐旨在推荐所有剩余的互动以完成当前会话,通常通过建模会话内的依赖关系。
  • 下一个会话推荐专注于基于历史会话数据推荐下一个会话,主要是通过建模会话间的依赖关系。
  • 会话间依赖关系有时也被用来改善前两个子领域的推荐性能。

image

SBRS PROBLEM STATEMENT SBRS问题陈述

RS可以被视为一个系统,它由多个基本实体组成,包括用户、项目以及它们的行为,例如,用户-项目互动。这些基本实体和行为构成了会话的核心组成部分,而会话是SBRS中的核心实体。因此,我们首先介绍这些实体和行为的定义和属性,然后基于它们定义SBRS问题。这些定义和属性将用于SBRS的特征描述和分类等。主要符号列在表3中。

image

CHARACTERISTICS AND CHALLENGES 特征与挑战

SBRS(基于会话的推荐系统)是建立在会话数据之上的,不同类型的会话数据通常与不同的特征相关联,这些特征本质上带来了构建SBRS的不同挑战。与其他数据驱动研究领域理解数据特征和挑战类似[11],深入理解会话数据的内在特征以及在建模会话数据构建SBRS时的挑战,对于设计合适的SBRS至关重要。因此,在本节中,我们系统地阐述和总结了会话数据的各种特征以及由此在构建SBRS时引起的相应挑战。根据第3.5节中介绍的每个会话属性,会话可以被划分为不同的类型。例如,根据“会话长度”属性,会话可以被分为长会话、中等会话和短会话。接下来,我们首先呈现根据各自属性分类的不同类型会话,然后讨论与每种类型的会话相关联的特征和挑战。

总结

总结来说,文章主要讲了以下几点:

  • 推荐系统(RSs)在信息过载时代和数字化经济非常重要;
  • 基于会话的推荐系统(SBRSs)是推荐系统的新兴范式。
  • 与其他推荐系统不同,SBRSs专注于建模短期且动态的用户偏好。
  • 尽管SBRSs研究广泛,但缺乏统一的问题陈述和对特征与挑战的深入讨论。
  • 目前SBRSs面临的挑战及其解决程度尚不明确。
  • 本文全面综述SBRSs,探讨其实体、行为和属性。
  • 文章提出了SBRSs的通用问题陈述,总结了数据特征和挑战。
  • 定义了一个分类法来归类SBRS研究。
  • 讨论了SBRS领域的新研究机会。

标签:基于,推荐,论文,会话,序列,SBRSs,互动,SBRS
From: https://www.cnblogs.com/wephiles/p/18018800

相关文章

  • 基于python+django+mysql的小区物业管理系统
    该系统是基于python+django开发的小区物业管理系统。适用场景:大学生、课程作业、毕业设计。学习过程中,如遇问题可以在github给作者留言。主要功能有:业主管理、报修管理、停车管理、资产管理、小区管理、用户管理、日志管理、系统信息。演示地址http://wuye.gitapp.cn/admin后......
  • 基于Microsoft SemanticKernel和GPT4实现一个智能翻译服务
    今年.NETConfChina2023技术大会,我给大家分享了.NET应用国际化-AIGC智能翻译+代码生成的议题.NETConfChina2023分享-.NET应用国际化-AIGC智能翻译+代码生成今天将详细的代码实现和大家分享一下。一、前提准备1.新建一个Console类的Project2.引用SK的Nuget包,SK的最新N......
  • 基于Doris构建亿级数据实时数据分析系统
    转载至我的博客https://www.infrastack.cn,公众号:架构成长指南背景随着公司业务快速发展,对业务数据进行增长分析的需求越来越迫切,与此同时我们的业务数据量也在快速激增、每天的数据新增量大概在30w左右,一年就会产生1个亿的数据,显然基于传统MySQL数据库已经无法支撑满足以......
  • 基于双树复小波变换和稀疏表示的多光谱和彩色图像融合算法matlab仿真
    1.算法运行效果图预览  2.算法运行软件版本MATLAB2022a 3.算法理论概述     基于双树复小波变换(Dual-TreeComplexWaveletTransform,DT-CWT)和稀疏表示的多光谱和彩色图像融合算法是一种先进的图像融合技术,旨在将多光谱图像(MultispectralImages,MSI)和彩......
  • 《SagDRE: Sequence-Aware Graph-Based Document-Level Relation Extraction with Ada
    代码原文地址关键参考文献:Document-LevelRelationExtractionwithAdaptiveThresholdingand LocalizedContextPooling摘要关系抽取(RE)是许多自然语言处理应用的重要任务,它的目标是从文档中抽取出实体之间的关系。文档级RE任务面临着许多挑战,因为它不仅需要跨句子......
  • 基于FPGA的图像RGB转CIE-Lab实现,包含testbench和MATLAB辅助验证程序
    1.算法运行效果图预览 将FPGA的结果导入到matlab,并和matlab的仿真结果进行对比:   2.算法运行软件版本vivado2019.2 matlab2022a 3.算法理论概述     RGB和CIE-Lab是两种常用的颜色空间,它们在不同的应用领域中各有优势。RGB颜色空间主要用于显示设备,而C......
  • 基于chaos混沌的彩色图像加解密系统matlab仿真
    1.算法运行效果图预览 2.算法运行软件版本matlab2022a 3.算法理论概述      基于混沌(Chaos)的彩色图像加解密系统是一种新型的图像加密技术,它利用了混沌理论的特性来提供高度安全的图像加密。下面将详细介绍这种系统的原理、数学公式和实现过程。 3.1混沌理论......
  • 中国首次对论文撤稿和科研不端行为进行全国性审查
    相关:史无前例:中国首次对论文撤稿和科研不端行为进行全国性审查2月15日就是截止日期了,届时,各个大学必须提交一份过去三年内从英文和中文期刊撤稿的所有学术文章的综合清单。教育部科技信息化司于2023年11月20日发布的通知显示,提交的清单还需要进一步解释论文被撤稿的原因,并对涉......
  • 基于yolov2深度学习网络的人员跌倒检测识别matlab仿真
    1.算法运行效果图预览 2.算法运行软件版本matlab2022a 3.算法理论概述      跌倒是一种常见的健康风险,特别是在老年人和患有某些疾病的人群中。及时检测跌倒并采取相应措施对于降低伤害风险至关重要。近年来,深度学习在图像处理和计算机视觉领域取得了显著进展......
  • 基于NIQE算法的图像无参考质量评价算法matlab仿真
    1.算法运行效果图预览   2.算法运行软件版本MATLAB2022a  3.算法理论概述      NIQE(NaturalnessImageQualityEvaluator)算法是一种无参考图像质量评价算法,旨在评估图像的自然度,即图像看起来是否像自然场景。NIQE基于一组“质量感知”特征,并将其拟合到MV......