首页 > 其他分享 >读论文-基于会话的推荐系统研究

读论文-基于会话的推荐系统研究

时间:2024-04-11 22:12:03浏览次数:21  
标签:基于 推荐 论文 用户 会话 序列 SBRSs SBRS

前言

今天读的一篇论文名为《基于会话的推荐系统研究》(A survey on session-based recommender systems),文章于2021年发表于ACM Computing Surveys (CSUR);要引用这篇论文,请使用以下格式:

[1]Wang, Shou**, et al. "A survey on session-based recommender systems." ACM Computing Surveys (CSUR) 54.7 (2021): 1-38.

摘要

Recommender systems (RSs) have been playing an increasingly important role for informed consumption, services, and decision-making in the overloaded information era and digitized economy. In recent years, session-based recommender systems (SBRSs) have emerged as a new paradigm of RSs. Different from other RSs such as content-based RSs and collaborative filtering-based RSs which usually model long-term yet static user preferences, SBRSs aim to capture short-term but dynamic user preferences to provide more timely and accurate recommendations sensitive to the evolution of their session contexts. Although SBRSs have been intensively studied, neither unified problem statements for SBRSs nor in-depth elaboration of SBRS characteristics and challenges are available. It is also unclear to what extent SBRS challenges have been addressed and what the overall research landscape of SBRSs is. This comprehensive review of SBRSs addresses the above aspects by exploring in depth the SBRS entities (e.g., sessions), behaviours (e.g., users’ clicks on items) and their properties (e.g., session length). We propose a general problem statement of SBRSs, summarize the diversified data characteristics and challenges of SBRSs, and define a taxonomy to categorize the representative SBRS research. Finally, we discuss new research opportunities in this exciting and vibrant area.

在过载的信息时代和数字化经济时代,推荐系统(RSs)在信息消费、服务和决策方面发挥着越来越重要的作用。近年来,基于会话的推荐系统(session-based recommender systems, SBRSs)成为一种新的RSs范式。不同于基于内容的RSs和基于协同过滤的RSs通常对长期而静态的用户偏好进行建模,SBRSs旨在捕获短期但动态的用户偏好,从而提供对会话上下文变化更及时、更准确的推荐。尽管SBRSs已被深入研究,但目前还没有统一的SBRSs问题描述,也没有深入阐述SBRSs的特点和挑战。也不清楚SBRS的挑战在多大程度上得到了解决,以及SBRSs的总体研究状况是什么。本文通过深入探讨SBRS的实体(如会话)、行为(如用户对物品的点击)及其属性(如会话长度),解决了上述问题。文中提出了SBRSs的一般性问题陈述,总结了SBRSs的多样化数据特征和挑战,并定义了一个分类体系来分类代表性的SBRSs研究。最后,讨论了这一令人兴奋和充满活力的领域的新研究机会。

引言

推荐系统(RSs)已成为一个基本工具,用于在生活的各个方面——工作、商业运作、学习、娱乐和社交--做出更有信息量、更高效和更有效的选择和决策。

在数字经济日益超载的时代,它们的角色变得尤为重要,用户需要从通常庞大且快速增长的内容、产品和服务(统称为项目)中做出选择。各种RS研究领域已成功涌现,例如基于内容的RS、基于协同过滤的RS以及结合前两者的混合RS。

然而,这些RS倾向于利用所有历史用户-项目互动来学习每个用户对项目的长期和静态偏好。这种实践通常与一个潜在假设相关,即用户的所有历史互动对她当前偏好同等重要。但在现实世界案例中,这可能并非现实,原因有二:首先,用户对项目的选择不仅取决于她的长期历史偏好,还取决于她的短期近期偏好和时间敏感的上下文(例如,最近浏览或购买的项目)。这种短期偏好嵌入在用户最近的互动中,通常只占她历史互动的一小部分。其次,用户对项目的偏好往往是动态的而非静态的,即随时间演变。为了弥合RS中的这些差距,基于会话的推荐系统(SBRSs)近年来引起了越来越多的关注。与上述RS不同,SBRS从消费过程中关联和生成的会话中学习用户偏好。每个会话由多个用户-项目互动组成,这些互动在连续的时间内一起发生,例如,一次交易访问中购买的一篮子产品,通常持续几分钟到几小时。通过将会话作为基本输入单位,SBRS能够捕捉用户的短期偏好以及从一个会话到另一个会话偏好变化的动态,以提供更准确和及时的推荐。

在本文中,我们使用SBRSs一词指的是所有以会话数据为中心的RS,以推荐当前会话中的下一个互动或下一个部分会话(即,剩余互动),或者具有多个互动的下一个会话。这个定义涵盖了一些研究中狭义上的SBRS,仅推荐当前会话中的下一个互动。此外,它还涵盖了基于会话和会话感知的RS。文献中有各种用不同术语描述的SBRS研究,针对不同的应用场景和假设。例如,Hidasi等人在匿名会话数据上构建了一个SBRS,假设每个会话内的互动(例如,点击一个项目或观看一部电影)有严格的顺序,以预测下一个要点击的项目或要观看的视频。胡等人在非匿名会话数据上构建了另一个SBRS,没有会话内部的顺序假设,以推荐下一个要购买的项目。

景等人设计了一个基于非匿名会话数据的SBRS,假设会话内部有顺序,用于推荐下一首音乐或电影。尽管SBRS在各个领域广泛存在,并且已经进行了许多相关研究,但由于描述、设置、假设和应用领域的多样性,SBRS领域存在许多不一致之处。目前还没有一个统一的框架可以很好地对它们进行分类,也没有针对SBRS的统一问题陈述。更重要的是,关于SBRS的独特特性(包括它们的问题和会话数据)、由特性引起的研究挑战以及解决挑战的研究现状和差距,还没有系统的讨论。还没有对代表性和最先进方法的SBRS进行系统的分类。这些差距限制了SBRS的理论发展和实际应用。

SBRSs vs. SRSs

SBRS(基于会话的推荐系统)和SRS(序列推荐系统)分别建立在会话数据和序列数据之上,但有些读者常常将这两者混淆。因此,首先澄清会话数据和序列数据之间的区别是必要的。

会话是具有明确边界的一系列互动,这些互动可能是按时间顺序排列的(在有序会话中),或无序的(在无序会话中)。

边界指的是开始和结束特定会话的交易事件中的起始-结束互动对。有序(无序)会话指的是会话中的互动是(不是)按时间顺序排列的。

给定用户的会话数据通常包含在不同时间发生并通过多个边界分隔的多个会话,并且会话之间的时间间隔不相同(参见图1(a))。序列是具有明确顺序的历史元素(例如,项目ID)列表。给定用户的序列数据通常包含只有一个边界的单个序列(参见图1(b))。在大多数序列数据中,时间戳仅用于对序列内的元素进行排序,而没有明确包含和考虑时间间隔。边界通常表示基于共同出现的依赖关系在互动或元素之内。基于共同出现的依赖关系构成了SBRS的基础,特别是那些基于无序会话数据建立的SBRS。顺序意味着会话或序列内的互动或元素之间有明确的序列依赖性。我们在表1中展示了某个用户的会话数据和序列数据之间的区别。

SBRS的目标是通过学习会话内或会话间的依赖关系,预测给定已知部分的会话的未知部分(例如,一个项目或一批项目),或给定历史会话的未来会话(例如,下一个购物篮)。这种依赖关系通常在很大程度上依赖于会话内互动的共同出现,它们可能是序列的或非序列的。原则上,SBRS不一定依赖于会话内的顺序信息,但对于有序会话,自然存在的序列依赖关系可以用于推荐。相比之下,SRS通过学习它们之间的序列依赖关系,预测给定一系列历史元素的后续元素。有几篇综述文章特别关注SRS,包括序列感知推荐系统、深度学习用于序列推荐和序列推荐系统。在这项调查中,我们特别关注SBRS领域,强调会话数据的独特特性以及它们给SBRS带来的相应挑战,以及SBRS的代表性和最先进方法。

图1如下:
image

总结一下,这部分主要说了:
SBRS(基于会话的推荐系统)和SRS(序列推荐系统)分别基于会话数据和序列数据建立,但常被混淆。

  • 会话是有明确边界的互动列表,可能是有序或无序的。
  • 有序会话中,互动按时间顺序排列;无序会话则不然。
  • 会话数据由多个在不同时间和不同时间间隔内发生的会话组成。
  • 序列是具有明确顺序的历史元素列表,通常包含仅一个边界。
  • 序列数据中的时间戳用于排序,但不包含时间间隔信息。
  • 边界表示共同出现依赖关系,对SBRS尤其重要。
  • SBRS通过学习会话内外依赖关系,预测会话未知部分或未来会话。
  • SBRS依赖关系可以是序列的或非序列的,有序会话的天然序列依赖性有助于推荐。
  • SRS通过学习历史元素序列依赖关系来预测后续元素。
  • 综述文献关注于SRS的不同方面,本文专注于SBRS领域的特性、挑战和先进方法。

A Framework for Organizing SBRS Work 组织SBRS工作的框架

现存关于SBRS(基于会话的推荐系统)的工作可以大致分为三个子领域,这些子领域适合一个统一的分类框架以减少上述的不一致性和混淆。根据推荐任务的不同,子领域包括下一个互动推荐、下一部分会话推荐和下一个会话推荐。给定会话的已知部分(即已发生的互动),下一个互动推荐旨在通过主要建模会话内的依赖关系,推荐当前会话中可能的下一个互动。这通常简化为预测下一个要互动的项目,例如点击或购买的产品。给定会话的已知部分,下一部分会话推荐旨在推荐所有剩余的互动以完成当前会话,例如,在给定已购买商品的情况下,预测所有后续商品以完成购物篮,主要是通过建模会话内的依赖关系。尽管研究较少,但这个子领域在实际案例中甚至更加实用,因为用户通常不会只与下一个项目互动一次,而是与多个项目互动直到她结束整个会话。给定历史会话,下一个会话推荐旨在通过主要建模会话间的依赖关系推荐下一个会话,例如下一个购物篮。有时,会话间的依赖关系也被整合进前两个子领域以改善推荐性能。这些子领域的比较在表2中展示。

总结一下,这部分主要讲了:

  • SBRS(基于会话的推荐系统)的研究工作可以分为三个子领域,以适应一个统一的分类框架。
  • 子领域根据推荐任务的不同分为:下一个互动推荐、下一部分会话推荐和下一个会话推荐。
  • 下一个互动推荐关注在当前会话中推荐可能的下一个互动,主要通过建模会话内的依赖关系。
  • 下一部分会话推荐旨在推荐所有剩余的互动以完成当前会话,通常通过建模会话内的依赖关系。
  • 下一个会话推荐专注于基于历史会话数据推荐下一个会话,主要是通过建模会话间的依赖关系。
  • 会话间依赖关系有时也被用来改善前两个子领域的推荐性能。

image

SBRS PROBLEM STATEMENT SBRS问题陈述

RS可以被视为一个系统,它由多个基本实体组成,包括用户、项目以及它们的行为,例如,用户-项目互动。这些基本实体和行为构成了会话的核心组成部分,而会话是SBRS中的核心实体。因此,我们首先介绍这些实体和行为的定义和属性,然后基于它们定义SBRS问题。这些定义和属性将用于SBRS的特征描述和分类等。主要符号列在表3中。

image

CHARACTERISTICS AND CHALLENGES 特征与挑战

SBRS(基于会话的推荐系统)是建立在会话数据之上的,不同类型的会话数据通常与不同的特征相关联,这些特征本质上带来了构建SBRS的不同挑战。与其他数据驱动研究领域理解数据特征和挑战类似[11],深入理解会话数据的内在特征以及在建模会话数据构建SBRS时的挑战,对于设计合适的SBRS至关重要。因此,在本节中,我们系统地阐述和总结了会话数据的各种特征以及由此在构建SBRS时引起的相应挑战。根据第3.5节中介绍的每个会话属性,会话可以被划分为不同的类型。例如,根据“会话长度”属性,会话可以被分为长会话、中等会话和短会话。接下来,我们首先呈现根据各自属性分类的不同类型会话,然后讨论与每种类型的会话相关联的特征和挑战。

总结

文章要点

文章对SBRSs和SRSs的比较、框架、相关调查,以及用户、项目、动作和会话的属性和问题,都进行了深入探讨。此外,还研究了会话长度、内部顺序、动作类型和会话数据结构的相关特性和挑战。SBRS方法被分类并比较,包括基于模式规则挖掘的方法。这些方法主要包含频繁模式或关联规则挖掘、会话匹配和推荐生成三个步骤。如果一个项目存在于频繁模式中,并且与给定的部分会话中的项目有相同的顺序,则该项目是一个候选推荐项目。最后,如果条件概率大于预定义的可信度阈值,则将该项目添加到推荐列表中。同样,也介绍了基于序列模式挖掘的方法。这些方法可以基于会话级别或交互级别进行构建,用于下一会议或交互的推荐。与频繁模式挖掘的方法类似,这些方法也涉及模式挖掘、会话匹配和推荐生成等步骤。总的来说,这些研究对于理解和解决SBRS问题具有重要的意义,并为未来的研究提供了新的思路和方向。

SBRSs和SRSs的主要区别在于它们处理的数据类型和应用场景。

SBRSs,即基于会话的推荐系统(Session-Based Recommender Systems),主要处理的是会话数据。会话数据是指用户在一次会话中与系统进行的一系列交互操作,这些操作通常具有明确的开始和结束边界,且操作之间可能存在时间上的先后顺序。SBRSs主要利用这些会话数据来预测用户在当前会话中可能感兴趣的项目或行为。由于会话数据通常具有较短的时间跨度,因此SBRSs更侧重于捕捉用户的短期兴趣和实时行为。

相比之下,SRSs,即序列推荐系统(Sequential Recommender Systems),处理的是序列数据。序列数据是指按照时间顺序排列的一系列元素或事件,这些元素或事件之间具有明确的顺序关系。SRSs利用这些序列数据来预测用户接下来可能感兴趣的项目或行为。由于序列数据可以包含用户的长期历史信息,因此SRSs更侧重于捕捉用户的长期兴趣和偏好。

此外,SBRSs和SRSs在推荐策略和方法上也存在差异。SBRSs通常侧重于利用会话内的信息进行推荐,而较少考虑用户的长期历史信息。而SRSs则可以利用用户的长期历史信息进行推荐,并可以捕捉用户的长期偏好和兴趣变化。

综上所述,SBRSs和SRSs的主要区别在于它们处理的数据类型和应用场景,以及它们在推荐策略和方法上的差异。SBRSs更适用于处理短期兴趣和实时行为,而SRSs则更适用于捕捉长期兴趣和偏好。

频繁模式或关联规则挖掘、会话匹配和推荐生成

在SBRS(Session-Based Recommender Systems,基于会话的推荐系统)方法中,频繁模式或关联规则挖掘、会话匹配和推荐生成是三个核心步骤,它们共同协作以生成针对用户的个性化推荐。以下是这三个步骤的详细工作原理:

频繁模式或关联规则挖掘(Frequent Pattern/Association Rule Mining):
这一步骤的主要目标是从用户会话数据中挖掘出频繁出现的模式或关联规则。首先,系统会收集用户在会话中的行为数据,例如点击、购买、浏览等。然后,利用数据挖掘技术,如FP-Tree算法等,从这些数据中挖掘出频繁出现的模式或关联规则。这些规则可以帮助系统理解用户的行为模式和偏好,从而为后续的推荐提供依据。

会话匹配(Session Matching):
在挖掘出频繁模式或关联规则后,系统需要进行会话匹配。这一步骤主要是将当前用户的会话数据与已挖掘出的模式或规则进行匹配。系统会根据用户当前的行为和偏好,在已挖掘出的模式或规则中寻找与之匹配的内容。通过会话匹配,系统可以初步确定用户可能感兴趣的内容或商品。

推荐生成(Recommendation Generation):
最后一步是推荐生成。在会话匹配的基础上,系统会根据匹配结果为用户生成推荐列表。推荐列表中的商品或内容会根据与当前用户会话的匹配程度和用户的偏好进行排序。同时,系统还会考虑其他因素,如商品的热门程度、价格、用户的历史行为等,以生成更加准确和个性化的推荐。

综上所述,SBRS方法中的频繁模式或关联规则挖掘、会话匹配和推荐生成三个步骤是相互关联、协同工作的。通过这三个步骤的有机结合,系统可以实现对用户行为的精准理解和个性化推荐,从而提高用户满意度和推荐效果。

基于序列模式挖掘的SBRS方法与基于频繁模式挖掘的不同

基于序列模式挖掘的SBRS(Session-Based Recommender Systems,基于会话的推荐系统)方法与基于频繁模式挖掘的方法在多个方面存在显著的不同。

首先,从基本定义和目的来看,基于序列模式挖掘的SBRS方法主要关注会话中项目的顺序信息,即用户在一个会话中如何从一个项目转移到另一个项目。这种方法试图发现会话中的序列模式,以便根据这些模式预测用户接下来的行为。而基于频繁模式挖掘的方法则更注重项目在会话中出现的频率,即哪些项目经常一起出现。这种方法通过寻找频繁出现的项目组合来构建推荐模型。

其次,在数据处理和特征提取方面,基于序列模式挖掘的SBRS方法需要处理时间序列数据,通常会使用如滑动窗口等技术来捕捉会话中的序列模式。这些方法可能会考虑时间间隔、项目之间的转移概率等特征。而基于频繁模式挖掘的方法则主要处理项目组合的频率信息,通常会使用关联规则挖掘等技术来发现频繁出现的项目组合。

在模型构建和推荐生成方面,基于序列模式挖掘的SBRS方法通常会使用如马尔可夫模型、循环神经网络(RNN)等能够处理序列数据的模型。这些模型通过学习会话中的序列模式来预测用户下一个可能的行为。而基于频繁模式挖掘的方法则可能会使用如Apriori算法、FP-Growth算法等来挖掘频繁模式,并基于这些模式生成推荐。

最后,在性能评估方面,由于基于序列模式挖掘的SBRS方法更关注项目的顺序信息,因此在评估时通常会考虑一些能够反映顺序信息的指标,如序列准确率、序列召回率等。而基于频繁模式挖掘的方法则可能会更关注传统的推荐指标,如准确率、召回率、F1值等。

综上所述,基于序列模式挖掘的SBRS方法与基于频繁模式挖掘的方法在定义、数据处理、模型构建和性能评估等方面都存在明显的不同。这些方法各有优缺点,适用于不同的场景和数据特点。在实际应用中,需要根据具体的需求和数据特点来选择合适的方法。

最后总结

总结来说,文章主要讲了以下几点:

  • 推荐系统(RSs)在信息过载时代和数字化经济非常重要;
  • 基于会话的推荐系统(SBRSs)是推荐系统的新兴范式。
  • 与其他推荐系统不同,SBRSs专注于建模短期且动态的用户偏好。
  • 尽管SBRSs研究广泛,但缺乏统一的问题陈述和对特征与挑战的深入讨论。
  • 目前SBRSs面临的挑战及其解决程度尚不明确。
  • 本文全面综述SBRSs,探讨其实体、行为和属性。
  • 文章提出了SBRSs的通用问题陈述,总结了数据特征和挑战。
  • 定义了一个分类法来归类SBRS研究。
  • 讨论了SBRS领域的新研究机会。

标签:基于,推荐,论文,用户,会话,序列,SBRSs,SBRS
From: https://www.cnblogs.com/wephilos/p/18119930

相关文章

  • 【论文随笔】深度推荐系统的自动化_一项调查(Automl for deep recommender systems_ A
    前言今天读的论文为一篇于2021年1月发表在ACMTransactionsonInformationSystems的论文,本文是一篇关于深度推荐系统自动化机器学习(AutoML)的综述,由RuiqiZheng、LiangQu、BinCui、YuhuiShi和HongzhiYin共同撰写。文章首先提出了一个抽象概念——AutoMLforDeepRecommende......
  • 【论文随笔】推荐系统综述_推荐模型、推荐技术与应用领域(A Survey of Recommendation
    前言今天读的论文为一篇于2022年1月3日发表的论文,这篇文章是关于推荐系统的综述,主要研究了推荐系统在不同服务领域的应用趋势,包括推荐模型、技术和应用领域。通过分析2010年至2021年间发表的顶级文章和顶级会议论文,系统化了推荐系统模型和技术的研究,并分析了按年份的研究趋势。文......
  • 读论文-基于自注意力机制和迁移学习的跨领域推荐算法
    前言今日要读的文章为一篇2022年4月2日发表于《计算机科学》的期刊文章;文章发现了传统的单领域推荐算法的问题:传统的单领域推荐算法受限于用户和项目的稀疏关系,存在用户/项目冷启动的问题,并且,其仅以用户对项目评分进行建模,忽略了评论文本中所蕴含的信息。基于此,文章提出了一种基......
  • 读论文-序列感知推荐系统(Sequence-Aware Recommender Systems)
    前言今天读的论文为一篇于2018年发表在(ACMcomputingsurveys(CSUR))的论文,这篇文章主要讲述了序列感知推荐系统(Sequence-AwareRecommenderSystems)的研究和应用。文章首先介绍了推荐系统在实际中的应用背景,然后指出了传统推荐系统在处理用户行为序列信息方面的局限性。接着,文......
  • 基于矩阵分解的协同过滤算法
    引言随着互联网、大数据等新技术的迅速发展,人们的生活变得更加便捷,但同时也导致网络数据爆炸式增长。为了快速帮助用户找到感兴趣的内容,越来越多的研究者致力于推荐算法的研究,以提高推荐质量,向用户推荐更符合其喜好的内容。然而,目前的推荐算法仍存在数据稀疏性、隐私保护和冷启动......
  • 读论文-新闻推荐系统:近期进展、挑战与机遇的评述(News recommender system_ a review
    前言今天读的论文为一篇于2022年发表在"人工智能评论"(ArtificialIntelligenceReview)的论文,文章主要强调了NRS面临的主要挑战,并从现有技术中确定了可能的解决方案。引用这篇论文:[1]Raza,Shaina,andChenDing."Newsrecommendersystem:areviewofrecentprogress,c......
  • 基于注意力机制与改进TF-IDF的推荐算法
    前言本篇文章是2020年8月发表于《计算机工程》的一篇期刊论文,文章名称《基于注意力机制与改进TF-IDF的推荐算法》。文章针对传统推荐系统主要依赖用户对物品的评分数据而无法学习到用户和项目的深层次特征的问题,提出基于注意力机制与改进TF-IDF的推荐算法(AMITI)。将双层注意力......
  • 基于自注意力机制的轻量级人体姿态估计(Lightweight Human Pose Estimation Based on
    写在前面本文是一篇于2023年3月21日发表在2023InternationalConferenceonBigData,EnvironmentalIndustryandMaterialsScience(ICBDEIMS2023)的一篇会议论文。论文主要聚焦于解决单签人体姿态估计网络模型中普遍存在的参数多、计算复杂度高、检测时间长的问题,文章采用......
  • 基于内容的电影推荐算法研究
    引言今天读的文章为一篇名为《基于内容的电影推荐算法研究》的文章,文章提出了一种基于内容的电影推荐算法,通过分析电影特征和用户兴趣,实现更精准的电影推荐。文章中使用到了TF-IDF向量化方法,将电影类型和导演信息转化为特征向量,然后使用余弦相似度来衡量电影之间的相关性,接下来......
  • 论文解读(UGfromer)《Universal Graph Transformer Self-Attention Networks》
    Note:[wechat:Y466551|可加勿骚扰,付费咨询]论文信息论文标题:UniversalGraphTransformerSelf-AttentionNetworks论文作者:论文来源:2022aRxiv论文地址:download论文代码:download视屏讲解:click1-摘要我们引入了一个基于变压器的GNN模型,称为UGfromer,来学习图表示。特别......