读论文-基于会话的推荐系统综述(A survey on session-based recommender systems)

标签：based 推荐系统用户会话 session survey SBRSs SBRS

前言

今天读的论文是一篇于2021年发表于"ACM Computing Surveys (CSUR)"的论文，文章写到，推荐系统在信息过载时代和数字化经济中非常重要。基于会话的推荐系统（SBRSs）是新的推荐系统范式，不同于其他模型化长期静态用户偏好的推荐系统，SBRSs专注于捕捉短期动态用户偏好。尽管SBRSs已被深入研究，但缺乏统一的问题陈述和对其特点及挑战的深入阐述。该综述深入探讨了SBRSs的实体、行为和属性，提出了SBRSs的一般问题陈述，总结了SBRSs的数据特性和挑战，并定义了分类法。最后，文章讨论了SBRSs研究领域的新机会。

要引用这篇论文，请使用以下格式：

Wang, Shou**, et al. "A survey on session-based recommender systems." ACM Computing Surveys (CSUR) 54.7 (2021): 1-38.

摘要

Recommender systems (RSs) have been playing an increasingly important role for informed consumption, services, and decision-making in the overloaded information era and digitized economy. In recent years, session-based recommender systems (SBRSs) have emerged as a new paradigm of RSs. Different from other RSs such as content-based RSs and collaborative filtering-based RSs which usually model long-term yet static user preferences, SBRSs aim to capture short-term but dynamic user preferences to provide more timely and accurate recommendations sensitive to the evolution of their session contexts. Although SBRSs have been intensively studied, neither unified problem statements for SBRSs nor in-depth elaboration of SBRS characteristics and challenges are available. It is also unclear to what extent SBRS challenges have been addressed and what the overall research landscape of SBRSs is. This comprehensive review of SBRSs addresses the above aspects by exploring in depth the SBRS entities (e.g., sessions), behaviours (e.g., users’ clicks on items) and their properties (e.g., session length). We propose a general problem statement of SBRSs, summarize the diversified data characteristics and challenges of SBRSs, and define a taxonomy to categorize the representative SBRS research. Finally, we discuss new research opportunities in this exciting and vibrant area.

推荐系统（RSs）在信息过载的时代和数字化经济中，对于知情消费、服务和决策起着越来越重要的作用。近年来，基于会话的推荐系统（SBRSs）已经成为推荐系统的新范式。与其他推荐系统不同，例如基于内容的推荐系统和基于协同过滤的推荐系统通常模型化长期但静态的用户偏好，SBRSs旨在捕捉短期但动态的用户偏好，以提供更及时和准确的建议，对这些会话上下文的演变敏感。尽管SBRSs已经被深入研究，但既没有统一的SBRS问题陈述，也没有深入阐述SBRS的特点和挑战。目前还不清楚SBRS的挑战在多大程度上得到了解决，以及SBRS的整体研究现状是什么。这篇关于SBRSs的全面综述通过深入探讨SBRS实体（例如，会话）、行为（例如，用户对项目的点击）及其属性（例如，会话长度），解决了上述问题。我们提出了SBRS的一般问题陈述，总结了SBRS多样化的数据特性和挑战，并定义了一个分类法来分类代表性的SBRS研究。最后，我们讨论了这一激动人心且充满活力的领域中的新的研究机会。

摘要中讲到，推荐系统在信息爆炸的情况下扮演着非常重要的作用，基于会话的推荐系统成为了新范式；SBRSs可以捕捉短期的用户偏好，本文主要通过深入探讨SBRS实体（例如，会话）、行为（例如，用户对项目的点击）及其属性（例如，会话长度），解决了会话系统的一些问题。

引言

推荐系统（RSs）已成为一个基础工具，用于在生活的几乎每个日常方面做出更有益、高效和有效的选择和决策，包括工作、商业运作、学习、娱乐和社交[133]。它们在数字经济日益超载的时代变得尤为重要，用户通常需要从大量且快速增长的内容、产品和服务（统称为项目）中做出选择。各种推荐系统研究领域已经取得了巨大成功，例如基于内容的推荐系统[2, 84]、基于协同过滤的推荐系统[24, 98]以及结合前两者的混合推荐系统[8]。

然而，这些推荐系统倾向于利用所有历史用户-项目互动（简称互动，指用户对项目的直接或间接行为，例如用户点击项目的列表）[9]来学习每个用户对项目的长期和静态偏好。这种做法通常与一个潜在假设相关联，即用户的所有历史互动对她当前的偏好同等重要。但在现实世界情况下可能并非如此，主要原因有两点。首先，用户对项目的选择不仅取决于她的长期历史偏好，还取决于她的短期近期偏好和时间敏感的上下文（例如，最近浏览或购买的项目）。这种短期偏好嵌入在用户最近的互动中[52]，这通常只占她历史互动的一小部分。其次，用户对项目的偏好往往是动态而非静态的，即随时间演变。为了弥合推荐系统中的这些差距，近年来会话型推荐系统（SBRSs）越来越受到关注。与上述推荐系统不同，SBRSs从消费过程中关联和生成的会话中学习用户的偏好。每个会话由多个在连续时间内发生的用户-项目互动组成，例如一次交易访问中购买的一篮产品，通常持续几分钟到几小时。通过将会话作为基本输入单位，SBRS能够捕捉用户从最近会话中的短期偏好以及从一个会话到另一个会话的偏好动态变化，以提供更准确和及时的推荐。在本文中，我们提到的SBRSs指的是所有以会话数据为中心来推荐当前会话中的下一个互动或下一个部分会话（即，剩余互动），或者推荐有多个互动的下一个会话的推荐系统（参见第2.2节）。这个定义涵盖了一些研究中狭义上的SBRSs [42, 91]，它们仅推荐当前会话中的下一个互动。此外，它还包括了[91]中讨论的基于会话和会话感知的推荐系统。有许多研究使用不同的术语描述了SBRSs，在不同的设置和假设下，针对不同的应用领域。例如，Hidasi等人[43]在匿名会话数据上构建了一个SBRS，假设每个会话内的互动（例如，点击一个项目或观看一部电影）有严格的顺序，以预测下一个要点击的项目或要观看的视频。胡等人[49]在非匿名会话数据上构建了另一个SBRS，没有会话内部的顺序假设，推荐下一个要购买的项目。荆等人[55]在非匿名会话数据上设计了一个SBRS，假设会话内部有顺序，用于推荐下一首音乐或电影。尽管SBRSs在各个领域广泛存在，并且已经进行了许多相关研究，但由于描述、设置、假设和应用领域的多样性，SBRSs领域存在许多不一致之处。目前还没有一个统一的框架能够很好地对它们进行分类，也没有针对SBRSs的统一问题陈述。更重要的是，关于SBRSs的独特特性，包括其问题和会话数据、由特性引起的研究挑战，以及解决挑战的研究现状和差距，还没有系统的讨论。对于SBRSs的所有代表性和最先进的方法，也没有系统的分类。这些差距限制了SBRSs的理论发展和实际应用。为了解决上述重要方面和差距，本文提供了对SBRSs领域的全面和系统的概述和调查：

• 我们提供了一个统一的框架来分类SBRSs的研究，这可以减少SBRSs领域中的混乱和不一致的观点。
• 我们的工作首次提出了SBRSs的统一问题陈述，其中SBRS建立在正式概念之上：用户、项目、行动、互动和会话。
• 我们提供了对会话数据的独特特性以及由此引发的SBRSs挑战的全面概述。据我们所知，这是第一次这样的描述。
• 对SBRS方法进行了系统的分类和比较，以提供关于如何解决这些挑战以及在SBRS领域取得的进展的整体视图。
• 简要介绍了SBRSs的每类方法及其关键技术细节，以提供对SBRSs取得的进展的深入理解。
• 最后，讨论了SBRS研究的开放问题和前景。

引言部分主要讨论了推荐系统（RSs）的发展、挑战和一种特定类型推荐系统——会话型推荐系统（SBRSs）的兴起。

推荐系统的重要性和发展:

推荐系统已成为在生活的各个方面做出选择的重要工具，例如工作、商业、学习、娱乐和社交。
成功应用多种推荐系统研究，如基于内容的推荐系统、基于协同过滤的推荐系统以及混合推荐系统。

历史用户-项目互动的挑战:

传统推荐系统通常使用所有可用的历史用户-项目互动数据来预测用户的长期偏好。
这种方法假定历史互动可以完全反映用户的当前偏好，但这可能不适用于快速变化或短期内用户偏好发生变动的情况。

会话型推荐系统的出现:

SBRSs专注于短期、动态的用户偏好，通过分析会话数据来提供更准确及时的推荐。
一个会话包括用户在一定时期内的连续互动，例如一次购物篮或观看一系列视频。

会话型推荐系统的特点:

SBRSs利用会话中的数据来捕捉用户的短期偏好和偏好随时间的动态变化。
将会话作为基本的分析单位，有助于更精准地预测用户接下来可能的互动或感兴趣的项目。

会话型推荐系统的研究和分类:

文献中使用不同的术语和设置描述SBRSs，针对各种应用领域展开研究。
目前缺乏统一的框架来分类SBRSs研究，并缺少针对SBRSs的统一问题陈述。

本文的贡献:

提供了SBRSs研究的全面和系统概述，包括统一的分类框架和问题陈述。
分析了会话数据的独特特性和由此引发的挑战，以及SBRSs领域的现状和进展。
对SBRSs方法进行了分类和比较，介绍了关键技术细节。
讨论了SBRSs研究的潜在问题和未来研究方向。

总结来说，这段文字强调了推荐系统特别是会话型推荐系统在理解用户行为和提供个性化推荐方面的重要性，同时指出了当前研究中存在的问题和挑战，并提出了本文旨在解决这些问题的努力和贡献。

SBRSs vs. SRSs

会话型推荐系统（SBRSs）和序列推荐系统（SRSs）分别基于会话数据和序列数据构建，但有些读者常将这两者混淆。因此，首先澄清会话数据与序列数据之间的区别是必要的。会话是具有明确边界的交互列表，而交互可能是按时间顺序排列的（在有序会话中）[43, 92]，或无序的（在无序会话中）[49, 126]。边界指的是开始和结束特定会话的交易事件中的起始-结束交互对。有序（无序）会话指的是会话中的交互是（不是）按时间顺序排列的。给定用户的会话数据通常包含在不同时间发生并由多个边界分隔的多个会话，并且会话之间的时间间隔不相同（参见图 1 (a)）。序列是具有明确顺序的历史元素（例如，项目ID）列表。给定用户的序列数据通常只包含一个序列，并且只有一个边界（参见图 1 (b)）。在大多数序列数据中，时间戳仅用于对序列内的元素进行排序，而没有包括和考虑明确的时间间隔[91]。边界通常表明在其内部的交互或元素之间的共现依赖性[9]。共现依赖性构成了SBRSs的基础，特别是那些基于无序会话数据构建的SBRSs。顺序意味着会话或序列内的交互或元素之间存在明确的序列依赖性。我们在表1中展示了某个用户的会话数据和序列数据之间的区别。SBRS的目标是通过学习会话内部或会话之间的依赖性，预测给定已知部分的会话的未知部分（例如，一个项目或一批项目），或者给定历史会话的未来会话（例如，下一个购物篮）。这样的依赖性通常在很大程度上依赖于会话内交互的共现，它们可能是顺序的或非顺序的[49]。原则上，SBRS不一定依赖于会话内的顺序信息，但对于有序会话，自然存在的顺序依赖性可以用于推荐。相比之下，SRS通过学习它们之间的顺序依赖性来预测给定一系列历史元素的后续元素。有几篇综述文章特别关注了SRSs，包括序列感知推荐系统[91]、深度学习用于顺序推荐[27]和顺序推荐系统[128]。在这项调查中，我们特别关注SBRSs领域，强调会话数据的独特特性以及它们给SBRSs带来的挑战，以及SBRSs的代表性和最先进方法。

要点总结：

SBRSs和SRSs分别基于会话数据和序列数据构建，但有时会被混淆。
会话是有明确边界的交互列表，可能是有序的或无序的。
边界是指开始和结束特定会话的交互对。
会话数据包含多个不同时间的会话，时间间隔不同；序列数据通常只含一个序列和一个边界。
序列数据中的时间戳通常仅用于排序，不考虑明确的时间间隔。
边界表明共现依赖性，是SBRSs的基础。
SBRSs预测会话的未知部分或未来会话，依赖性可能基于共现，可能是顺序的或非顺序的。
SBRSs不一定依赖会话内的顺序信息，但有序会话的序列依赖性可用于推荐。
SRSs通过学习顺序依赖性来预测后续元素。
本文关注的是SBRSs领域，特别是会话数据的特性、挑战以及代表性和最先进方法。

A Framework for Organizing SBRS Work

对SBRSs现有工作的多样性通常可以分为三个子领域，这些子领域适合统一的分类框架，以减少上述的不一致性和混淆。根据推荐任务的不同，这些子领域包括下一次互动推荐、下一局部会话推荐和下一会话推荐。给定会话的已知部分（即已发生的互动），下一次互动推荐旨在通过主要建模会话内的依赖性来推荐当前会话中的下一个可能互动。这通常被简化为预测下一个要互动的项目，例如点击或购买的产品。给定会话的已知部分，下一局部会话推荐旨在推荐所有剩余的互动以完成当前会话，例如，给定购物篮中已购买的商品，预测所有后续商品以完成篮子，这主要是通过建模会话内的依赖性。尽管研究较少，但这个子领域在现实世界案例中甚至更加实用，因为用户通常不会在下一个只互动一个项目，而是多个项目，直到她结束整个会话。给定历史会话，下一会话推荐旨在通过主要建模会话间的依赖性来推荐下一个会话，例如下一个购物篮。有时，会话间的依赖性也被结合到前两个子领域中，以提高推荐性能。这些子领域的比较在表2中展示。

总结来说，这一小节讲的内容要点如下：

SBRSs的研究可以分为三个子领域：下一次互动推荐、下一局部会话推荐和下一会话推荐。
下一次互动推荐关注在当前会话中推荐下一个可能的互动，通常简化为预测下一个项目。
下一局部会话推荐关注推荐当前会话剩余的互动，例如预测购物篮中剩余的商品。
下一会话推荐关注基于历史会话数据推荐下一个会话，例如下一个购物篮。
各子领域之间可能会结合会话间依赖性以提高推荐性能。
子领域之间的比较在文中的表2展示。

SBRS PROBLEM STATEMENT

推荐系统（RS）可以被视为一个系统[9, 10]，它由多个基本实体组成，包括用户、项目及其行为，例如用户-项目的互动。这些基本实体和行为形成了会话的核心组成部分，而会话是SBRS中的核心实体。因此，我们首先介绍这些实体和行为的定义和属性，然后基于它们定义SBRS问题。这些定义和属性将用于SBRS的表征和分类等。主要符号列在表3中。

User and User Properties

在SBRS中的用户是采取行动的主体，例如对商品进行点击、购买，并接收推荐结果。用??表示一个用户，每个用户都与一个独特的ID和一组属性相关联，这些属性描述了她的特征，例如用户的性别，它有多个值，例如男性和女性。用户的属性可能会影响她对项目的行为，并进一步影响相应的会话。例如，一个男孩可能会观看更多的动作电影，导致在他的观看会话中有更多动作电影，而一个女孩可能更喜欢观看爱情故事电影。除了可以明显观察到的显式属性外，一些反映用户内部状态的隐式属性，例如她的情绪和意图，也可能对她的行为产生重大影响。所有用户共同形成了用户集，即?? = {??1, ??2, ..., ??|?? | }。请注意，由于两个原因，会话中的用户信息并不总是可用的：(1) 由于隐私保护没有记录；(2) 一些用户在与在线平台（如amazon.com）互动时没有登录。因此，会话变成了匿名的。

Item and Item Properties

在SBRS中，项目是被推荐的实体，例如产品（如书籍）或服务（如课程）。用??表示一个项目，它与一个独特的ID和一组属性相关联，以提供项目的描述信息，如项目的类别和价格。数据集中的所有项目形成了项目集，即?? = {??1, ??2, ..., ??|?? | }。通常，不同领域的项目是不同的。例如，在新闻推荐领域，项目是发布在新闻网站上的新闻文章，如abc.com上的人工智能报道；在电子商务领域，项目是待售产品，如amazon.com上的耳机；在服务行业，项目是特定服务，如Coursera提供的"机器学习"课程（https://www.coursera.org/）。

Action and Action Properties

在会话中，用户对项目执行的操作通常被视为一个动作，例如点击一个项目。用??表示一个动作，该动作与一个独特的ID和一组属性相关联，以提供其属性信息，例如动作的类型，并且具有多个值，例如点击、查看和购买。请注意，一些动作可能不与特定项目关联，例如搜索动作或目录导航动作。但正如[91]中所讨论的，它们仍然可以为SBRS提供有用的信息。

结尾

今天的论文先读到这了，快过年了；总结来说，一个月左右，读的论文也不少了，龙年快乐

标签：based,推荐,系统,用户,会话,session,survey,SBRSs,SBRS
From： https://www.cnblogs.com/wephilos/p/18119931