读论文-电子商务产品推荐的序列推荐系统综述与分类(A Survey and Taxonomy of Sequential Recommender Systems for E-commerce Prod

标签：commerce Product 顺序项目 Taxonomy 推荐系统用户序列

前言

今天读的这篇文章是于2023年发表在"SN Computer Science"上的一篇论文，这篇文章主要对序列推荐系统进行了全面的调查和分类，特别是在电子商务领域的应用。文章首先定义了用户和产品集合，以及用户与产品的交互序列。然后，它解释了序列推荐系统的目标，即生成一个个性化的Top-K排名的候选项目列表，以最大化用户的未来需求。这种系统通过建模用户和产品之间的交互序列（如点击、查看或购买在线购物平台上的物品）来建议可能对用户感兴趣的项目。文章还讨论了一些用于改进推荐系统效果的方法，例如使用时间戳来表示用户的行为序列，以及使用“兴趣序列”来描绘用户的兴趣演变模式。

Nasir, Mahreen, and C. I. Ezeife. "A Survey and Taxonomy of Sequential Recommender Systems for E-commerce Product Recommendation." SN Computer Science 4.6 (2023): 708.

Abstract 摘要

E-commerce recommendation systems facilitate customers’ purchase decision by recommending products or services of interest (e.g., Amazon). Designing a recommender system tailored toward an individual customer’s need is crucial for retailers to increase revenue and retain customers’ loyalty. As users’ interests and preferences change with time, the time stamp of a user interaction (click, view or purchase event) is an important characteristic to learn sequential patterns from these user interactions and, hence, understand users’ long- and short-term preferences to predict the next item(s) for recommendation. This paper presents a taxonomy of sequential recommendation systems (SRecSys) with a focus on e-commerce product recommendation as an application and classifes SRecSys under three main categories as: (i) traditional approaches (sequence similarity, frequent pattern mining and sequential pattern mining), (ii) factorization and latent representation (matrix factorization and Markov models) and (iii) neural network-based approaches (deep neural networks, advanced models). This classifcation contributes towards enhancing the understanding of existing SRecSys in the literature with the application domain of e-commerce product recommendation and provides current status of the solutions available alongwith future research directions. Furthermore, a classifcation of surveyed systems according to eight important key features supported by the techniques along with their limitations is also presented. A comparative performance analysis of the presented SRecSys based on experiments performed on e-commerce data sets (Amazon and Online Retail) showed that integrating sequential purchase patterns into the recommendation process and modeling users’ sequential behavior improves the quality of recommendations.

电子商务推荐系统通过推荐客户感兴趣的产品或服务来促进客户的购买决策(如亚马逊)。设计一个针对个别顾客需求的推荐系统对零售商增加收入和保持顾客忠诚度至关重要。由于用户的兴趣和偏好随时间而变化，用户交互(点击、查看或购买事件)的时间戳是从这些用户交互中学习顺序模式的重要特征，从而了解用户的长期和短期偏好，以预测下一个要推荐的项目。本文提出了顺序推荐系统(SRecSys)的分类，重点介绍了电子商务产品推荐的应用，并将SRecSys分为三大类:(i)传统方法(序列相似性，频繁模式挖掘和顺序模式挖掘)，(ii)分解和潜在表示(矩阵分解和马尔可夫模型)和(iii)基于神经网络的方法(深度神经网络，高级模型)。这种分类有助于加强对现有文献中电子商务产品推荐应用领域的SRecSys的理解，并提供了现有解决方案的现状以及未来的研究方向。此外，还根据这些技术支持的八个重要关键特征及其局限性对调查系统进行了分类。基于电子商务数据集(亚马逊和在线零售)的实验，对所提出的SRecSys进行性能对比分析表明，将顺序购买模式集成到推荐过程中并对用户的顺序行为建模可以提高推荐的质量。

摘要部分主要介绍了电子商务推荐系统以及针对个体用户需求设计定制化推荐系统的重要性。随着用户兴趣和偏好随时间变化，用户交互（点击、浏览或购买事件）的时间戳成为学习用户交互序列模式和理解用户长期和短期偏好的重要特征。本文提出了顺序推荐系统（Sequential Recommender Systems, SRecSys）的分类法，并以电子商务产品推荐为应用领域进行了分类。分类包括传统方法（序列相似性、频繁模式挖掘和顺序模式挖掘）、分解和潜在表示（矩阵分解和马尔可夫模型）以及基于神经网络的方法（深度神经网络和高级模型）。该分类有助于增进对现有SRecSys在文献中的理解，并提供了当前可用解决方案的现状以及未来的研究方向。此外，还根据技术支持的八个重要关键特征以及它们的局限性对调查系统进行了分类。对基于电子商务数据集（如亚马逊和在线零售）进行的实验进行了比较性能分析，结果表明将顺序购买模式整合到推荐过程中并建模用户的顺序行为可以提高推荐的质量。

引言

文章的摘要部分主要介绍了电子商务推荐系统（RS）以及它们在帮助用户做出购买决策方面的重要性。推荐系统根据用户的兴趣提供建议，许多公司和服务提供商如亚马逊、Facebook、Netflix和Career Builders都提供针对产品、朋友、电影和工作的推荐。电子商务推荐系统帮助客户做出决策，通过推荐可能符合他们兴趣的商品，缩小了在成千上万种可用产品中的选择范围，节省了客户的时间。顶级科技电子商务公司（如亚马逊、阿里巴巴）采用定制化的推荐系统来满足不断增长的客户需求并保持市场份额。其中最常用的推荐技术之一是协同过滤（CF），它根据其他相似用户的喜好推荐给用户可能感兴趣的产品。然而，CF存在一些限制，如评分矩阵稀疏（用户只对少数几个商品进行评分）和冷启动问题（新商品在没有评分的情况下无法进行推荐）。为了解决这些问题，引入了混合推荐系统，综合考虑用户对商品的偏好和商品的内容特征来生成推荐。电子商务推荐系统面临的挑战包括冷启动问题、数据稀疏性以及推荐多样性等。

首先，作者提到推荐系统在帮助用户做出购买决策方面的重要性。通过根据用户的兴趣和喜好提供个性化的推荐，推荐系统可以大大改善用户的购物体验，并帮助用户发现他们可能感兴趣的产品。这对于电子商务公司来说尤为关键，因为它们需要增加收入并保持客户的忠诚度。

接下来，作者介绍了协同过滤（CF）作为一种常用的推荐技术。CF基于用户之间的相似性来进行推荐，即如果两个用户具有相似的喜好和行为模式，那么他们可能对相似的产品感兴趣。然而，CF也存在一些限制，如评分矩阵的稀疏性和冷启动问题。评分矩阵的稀疏性指的是用户只对少数几个商品进行评分，导致推荐系统难以准确地了解用户的喜好。冷启动问题则指的是新商品在没有足够的评分数据的情况下无法进行有效的推荐。

为了应对这些挑战，作者提出了混合推荐系统的概念。混合推荐系统综合考虑了用户对商品的偏好以及商品的内容特征，从而生成更准确和多样化的推荐结果。这种方法可以弥补传统协同过滤方法的局限性，并提供更好的推荐性能。

在电子商务推荐系统中，还存在一些挑战需要克服。其中包括冷启动问题，即如何在新用户或新商品加入系统时进行有效的推荐；数据稀疏性，即评分矩阵中的缺失数据导致难以进行准确的推荐；以及推荐多样性，即如何确保推荐结果既满足用户的兴趣又具有多样性。

总之，引言部分详细介绍了电子商务推荐系统的重要性，并讨论了相关的挑战。这为后续的论文内容和研究方法提供了背景和基础。

Overview of Sequential Recommendation 序列推荐综述

顺序推荐系统通过对用户-物品交互(例如，在在线购物平台上点击、查看或购买物品)的顺序依赖关系进行建模来建议用户可能感兴趣的物品[12]。通过反映事件(例如，点击或购买)对前一个事件的顺序依赖关系，学习项目之间的顺序依赖关系有助于对用户偏好进行建模。顺序推荐器将用户交互视为一个序列，并预测用户将与之交互的下一个项目。用户与之交互的物品(例如，点击、评分或购买)可以强烈地表明用户的兴趣，并有助于了解良好的用户资料，从而提供符合其兴趣的推荐。然而，用户的兴趣和偏好会随着时间而变化。用户交互(点击或购买事件)的时间戳是一个重要的属性，学习基于时间戳的用户交互的顺序模式对于(i)理解用户的长期和短期偏好以及(ii)预测用户购买的下一个项目是有用的，因为任何此类交互之间的时间间隔提供了关于用户行为的有用见解。在现实世界中，用户与物品的交互(例如，购物行为)大多是顺序依赖的。例如，在图2中，我们可以看到用户Smith的顺序依赖关系。在史密斯购买了相机、存储卡和相机外壳之后，他下一步将购买什么物品?这种顺序依赖关系在交易数据中普遍存在，但传统的协同过滤和基于内容的推荐系统无法捕获这些顺序依赖关系，因此需要开发顺序推荐系统。

Taxonomy of Sequential Recommendation 顺序推荐分类法

序列推荐系统分为三大类:

传统方法(序列相似性、频繁模式挖掘和序列模式挖掘)，
因子分解和潜在表示方法(矩阵分解和马尔可夫模型)，
基于神经网络的方法(深度神经网络，高级模型)，并详细介绍了其理论方面的细节、解决问题的潜力和局限性。后续章节将回顾在序列推荐系统中用于学习物品之间的序列关系以进行下一个物品推荐的相关方法。

Sequence Similarity Based 基于序列相似性

这些方法的目标是通过基于相似度度量计算相似度来发现项目或序列之间的关系，然后利用与目标用户序列相似的序列来推荐下一个项目。这些关系反映了事件(例如，点击或购买)对其前一个事件的顺序依赖性。顺序依赖关系的粒度可以在项目级别(单个项目)或序列级别(包含多个项目集，其中每个项目集可以是单个项目或项目集合)。

Frequent Pattern Mining 频繁模式挖掘

频繁模式挖掘的目标是找到事务数据库中频繁出现的项目之间的关系(模式)，然后利用挖掘的模式指导后续的下一个项目建议。

首先引入关联规则[21]来发现超市数据中商品之间的关系。考虑一个客户购买的事务数据库，T = {T1, T2，…， Tm}，包含m个事务，这些事务定义在项目i上。

每个事务Ti是i中项目的一个子集。为了找到项目之间的这些关系，使用了两个度量，支持度和置信度。项的支持度是对该项在事务数据库中出现的频率(出现次数)的度量。最小支持阈值用于确定项目是否频繁。如果一个项目的支持度大于或等于最小支持度，那么它就被称为频繁项目。这些频繁项目或频繁模式可以用于提供有关客户购买行为的有价值的见解。

例如，考虑表1中客户购买的数据。行对应客户，列对应项目。“15”指的是某一位顾客购买了某件商品的情况。这些被划分为两组密切相关的项目。其中一组是{苹果，橘子，香蕉}，另一组是{面包，黄油，牛奶}。这些是仅有的至少包含三个项目的项目集，它们也至少支持0.2。因此，这两个项目集都是频繁项目集或频繁模式。

找到这种高支持的模式对商家很有用，因为他可以使用它们来提出建议和其他有针对性的营销决策。例如，可以得出结论，用户2最终可能会购买面包，因为他已经购买了{黄油，牛奶}。同样，用户5也可能购买橙子，因为他已经购买了{苹果，香蕉}。从顺序推荐系统的角度来看，这样的推断是非常有用的。使用关联规则和置信度的概念，可以根据这些相关性的方向获得另一种见解。关联规则以X→Y的形式表示，它表示项目X和Y之间的相关性。例如，{黄油，牛奶}→{面包}这样的规则对于向User2推荐面包非常有用，因为它已经知道他购买了牛奶和黄油。这种规则的力量是由它的信心来衡量的。

规则X→Y的置信度是“假设T中的交易也包含X，它包含Y的条件概率”。信心值越高，总是表明规则的强度越大。关联规则是在最小支持度s和最小置信度c的基础上定义的。频繁模式挖掘和关联规则挖掘中最早的工作之一是Apriori算法[21]。给定一个事务数据库和最小支持阈值，该算法挖掘事务数据库以查找关联规则的频繁项集。该算法基于两个重要步骤，即(a)连接和(b)修剪。下面是使用Apriori算法生成候选项的步骤[21]。

结尾

今天的论文就先读到这了，明天见朋友们！2024-02-06 10:04:21 星期二

标签：commerce,Product,顺序,项目,Taxonomy,推荐,系统,用户,序列
From： https://www.cnblogs.com/wephilos/p/18119913