首页 > 其他分享 >Large Language Models as Data Augmenters for Cold-Start Item Recommendation论文阅读笔记

Large Language Models as Data Augmenters for Cold-Start Item Recommendation论文阅读笔记

时间:2024-05-30 20:34:27浏览次数:31  
标签:Language 项目 Models 推荐 用户 Item 偏好 冷启动 LLM

Large Language Models as Data Augmenters for Cold-Start Item Recommendation论文阅读笔记

Abstract

​ LLM的推理和泛化能力可以帮助我们更好地理解用户的偏好和项目特征。我们建议利用LLM作为数据增强器,来弥补在训练过程中对冷启动项目的知识差距。我们使用LLM根据用户历史行为的文本描述和新项目描述来推断用户对冷启动项目的偏好。然后通过辅助的成对损失将增强的训练信号纳入学习下游推荐模型。

Introduction

​ 为了缓解冷启动 问题,基于内容的推荐系统利用项目元特征来帮助项目表示学习,即用元特征的转换或它们的组合来替换基于的项目嵌入。希望通过共享元特征将交互作用丰富的项目推广到冷启动项目。

​ 当前已经有方法将用户查询和内容功能转化为文本,并利用生成的LLM模型来构建无id的推荐系统的前景。然而,仍然有必要对大型预训练的模态编码器进行微调,以获得推荐(即参数和架构),这是一个资源密集型的步骤,需要大量的工程工作。此外,为LLM或大型基础模型服务获得这些方法要求的推荐结果的延迟通常超过推荐平台上预期的响应时间。因此,满足工业推荐系统的每秒查询要求是非常昂贵的。

​ 为了转移LLM的能力来解决长期存在的推荐冷启动问题,而不是在服务阶段插入它们,我们研究了它们在当前推荐系统的训练阶段填补数据缺口方面的潜力。在之前的作品中,我们观察到LLM能够理解用户的行为(带有适当的提示),并为用户感兴趣的内容生成上下文(即,直接生成项目或相关主题的标题)

​ 我们要回答的问题是:

​ 1)我们可以利用LLM的推理和泛化能力来生成冷启动项目的合成用户行为

​ 2)通过这些综合交互增加冷启动项目的训练数据是否能提高经典推荐模型的学习?

​ 有了这种与模型无关的方法,我们可以在服务时间期间绕过对LLM推理的慢速API调用,也可以解决冷启动项的数据稀疏性问题。此外,作为数据预处理步骤的增强过程可以很容易地集成到任何工业规模的推荐系统中,为利用LLM的泛化能力提供了一种可扩展的方法。

​ 本文的主要贡献如下:

  • 我们建议进行两两比较,促使LLM根据用户的历史交互来推断用户在项目对之间的偏好;
  • 我们将这些LLM生成的合成用户偏好与两两损失集成,作为常规推荐任务的补充;

Method

增强数据生成

​ 使用PALM,且不进行微调。在应用的过程中,我们简单地将用户交互的项的描述放到提示中。具体来说,在训练集中给定一个用户,我们采用描述性项目标题来表示每个历史交互。为了从这个描述性的用户查询中推断出用户的偏好,我们可以询问用户他/她是否想要一个特定的冷启动项目(点态),或者询问他们他/她是否更喜欢冷启动项目A或B(成对)。相比于点态估计,LLM在成对的任务上的表现更好。

​ 因此,我们探测llm,以在给定用户查询的冷启动项之间生成成对的偏好。特别是,我们使用\(A,B\in I_{cold}\)随机抽样一个项目对(

标签:Language,项目,Models,推荐,用户,Item,偏好,冷启动,LLM
From: https://www.cnblogs.com/anewpro-techshare/p/18223156

相关文章

  • TabControl和TabItem的样式自定义:为什么要使用自定义模板?
    在WPF(WindowsPresentationFoundation)中,控件的外观和行为是通过控件模板(ControlTemplate)来定义的。TabControl和TabItem控件也不例外,它们的默认控件模板定义了这些控件的结构和视觉状态。在实际应用中,开发者可能会发现直接设置TabItem的某些属性(例如Background)时不会生效。这篇......
  • Re-Search for The Truth Multi-round Retrieval-augmented Large Language Models ar
    本文是LLM系列文章,针对《Re-SearchforTheTruth:Multi-roundRetrieval-augmentedLargeLanguageModelsareStrongFakeNewsDetectors》的翻译。重新寻找真相:多轮检索增强的大型语言模型是强大的假新闻检测器摘要1引言2相关工作3方法4实验5结论局限......
  • Unmasking the Shadows of AI: Investigating Deceptive Capabilities in Large Langu
    本文是LLM系列文章,针对《UnmaskingtheShadowsofAI:InvestigatingDeceptiveCapabilitiesinLargeLanguageModels》的翻译。揭开人工智能的阴影:大型语言模型中的欺骗能力研究摘要2023年人工智能安全峰会:它实际实现了什么?AI欺骗的意义LLM和LLM中的偏见关于......
  • Learning Transferable Visual Models From Natural Language Supervision
    郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布!Proceedingsofthe38thInternationalConferenceonMachineLearning,PMLR139,2021.  Abstract 1.IntroductionandMotivatingWork 2.Approach 2.1.CreatingaSufficientlyLargeDataset ......
  • DDL(Data Definition Language)数据定义语句
    DDL语句的主要作用是定义或修改数据表的结构或数据类型。数据表的创建:CREATETABLE{表名}({字段名}{数据类型}{限制条件1}{限制条件2}...,{字段名}{数据类型}{限制条件1}{限制条件2}...);注:*每个字段之间需要写逗号*限制条件可以不加示例:#创......
  • Deep Models Under the GAN: Information Leakage from Collaborative Deep Learning
    最近要看一些推理攻击的内容,把看过的都放过来吧DeepModelsUndertheGAN:InformationLeakagefromCollaborativeDeepLearningGAN下的深度模型:协作深度学习的信息泄漏ACMCCS2017文章目录一、论文信息1.题目2.作者3.期刊年限4.关键词二、背景三、创新......
  • 怎么使用Stable diffusion中的models
    Stablediffusion中的modelsStablediffusionmodel也可以叫做checkpointmodel,是预先训练好的Stablediffusion权重,用于生成特定风格的图像。模型生成的图像类型取决于训练图像。如果训练数据中从未出现过猫的图像,模型就无法生成猫的图像。同样,如果只用猫的图像来训练模型,它也......
  • FEL - Fast Expression Language
    开源好用的表达式计算语言FEL,可惜了官网文档不在国内,我来个过来。Fel是轻量级的高效的表达式计算引擎Fel在源自于企业项目,设计目标是为了满足不断变化的功能需求和性能需求。Fel是开放的,引擎执行中的多个模块都可以扩展或替换。Fel的执行主要是通过函数实现,运算符(+、-等都是F......
  • 深度解读速卖通aliexpress.item_review API评论数据
    速卖通(AliExpress)是一个全球知名的跨境电商平台,它提供了各种API接口供开发者使用,以获取平台上的数据。其中,item_review API可能是指用于获取商品评论的API(请注意,实际的API接口名称和参数可能会根据速卖通平台的更新而有所变化)。在深度解读这个API时,我们需要考虑以下几个方面......
  • CMU 15-445 Lecture #05: Storage Models & Compression笔记总结(上)
    这是cmu15-445第五节课程StorageModels&Compression的上半部分,主要包括StorageModels的内容,压缩部分下次再整理,学完这部分可以去做hw2的第一部分课程主页:CMU15-445/645::IntrotoDatabaseSystems(Fall2023)(有几张图片目前没上传,过两天补一下)DatabaseWorkloads......