首页 > 其他分享 >WWW‘24:Collaborative Large Language Model for Recommender Systems文献阅读

WWW‘24:Collaborative Large Language Model for Recommender Systems文献阅读

时间:2025-01-10 15:03:24浏览次数:3  
标签:24 WWW Recommender 项目 CLLM4Rec 标记 用户 LLM 推荐

摘要

本文介绍了一种新型的基于协同大型语言模型(CLLM4Rec)的推荐系统,该系统将传统的基于ID的推荐系统范式与基于大型语言模型(LLM)的范式相结合,旨在解决自然语言与推荐任务之间语义差异的问题。通过引入用户/项目ID标记和创新的软+硬提示策略,CLLM4Rec能够有效地学习用户和项目的协同和内容语义,从而提高推荐的准确性和效率。

相关工作

推荐系统

推荐系统(RS)是在线服务平台的重要组成部分,主要分为基于ID的推荐系统和基于内容的推荐系统。基于ID的推荐系统通过学习用户和项目的ID嵌入来表示其语义相似性,如矩阵分解和双塔模型等方法。而基于内容的推荐系统则通过分析用户和项目的文本特征来进行推荐。

大型语言模型

近年来,大型语言模型(LLM)在自然语言处理领域取得了显著进展。例如,GPT、T5和LLaMA等模型在大规模语料库上进行预训练,展现出对自然语言的深刻理解和逻辑推理能力。然而,将LLM应用于推荐系统仍面临诸多挑战,如自然语言与用户/项目语义之间的语义差异等。

CLLM4Rec模型

模型结构

CLLM4Rec模型的核心在于将用户和项目的ID标记引入到预训练的LLM中,以更好地捕捉用户和项目的协同和内容语义。模型结构如下:

  • 词汇扩展:在LLM的词汇表中添加用户和项目的ID标记,如<user_i><item_j>
  • 标记嵌入:为新引入的用户和项目标记学习嵌入向量,这些嵌入向量与词汇表空间对齐,以准确表示用户和项目的协同和内容语义。
  • 软+硬提示策略:将文档分解为包含软(用户/项目)标记和硬(词汇)标记的提示部分,以及由同质项目标记或词汇标记组成的正文部分,以促进稳定有效的语言建模。

输入输出转变

  • 输入:CLLM4Rec的输入包括用户和项目的交互历史以及用户和项目的文本特征。例如,用户与项目的交互历史可以表示为<user_i> has interacted with <item_j> <item_k>,而项目的文本特征可以表示为<item_j> is a computer
  • 输出:模型的输出是基于输入提示生成的项目预测,如预测用户可能感兴趣的下一个项目。

方法介绍

互惠正则化预训练

CLLM4Rec采用互惠正则化策略进行预训练,以学习用户和项目的协同和内容标记嵌入。具体步骤如下:

  • 协同LLM:通过语言建模学习用户和项目的协同信息,将用户与交互项目的标记嵌入推向彼此靠近。
  • 内容LLM:通过语言建模学习用户和项目的内容信息,将用户和项目的文本特征编码到内容标记嵌入中。
  • 互惠正则化:协同LLM和内容LLM相互引导,协同LLM从用户/项目内容中捕获与推荐相关的信息,而内容LLM则引入辅助信息以支持协同过滤。

推荐导向的微调

在预训练的基础上,CLLM4Rec进一步进行推荐导向的微调,以提高推荐的效率和准确性。具体步骤如下:

  • 掩码提示:随机掩码用户交互历史中的部分项目,生成推荐导向的提示和目标。
  • 多项式预测头:在预训练的协同LLM基础上添加新的项目预测头,采用多项式似然进行推荐生成。

创新点

  • 软+硬提示策略:通过将文档分解为软(用户/项目)标记和硬(词汇)标记的提示部分,以及同质项目标记或词汇标记的正文部分,CLLM4Rec能够有效地进行语言建模,提高模型的稳定性和有效性。
  • 互惠正则化预训练:协同LLM和内容LLM相互引导,协同LLM从用户/项目内容中捕获与推荐相关的信息,而内容LLM则引入辅助信息以支持协同过滤,从而提高推荐的准确性和效率。
  • 推荐导向的微调:通过掩码提示和多项式预测头,CLLM4Rec能够在单次前向传播中高效地生成推荐,避免了幻觉问题。

实验

数据集

实验使用了四个公共数据集(Amazon Beauty、Amazon Toys、Amazon Sports和Yelp)以及LinkedIn的工作推荐数据集。数据集的统计信息如下表所示:

数据集#Int.#Users#ItemsSparsity#Feat.
AM-Beauty94,14810,5536,08699.85%70,604
AM-Toys95,42011,2687,30999.88%70,784
AM-Sports185,71822,68612,30199.93%137,618
Yelp292,01728,33018,77599.94%224,825
LinkedIn90,17322,3911,07199.62%23,362

实验结果

实验结果表明,CLLM4Rec在各个数据集上的性能均优于现有的基于ID和基于LLM的推荐系统。例如,在Amazon Beauty数据集上,CLLM4Rec的Recall@20、Recall@40和NDCG@100指标分别为0.1656、0.2323和0.1118,显著高于其他基线模型。

结论

CLLM4Rec作为一种新型的推荐系统,通过将基于ID的推荐系统范式与基于LLM的范式相结合,有效地解决了自然语言与推荐任务之间的语义差异问题。通过引入用户/项目ID标记和创新的软+硬提示策略,CLLM4Rec能够准确地捕捉用户和项目的协同和内容语义,从而提高推荐的准确性和效率。实验结果表明,CLLM4Rec在多个数据集上的性能均优于现有的推荐系统,具有广泛的应用前景。

标签:24,WWW,Recommender,项目,CLLM4Rec,标记,用户,LLM,推荐
From: https://blog.csdn.net/HE2096798708/article/details/145023559

相关文章

  • XMind v24 免费版下载及安装教程
    前言XMind是一款专业的全球领先的商业思维导图软件,在国内使用广泛,拥有强大的功能、包括思维管理、商务演示、与办公软件协同工作等功能。它采用全球先进的EclipseRCP软件架构,是集思维导图与头脑风暴于一体的可视化思考工具,能用来捕捉想法、理清思路、管理复杂信息并促进团队协......
  • GESP1级2409 美丽数字
    题目描述小杨有n个正整数,他认为一个正整数是美丽数字当且仅当该正整数是9的倍数但不是8的倍数。小杨想请你编写一个程序计算个正整数中美丽数字的数量。输入第一行包含一个正整数n,代表正整数个数。第二行包含n个正整数a1,a2,a3,...,an。输出输出一个整数,代表其中......
  • 2024年终总结-gxngxngxn
    2024年终总结-gxngxngxn引言原本应该早就写完这一篇年终总结的,但由于期末和一些琐事,一直没时间,一拖再拖。到了最近放假了,才得空下笔。想写年终总结的想法起源于去年的这个时候,也就是2024年的一月份左右。那时我如往常一样打开收藏的大佬们的博客,映入眼帘的便是一篇篇年终总结......
  • Windows 11 Hyper-V 运行WSL2(Windows Subsystem for Linux ) openEuler 从 22.09升级24
    版本  Windows11专业版版本号  22H2安装日期  ‎2023/‎3/‎19操作系统版本  22621.4387体验  WindowsFeatureExperiencePack1000.22700.1047.0-[archives.openeuler.openatom.cn/openEuler-22.09/everything/x86\_64/](https://archives.openeuler.o......
  • NeurIPS 2024最佳论文,扩散模型的创新替代:基于多尺度预测的视觉自回归架构
    本文将详细解读NeurIPS2024最佳论文:**"VisualAutoregressiveModeling:ScalableImageGenerationviaNext-ScalePrediction(视觉自回归建模:基于下一尺度预测的可扩展图像生成)"**。该论文提出了视觉自回归建模(VisualAutoregressiveModeling,VAR)方法,在图像生成领域实现了重要......
  • 【Vulkan入门】24-控制视角
    文章目录先叨叨代码信息具体思路关键代码SDL_AppEventCamera::UpdatePositonCamera::UpdateFaceVulkanRenderer::UpdateUniformBuffer运行效果先叨叨在实现深度测试后,已经可以实现简单的3D渲染了。为了今后能更好的观察3D效果,所以需要在渲染时动态变换视角。本篇就......
  • 【专题】2024年直播、短视频:抖音、小红书、快手行业报告汇总PDF合集分享(附原数据表)
    原文链接: https://tecdat.cn/?p=38697在当今数字化飞速发展的时代,直播、短视频行业已然成为了大众生活与商业运作中不容忽视的重要力量,正不断重塑着信息传播与消费的格局。2024年,这一领域更是呈现出多元且复杂的发展态势。从内容创作者生态来看,抖音、小红书、快手等平台各有热......
  • 2024年最新IDE激活码,激活到2099年,可用一辈子!
    KQ8KMJ77TY-eyJsaWNlbnNlSWQiOiJLUThLTUo3N1RZIiwibGljZW5zZWVOYW1lIjoiVW5pdmVyc2l0YXMgTmVnZXJpIE1hbGFuZyIsImxpY2Vuc2VlVHlwZSI6IkNMQVNTUk9PTSIsImFzc2lnbmVlTmFtZSI6IkpldOWFqOWutuahtiDorqTlh4blupflkI0iLCJhc3NpZ25lZUVtYWlsIjoibmtucWFyY214a0AxNjMuY29tIiwibGljZW5z......
  • 2024年生成式AI技术实践进展和应用突破(附最佳实践资料)
    2024年生成式AI技术在多个领域取得了显著的实践进展和应用突破,以下是一些关键的实践案例和技术进展:视觉影像领域可灵AI:采用类Sora的“DiT”结构,以Transformer替代传统扩散模型中的U-Net,显著提升了视频生成的处理能力和效率。其核心优势在于能生成大幅度的合理运动、模拟物理......
  • AI Agent(智能体)技术白皮书(Google,2024)中文+英文
    译者序本文翻译自2024年Google团队的一份 Agents白皮书,作者JuliaWiesinger,PatrickMarlow,VladimirVuskovic。Agent可以理解为是一个扩展了大模型出厂能力的应用程序。工具的使用,是人类区别于动物的标志——也是Agent区别于大模型的标志。水平及维护精力所......