首页 > 其他分享 >ONCE论文阅读笔记

ONCE论文阅读笔记

时间:2024-09-09 09:51:54浏览次数:7  
标签:mathbf 模型 论文 用户 笔记 生成 内容 LLM ONCE

ONCE: Boosting Content-based Recommendation with Both Open- and Closed-source Large Language Models论文阅读笔记

Abstract

​ 现有的推荐器在理解项目内容方面面临着巨大挑战。大语言模型(LLM)拥有深层语义理解能力和来自预训练的广泛知识,已被证明在各种自然语言处理任务中非常有效。在本研究中,我们探讨了利用开源和闭源 LLM 增强基于内容的推荐的潜力。对于开源 LLM,我们利用其深层作为内容编码器,在嵌入层丰富内容的表示。对于闭源 LLM,我们采用提示技术来丰富标记层的训练数据。

Introduction

​ 第一段介绍基于内容的推荐系统及其重要性

​ 第二段介绍内容推荐的核心组成部分,内容编码器,并提出缺点

​ 第三段举例介绍以前内容编码器的局限性

​ 第四段提出方法,说GPT能够解决上面的局限性

​ 第五段介绍提出的方法

​ 在本文中,我们研究了通过利用 OpeN- 和 ClosEdsource (ONCE) LLMs 来增强基于内容的推荐的可能性。如图 1 所示,我们的 ONCE 方法针对不同类型的 LLM 采用了不同的策略。对于像 LLaMA 这样的开源 LLM,我们采用了一种名为 DIRE 的鉴别性推荐方法,这让人想起 PLM-NR方法,即用 LLM 取代原始内容编码器。这使我们能够提取内容表征,并专门针对推荐任务对模型进行微调,最终增强用户建模和内容理解能力。相反,对于像 GPT-3.5 这样的闭源 LLM(我们只能访问标记输出),我们提出了一种名为 GENRE 的生成式推荐方法。通过设计各种提示策略,我们丰富了可用的训练数据,并获得了更多信息丰富的文本和用户特征,这有助于提高下游推荐任务的性能。

​ 第六段介绍了实验取得了不错的成果

pAejtf0.png

Method

DIRE:微调开源LLM

​ 在基于内容的推荐中,将开源语言模型整合为内容编码器是一种直接且被广泛采用的方法。值得注意的是,PLM-NR 采用小规模预训练语言模型(PLM,如 BERT)来替代原始新闻编码器,并在推荐任务中进行微调。

​ 这种方法的成功取决于两个因素: 1) 预训练语言模型中固有的知识(包括模型大小和预训练数据质量),以及 2) 微调策略。如前所述,我们已经强调了大型语言模型在内容理解和用户建模方面的优势,从而解决了第一个因素。在本节中,我们将提出鉴别性推荐框架,即 DIRE,并探讨如何利用开源大型语言模型,通过考虑第二个因素来进一步提高推荐性能。

网络结构

​ 如图 3 所示,我们将开源大型语言模型和注意力融合层无缝整合到基于内容的推荐框架中。

pAevpAs.png

嵌入层

​ BERT 等小规模 PLM 采用特定标记(如 ⟨cls⟩、⟨sep⟩)来分割不同字段,而我们则采用自然语言模板来进行连接。例如,考虑一个包含标题、摘要和类别特征等属性的新闻内容

标签:mathbf,模型,论文,用户,笔记,生成,内容,LLM,ONCE
From: https://www.cnblogs.com/anewpro-techshare/p/18404000

相关文章

  • LeetCode刷题笔记9.2-9.9
    leetCode刷题笔记(9.2-9.9)48.旋转图像(9.3)1)图像即二维数组,图像的旋转本质上是二维数组的旋转变换2)二维数组从外层来看,是若干个子数组的集合,子数组内部维护各自的元素,即若干个row里是row.length个column3)由此可理解下面几个关于二维数组的函数:创建二维数组并初始化int[][]......
  • 基于Oracle数据库的网络教学系统的开发和应用论文+任务书+翻译+代码
    !!!有需要的小伙伴可以通过文章末尾名片咨询我哦!!! ......
  • 个人简单操作系统的设计与实现 毕业论文+项目源码
    !!!有需要的小伙伴可以通过文章末尾名片咨询我哦!!! ......
  • 论文怎么写?巧用知网和WanFangAi一小时搞定初稿!!!
    搜集大量文献是基础!!先做好整体框架,整体框架肯定也是借鉴很多文献搞好的,然后框架搞好,就逐个击破,各个小标题去看相应文献!一定多看多找,看得多了,灵感乍现。我的论文基本都是这样完成的,都是自己手敲,后期重复率特别低。可以分为两个阶段定题目,这个方向就很广泛了,就是专业相关的......
  • 【Python学习笔记】 第5章 数值类型
    数值类型基础知识在Python中,数值实际上是一种类型的分类,包括:整数、浮点数复数小数:固定精度对象分数:有理数对象集合:带有数值运算的集合体布尔值:True,False内置函数与块:round,math,random等表达式、无限制精度整数(很大的整数)、位运算、八进制、十二进制、......
  • 算法题笔记-滑动窗口
    referdocleetcode对应题目:3.无重复字符的最长子串438.找到字符串中所有字母异位词解题模板://外层循环扩展右边界,内层循环扩展左边界for(intl=0,r=0;r<n;r++){ //当前考虑的元素 while(l<=r&&check()){//扩展左边界 //触发条件,改变滑动......
  • 编译原理(第3版)上课笔记
    1、编译器是一个程序、具有非常模块化的高层结构离线方式offline2、解释器是一类处理程序的程序在线方式online3、静态计算所生成的目标程序要和源代码语义相同(不能有任何改变)4、动态计算5、编译的各个阶段(1)词法分析器:检查单词是否合法。(2)语法分析器:生成语法树,检......
  • 【C++学习笔记】数组与指针(三)
    目录一、数组1.1数组声明与赋值1.2数组的特点特点1:任意类型均可创建数组特点2:固定大小特点3:内存连续且有序特点4:C++无数组下标越界错误特点5:数组变量不记录数据1.3遍历数组普通for循环foreach增强循环1.4字符数组1.5多维数组二维数组三维数组遍历二维数......
  • 【C++学习笔记】逻辑判断语句与循环语句(二)
    目录一、逻辑判断语句1.1ifelse语句1.2 switch语句1.3枚举类型二、循环语句2.1while循环2.2dowhile循环2.3for循环2.4break与continue关键字2.5goto语句一、逻辑判断语句1.1ifelse语句#include"iostream"usingnamespacestd;intmain(){......
  • 【算法笔记】多源最短路问题——Floyd算法
    0.前言在图中,如果要求任意两点间的距离,则可以使用Floyd(\(\mathcalO(N^3)\)......