首页 > 其他分享 >51c大模型~合集44

51c大模型~合集44

时间:2024-08-31 22:52:53浏览次数:14  
标签:团队 模型 合集 51c 44 DR4SR 生成 数据 集重

#DR4SR

最佳学生论文解读,中科大、华为诺亚:序列推荐新范式DR4SR

本工作由认知智能全国重点实验室 IEEE Fellow 陈恩红团队与华为诺亚方舟实验室完成。陈恩红教授团队深耕数据挖掘、机器学习领域,在顶级期刊与会议上发表多篇论文,谷歌学术论文引用超两万次。诺亚方舟实验室是华为公司从事人工智能基础研究的实验室,秉持理论研究与应用创新并重的理念,致力于推动人工智能领域的技术创新和发展。

8 月 25 日 - 29 日在西班牙巴塞罗那召开的第 30 届 ACM 知识发现与数据挖掘大会 (KDD2024) 上,中国科学技术大学认知智能全国重点实验室陈恩红教授、IEEE Fellow,和华为诺亚联合发表的论文 “Dataset Regeneration for Sequential Recommendation”,获 2024 年大会 Research Track 唯一最佳学生论文奖。论文第一作者为中科大认知智能全国重点实验室陈恩红教授,连德富教授,与王皓特任副研究员共同指导的博士生尹铭佳同学,华为诺亚刘勇、郭威研究员也参与了论文的相关工作。这是自 KDD 于 2004 年设立该奖项以来,陈恩红教授团队的学生第二次荣获该奖项。

  • 论文链接: https://arxiv.org/abs/2405.17795
  • 代码链接: https://github.com/USTC-StarTeam/DR4SR

研究动机

序列推荐系统(Sequential Recommender, SR)是现代推荐系统的重要组成部分,因为它旨在捕捉用户不断变化的偏好。近年来,研究者为了增强序列推荐系统的能力,已经付出了大量努力。这些方法通常遵循以模型为中心(Model-centric)的范式,即基于固定数据集开发有效的模型。然而,这种方法往往忽视了数据中潜在的质量问题和缺陷。为了解决这些问题,学界提出了以数据为中心(Data-centric)的范式,重点在于使用固定模型转而生成高质量的数据集。我们将其定义为 “数据集重生成” 问题。

为了获得最佳的训练数据,研究团队的关键思路是学习一个显式包含物品转移模式的新数据集。具体来说,他们将推荐系统的建模过程分为两个阶段:从原始数据集中提取转移模式 

51c大模型~合集44_大模型

,并基于 

51c大模型~合集44_大模型_02

 学习用户偏好

51c大模型~合集44_大模型_03

。由于学习从 

51c大模型~合集44_大模型_04

的映射涉及两个隐含的映射:

51c大模型~合集44_大模型_05

 ,因此这一过程具有挑战性。为此,研究团队探索了开发一个显式表示

51c大模型~合集44_大模型_06

中的物品转移模式的数据集的可能性,这使得我们可以将学习过程明确地分为两个阶段,其中 

51c大模型~合集44_大模型_07

 相对更容易学习。因此,他们的主要关注点是学习一个有效的

51c大模型~合集44_大模型_08

的映射函数,这是一个一对多的映射。研究团队将这一学习过程定义为数据集重生成范式,如图 1 所示,其中 “重生成” 意味着他们不引入任何额外信息,仅依赖原始数据集。

51c大模型~合集44_大模型_09

图1

为了实现数据集重生成,研究团队提出了一种新颖的以数据为中心的范式 —— 用于序列推荐的数据集重生成(DR4SR),旨在将原始数据集重生成一个信息丰富且具有通用性的数据集。具体来说,研究团队首先构建了一个预训练任务,使得数据集重生成成为可能。接着,他们提出了一种多样性增强的重生成器,以在重生成过程中建模序列和模式之间的一对多关系。最后,他们提出了一种混合推理策略,以在探索与利用之间取得平衡,生成新的数据集。

数据集重生成过程虽具通用性,但可能不完全适合特定目标模型。为解决这一问题,研究团队提出了 DR4SR+,这是一个模型感知的重生成过程,它根据目标模型的特性定制数据集。DR4SR + 通过双层优化问题和隐式微分技术,个性化评分并优化重生成数据集中的模式,以增强数据集效果。

研究方法

在本项研究中,研究团队提出了一个名为 “用于序列推荐的数据重生成”(DR4SR)的以数据为中心的框架,旨在将原始数据集重生成一个信息丰富且具有通用性的数据集,如图 2 所示。由于数据重生成过程是独立于目标模型的,因此重生成的数据集可能不一定符合目标模型的需求。因此,研究团队将 DR4SR 扩展为模型感知版本,即 DR4SR+,以针对特定的目标模型定制重生成的数据集。

模型无感知的数据集重生成

51c大模型~合集44_大模型_10

图2

为了开发一个信息丰富且具有通用性的数据集,研究团队旨在构建一个数据集重生成器,以促进数据集的自动重生成。然而,原始数据集中缺乏用于学习数据集重生成器的监督信息。因此,他们必须以自监督学习的方式来实现这一目标。为此,他们引入了一个预训练任务,以指导多样性增强重生成器的学习。在完成预训练后,研究团队进一步使用混合推理策略来重生成一个新数据集。

数据重生成预训练任务的构建:

51c大模型~合集44_大模型_11

图3

为了构建预训练任务,他们首先通过基于规则的方法获取物品转移模式。然后,要求重生成器 

51c大模型~合集44_大模型_12

能够将 

51c大模型~合集44_大模型_13

 重生成对应的模式 

51c大模型~合集44_大模型_14

 。研究团队将整个预训练数据集记作 

51c大模型~合集44_大模型_15

促进多样性的重生成器:

借助预训练任务,研究团队现在可以预训练一个数据集重生成器。本文中,他们采用 Transformer 模型作为重生成器的主要架构,其生成能力已被广泛验证。数据集重生成器由三个模块组成:一个用于获取原始数据集中序列表示的编码器、一个用于重生成模式的解码器,以及一个用于捕捉一对多映射关系的多样性增强模块。接下来,研究团队将分别介绍这些模块。

编码器由多个堆叠的多头自注意力(MHSA)和前馈网络(FFN)层组成。至于解码器,它将重生成数据集 X' 中的模式作为输入。解码器的目标是在给定编码器生成的序列表示的情况下重构模式

51c大模型~合集44_大模型_16

然而,从一个序列中可以提取多个模式,这在训练过程中会带来挑战。为了解决这一一对多映射问题,研究团队进一步提出了一个多样性增强模块。

具体而言,研究团队通过将目标模式的信息整合到解码阶段,来自适应地调节原始序列的影响。首先,他们将编码器生成的记忆 

51c大模型~合集44_大模型_17

投影到 K 个不同的向量空间中,即 

51c大模型~合集44_大模型_18

。理想情况下,不同的目标模式应与不同的记忆匹配。为此,他们还引入了一个 Transformer 编码器来编码目标模式并获取 

51c大模型~合集44_大模型_19

。他们将 

51c大模型~合集44_大模型_20

压缩成一个概率向量:

51c大模型~合集44_大模型_21

其中 

51c大模型~合集44_大模型_22

, 

51c大模型~合集44_大模型_23

是选择第 k 个记忆的概率。为了确保每个记忆空间得到充分训练,我们不执行硬选择,而是通过加权求和得到最终的记忆:

51c大模型~合集44_大模型_24

最终,可以利用获取的记忆来促进解码过程,并有效捕捉序列与模式之间复杂的一对多关系。

模型感知的数据集重生成

由于前面的重生成过程与目标模型无关,因此重生成的数据集可能对于特定的目标模型来说并不是最优的。因此,他们将模型无关的数据集重生成过程扩展为模型感知的重生成过程。为此,在数据集重生成器的基础上,他们引入了一个数据集个性化器,用于评估重生成数据集中每个数据样本的评分。然后,研究团队进一步通过隐式微分有效地优化数据集个性化器。

数据集个性化器:

研究团队的目标是训练一个参数为 

51c大模型~合集44_大模型_25

的基于 MLP 实现的数据集个性化器 

51c大模型~合集44_大模型_26

,用以评估每个数据样本 W 对于目标模型的评分。为了确保框架的通用性,研究团队利用计算得到的评分来调整训练损失的权重,这不需要对目标模型进行额外的修改。他们从定义原始的下一个物品预测损失开始:

51c大模型~合集44_大模型_27

随后,个性化数据集的训练损失函数可以定义为:

51c大模型~合集44_大模型_28

实验结论

主要实验

研究团队比较了每种目标模型与 “DR4SR” 和 “DR4SR+” 变体的性能,以验证所提出框架的有效性。

51c大模型~合集44_大模型_29

图4

从图 4 展示的整体性能中,可以得出以下结论:

  • DR4SR 能够重生成一个信息丰富且具有普遍适用性的数据集
  • 不同的目标模型偏好不同的数据集
  • 去噪只是数据重生成问题的一个子集




#xxxx


#xxxx


#xxxx


#xxxx



#xxxx


标签:团队,模型,合集,51c,44,DR4SR,生成,数据,集重
From: https://blog.51cto.com/whaosoft/11884382

相关文章

  • 20240831_174427 scratch 自制积木的基本使用
    20240903_215445scratch认识自制积木自制积木是自定义的一个积木它的功能由自己决定20240903_225445scratch定义普通自制积木使用位置自制积木模块制作新的积木定义积木使用积木20240903_235445scratch定义带一参数的自制积木需求定义一个祝某某生日快......
  • (2024最新毕设合集)基于SpringBoot的校园设备维修管理系统-16364|可做计算机毕业设计JAV
    基于Springboot的校园设备维修管理系统的设计与实现摘 要基于Springboot的校园设备维修管理系统的设计与实现是一个结合了网络技术和信息管理的项目。该系统能满足校园报修管理的实际需求,通过网络进行信息管理,使得设备维修更加及时有效。本设计主要实现集人性化、高效率、......
  • .NET|--WPF|--笔记合集|--依赖项属性|--2.注册依赖项属性
    前言使用一个实例,其实分2步骤定义,实例化.但是依赖项属性为不能直接实例化,因为DependencyProperty类没有公开的构造函数,只能使用静态的DependencyProperty.Register方法创建DependencyProperty实例.DependencyProperty.Register源码//System.Windows.DependencyP......
  • .NET|--WPF|--笔记合集|--依赖项属性|--1.定义依赖项属性
    前言一般情况下,我们是不用定义依赖项属性的,更多的是直接使用即可.那么何时需要我们定义依赖项属性呢?1.设计自定义的WPF元素;2.为原本不支持数据绑定,动画等WPF功能的代码中,需要添加数据绑定,动画等WPF功能时.定义依赖项属性一般的类型来说,如果想要使用的......
  • .NET|--WPF|--笔记合集|--依赖项属性|--4.依赖项属性值优先级
    前言前几篇笔记讲到了依赖项属性的定义,注册等.接下来就该是依赖项属性的实战了.如果依赖项属性是一个主机的话,前几个步骤还在于组装这个主机,组装好了之后,就要开始使用了,是骡子是马,拉出来遛遛.但是一般任何事物在使用之前,都有一些注意事项,如果不了解这些注......
  • .NET|--WPF|--笔记合集|--依赖项属性|--3.属性包装器
    前言属性包装器的主要作用是将依赖属性的访问方式转换为标准的CLR属性访问方式,从而使代码更加简洁、直观,并提供一致性和更好的开发体验。通过属性包装器,开发者可以利用依赖属性的高级功能,同时保持代码的可读性和易用性。"属性包装器"在TextBlock源码中使用publicclass......
  • 再次进阶 舞台王者 第八季完美童模全球赛主持人【王艺哲】赛场&秀场超燃合集!
    7月20-23日,2024第八季完美童模全球总决赛在青岛圆满落幕。在盛大的颁奖典礼上,一位才能出众的少女——王艺哲迎来了她舞台生涯的璀璨时刻。主持人——王艺哲,以璀璨童星之姿,优雅地踏上完美童模盛宴的绚丽舞台,作为开场小嘉宾,她瞬间成为了全场瞩目的焦点。她以一种超越年龄的自信与风度......
  • 449页pdf!深入探讨大语言模型的世界:赵宇教授新书《自然语言处理:大模型理论与实践》
    随着人工智能技术的飞速发展,自然语言处理成为了计算机科学与人工智能领域中不可或缺的关键技术之一。作为一名长期致力于人工智能和自然语言处理研究的学者,我见证了这一领域的迅猛变革,从基于规则的方法到现今基于深度学习的革命性技术,尤其是大模型技术的应用,给自然语言处理......
  • 【日记】现在问题变成买哪一台电脑了(344 字)
    正文今天领了家电补贴,原本就有换电脑的计划和打算,这下想换电脑的心情越来越强烈了。昨天跟母亲打电话,她跟我聊到有光伏公司跟他们抢生意。虽然这事挺搞,但我还觉得蛮有意思。我万万没想到商战这种事情能发展到我们村里……检查基本已经结束了,没有前阵子那样特别忙......
  • mac电脑可以玩的Red Alert红色警戒:红警2 for Mac合集
    红色警戒(RedAlert)系列是一款备受玩家喜爱的即时战略游戏,该系列游戏以其独特的剧情设定、丰富的游戏玩法和多样的游戏模式而广受好评。红色警戒系列游戏以其丰富的游戏玩法、独特的剧情设定和多样的游戏模式吸引了大量玩家。无论是喜欢即时战略游戏的玩家还是怀旧玩家,都能在这......