首页 > 其他分享 >NLP论文速读(NeurIPS 2024)|树状结构两阶段推荐系统的泛化误差边界Generalization Error Bounds for Two-stage Recommender System

NLP论文速读(NeurIPS 2024)|树状结构两阶段推荐系统的泛化误差边界Generalization Error Bounds for Two-stage Recommender System

时间:2024-12-28 18:56:29浏览次数:7  
标签:检索 误差 速读 泛化 树结构 System 排序 分支

论文速读|Generalization Error Bounds for Two-stage Recommender Systems with Tree Structure

论文信息:

简介:

      本文讨论的是两阶段推荐系统(Two-stage Recommender Systems)在具有树结构的情况下的泛化误差界限。两阶段推荐系统在许多在线服务中扮演着重要角色,例如电子商务、数字流媒体和社交媒体等。这些系统需要从数百万或数十亿的选项中快速识别出与用户相关的项目,并个性化地满足大量用户的动态需求,同时响应延迟要低。两阶段推荐系统通常包括一个高效的检索器(retriever)和一个更精确但计算成本更高的排序器(ranker)。检索器从大型候选池中预先选择一小部分候选项,而排序器则对这些候选项进行细化和重新排序,然后呈现给用户。这种设计在效率和准确性之间取得了平衡,以满足现实世界场景的需求。

      本文的动机在于提高对两阶段推荐系统泛化能力的理解,并为设计更有效的模型提供理论基础。通过分析树结构检索器和排序器的泛化误差,文章旨在揭示如何通过增加树结构中的分支数量和协调不同阶段之间的分布来增强两阶段推荐系统的泛化性能。

论文方法:

      本文提出了一个基于误差分解框架的方法来分析两阶段推荐系统的泛化误差。

      具体来说,文章使用Rademacher复杂度作为工具,来建立各种基于树的检索器使用束搜索时的泛化上界,以及在移位训练分布下不同排序器模型的泛化上界。

      文章首先将两阶段模型的泛化误差分解为检索器和排序器的误差。

      对于检索器,文章考虑了线性模型、多层感知器(MLP)和目标注意力模型等不同的树结构检索器模型,并为这些模型提供了泛化误差界限。

      对于排序器,文章分析了在训练分布和推理分布不一致时排序器模型的泛化误差,并提出了通过协调分布来提高泛化性能的方法。

      文章通过理论分析和实际实验来验证这些发现。实验结果表明,增加树结构检索器中的分支数量和在协调分布上训练排序器可以提高两阶段推荐系统的泛化性能。

论文实验:

      根据提供的PDF文件中的Figure 1内容,该论文进行了实验来研究树结构检索器中分支数量对召回率(Recall@20)的影响。

      对于Mind数据集,随着分支数量的增加,Recall@20逐渐提高,从2分支的0.178增加到32分支的0.190。

      对于Movie数据集,同样观察到分支数量增加时Recall@20的提升,从2分支的0.09增加到32分支的0.13。

      实验结果表明,增加树结构检索器中的分支数量可以提高召回率,从而增强检索器模型的性能。这支持了论文中的理论分析,即具有更多分支的树模型倾向于展示出更好的泛化能力。

论文链接:

https://openreview.net/pdf?id=m1a4CrRJR7

标签:检索,误差,速读,泛化,树结构,System,排序,分支
From: https://blog.csdn.net/2401_85576118/article/details/144779447

相关文章

  • systemd服务(三):自启动后,系统托盘无法显示
     背景:编写一个Qt程序,带有系统托盘。使用systemd服务做自启动后,开机第一次,总是没有显示出系统托盘图标,使用ps命令查询进程,发现程序是存在的,但是就是没有系统托盘的图标 解决方法:修改my.service配置文件,增加After和Requires配置。  #systemd服务中文手册:http......
  • systemd服务(二):Qt程序做自启动时,不能正常运行
    *: systemd服务中文手册:https://www.jinbuguo.com/systemd/systemd.exec.html 背景:不管是,直接运行qt程序,还是使用sh脚本来运行qt程序,都是正常的但是加入到systemd自启动服务后,总是启动不了Qt程序,通过sudoststemctlstatustesthuqt和  journalctl-utesthuqt查询日......
  • systemd服务(一):Linux程序崩溃自启动方法
     linux进程挂掉后,可以通过配置systemd来自动启动服务1.创建systemd服务文件,例如:huyang.service,需要放置在系统文件夹/etc/systemd/system2.编辑文件,填写详细信息3.操作systemd服务[Unit]Description=huyangSCRSserver#对服务的描述After=netw......
  • lpksetup.exe与 语言包安装 和 本地化设置 相关,主要用于帮助用户添加或删除 Windows
    lpksetup.exe是Windows操作系统中的一个可执行文件,位于C:\Windows\System32目录下。它与语言包安装和本地化设置相关,主要用于帮助用户添加或删除Windows操作系统的语言包。以下是对lpksetup.exe的详细介绍:1. 功能lpksetup.exe主要用于管理Windows操作系统的语......
  • system
    #include<iostream>usingnamespacestd;system("pause")可以实现冻结屏幕system("CLS")可以实现清屏操作调用color函数可以改变控制台的前景色和背景,具体参数在下面说明。例如,用system("color0A");其中color后面的0是背景色代号,A是前景色代号。各颜色代码如下:0=黑......
  • WSL(Windows Subsystem for Linux)和 WSL 2(Windows Subsystem for Linux 2)是微软为 Wind
    WSL(WindowsSubsystemforLinux)和WSL2(WindowsSubsystemforLinux2)是微软为Windows提供的Linux子系统。WSL和WSL2都允许用户在Windows上运行Linux发行版,但它们的架构、性能和功能有显著差异。以下是它们的主要区别对比表:特性WSL (WSL1)WSL2架构使......
  • NLP论文速读(AAAI 2024)|面向序列生成的基于高效采样强化学习 (Efficient Sampling-ba
    论文速读|ESRL:EfficientSampling-basedReinforcementLearning forSequenceGeneration论文信息:简介:   本文探讨了将强化学习(ReinforcementLearning,RL)应用于序列生成模型的背景。序列生成是一个长期决策问题,而RL特别适合优化长期奖励,例如序列级别的评分......
  • hangfire.entityframeworkcore这个库因为System.Threading.Timer未停止也未释放而导致
    如题https://github.com/sergezhigunov/Hangfire.EntityFrameworkCore/issues/32publicclassWorker:IBackgroundProcess{publicvoidExecute(BackgroundProcessContextcontext){using(varfetchedJob=connection.FetchNextJob(_queues.ToArray(),context.......
  • SharePoint System.Net.WebException:“远程服务器返回错误: (414) REQUEST URI TOO
    SharePointCSOM执行下面代码时报错:stringfileServerRelativeUrl="/xxxx/2003249_98.RXE";using(varfileInfo=Microsoft.SharePoint.Client.File.OpenBinaryDirect(ctxOriginal,fileServerRelativeUrl))using(varreader=newStreamReader(fileInfo.Stream))......
  • Sigrity System SI SerialLink模式对串行链路进行串扰仿真分析操作指导-S参数模型
    SigritySystemSISerialLink模式对串行链路进行串扰仿真分析操作指导-S参数模型SigritySystemSISerialLink模式可以对串行链路进行串扰仿真分析,通过通道串扰仿真得到串扰频域波形,2D时域波形,2D眼图,3D眼图,误码率结果以及仿真报告下面以一个S参数模型的串扰通道模板进行说......