首页 > 其他分享 >ListWise\PairWise\PointWise

ListWise\PairWise\PointWise

时间:2024-10-12 14:23:07浏览次数:10  
标签:候选 排序 doc ListWise PairWise query 文档 PointWise


概念:三种不同的排序模型学习(Learning to Rank)设计思路。主要体现在损失函数不同

用户 的查询query为 Q,候选文档集docs为 c1~CN,正确的结果排序假设为C1-CK 。候选文档集要一般大于最终返回的集合,因此N>K .例如,给出一个提问句子从候选句子(有10个)中选出最佳的5个的答案,返回的列表也要按优劣排序,优的在前面。



PointWise:把排序问题当成一个二分类问题。输入为q和c。输出为0~1表示c和q的匹配程度。1表示匹配。

缺陷:
      该方法给出的是c对q的绝对打分。然而实际排序过程只需要有相对打分即可。(即A比B的相关性高即可)
      没有充分利用样本间的结构性
      query间doc的不平衡,如query1对应500个文档,query2对应10个文档。


Pairwise:学习的是两个候选样本之间的相对顺序。采用triplet loss形式的损失函数。要求正样本得分比负样本打分高于超参数阈值。

缺陷:
  doc pair 的数量将是 doc 数量的二次,从而 pointwise 方法存在的 query 间 doc 数量的不平衡性将在 pairwise 类方法中进一步放大
  pairwise 方法相对 pointwise 方法对噪声标注更敏感,即一个错误标注会引起多个 doc pair 标注错误。
  pairwise 方法仅考虑了 doc pair 的相对位置,损失函数还是没有 model 到预测排序中的位置信息。(即整体顺序?这里有疑惑)


ListWise:优化的是整个候选列表中的排序信息。即给定k个文档。输入是K维度归一化向量。label是每个文档得分。训练目标是最小化二者KL散度。即去拟合label的位置信息分布。往往效果最好


标签:候选,排序,doc,ListWise,PairWise,query,文档,PointWise
From: https://www.cnblogs.com/jiyuebo/p/18460458

相关文章

  • Aligning with Human Judgement: The Role of Pairwise Preference in Large Language
    本文是LLM系列文章,针对《AligningwithHumanJudgement:TheRoleofPairwisePreferenceinLargeLanguageModelEvaluators》的翻译。与人类判断相一致:配对偏好在大型语言模型评估者中的作用摘要1引言2LLM计算器校准的局限性3不确定性引导的成对偏好搜索4......
  • Pairwise实现(Python篇)
    开篇:测试过程中,对于多参数参数多值的情况进行测试用例组织,之前一直使用【正交分析法】进行用例组织,说白了就是把每个参数的所有值分别和其他参数的值做一个全量组合,用Python脚本实现,就是itertools模块中product方法(又称笛卡尔积法)。组合生成器,例:importitertoolsa=(......
  • Pairwise实现(Java篇)
    importjava.util.HashMap;/***PairWise(成对)测试方法*author:likeqc*date:2021-4-411:06:59*/classPairWise{/***@paramstrString[][],二维数组,一维数组str[i]中存放第i个因素的因子*/privatestaticvoidsolution(String[][]s......
  • Adaptive Sparse Pairwise Loss for Object Re-Identification
    https://blog.csdn.net/amusi1994/article/details/130037400tripletloss中需要计算每个样本之间的距离,从而计算出loss,作者认为同一类的某些样本可能存在有害的信息,所以不应该将所有样本都用于计算loss。作者提出的SPloss中只计算挑选出来的样本的距离,从而得到loss。我们提出......
  • Learning to rank: from pairwise approach to listwise approach
    目录概ListNetPermutationProbabilityTop-kProbabilityCaoZ.,QinT.,LiuT.,TsaiM.andLiH.Learningtorank:frompairwiseapproachtolistwiseapproach.ICML,2008.概ListwiseRanking.ListNet以文档检索为例,假设我们有query\(q\)和一堆候选的文档......
  • 利用Biopython – Pairwise Alignment计算序列相似度
    #ImportlibrariesfromBioimportpairwise2fromBio.SeqimportSeq#Creatingsamplesequencesseq1=Seq("TGTGACTA")seq2=Seq("CATGGTCA")#Findingsimilaritiesalignments=pairwise2.align.globalxx(seq1,seq2)#Showingresultsformat......
  • NLP文本匹配任务Text Matching 有监督训练:PointWise(单塔)、DSSM(双塔)、Sentence BERT(双
    NLP文本匹配任务TextMatching[无监督训练]:SimCSE、ESimCSE、DiffCSE项目实践文本匹配多用于计算两个文本之间的相似度,该示例会基于ESimCSE实现一个无监督的文本匹配模型的训练流程。文本匹配多用于计算两段「自然文本」之间的「相似度」。例如,在搜索引擎中,我们通常需要判断......
  • NLP文本匹配任务Text Matching 有监督训练:PointWise(单塔)、DSSM(双塔)、Sentence BERT(双
    NLP文本匹配任务TextMatching[有监督训练]:PointWise(单塔)、DSSM(双塔)、SentenceBERT(双塔)项目实践0背景介绍以及相关概念本项目对3种常用的文本匹配的方法进行实现:PointWise(单塔)、DSSM(双塔)、SentenceBERT(双塔)。文本匹配(TextMatching)是NLP下的一个分支,通常用于计算两个句子......
  • CF1553F. Pairwise Modulo
    终于过了,感觉还是有点东西的。首先我们有一个很好想的\(O(n(\lnA+\sqrt{A})\logn)\)的做法。首先这个式子能写成\(p_i=\sum\limits_{j=1}^i\sum\limits_{k=1}^i\left(a_j-a_k\left\lfloor\dfrac{a_j}{a_k}\right\rfloor\right)\)的形式。前面求和那部分是简单的,我们主要去......
  • 迁移学习(PAT)《Pairwise Adversarial Training for Unsupervised Class-imbalanced Dom
    论文信息论文标题:PairwiseAdversarialTrainingforUnsupervisedClass-imbalancedDomainAdaptation论文作者:WeiliShi,RonghangZhu,ShengLi论文来源:KDD2022论文地址:download 论文代码:download视屏讲解:click1摘要提出问题:类不平衡问题;解决方法:提出了一......