首页 > 其他分享 >别再双塔了!谷歌提出DSI索引,检索效果吊打双塔,零样本超BM25!

别再双塔了!谷歌提出DSI索引,检索效果吊打双塔,零样本超BM25!

时间:2023-04-21 13:32:03浏览次数:49  
标签:检索 shot BM25 模型 zero 吊打 双塔 DSI


卖萌屋今日学术精选

这篇论文展示了信息检索可以用一个Transformer来完成,其中,关于语料库的所有信息都被编码在Transformer模型的参数中。

论文标题:Transformer Memory as a Differentiable Search Index
链接:https://arxiv.org/abs/2202.06991

作者提出了可微搜索索引(Differentiable Search Index,DSI)的概念,这是一种新的搜索范式,它可以学习出一个Query-to-DocID的文本检索模型,将用户Query直接映射到相关的DocID节点上;换句话说,DSI模型直接使用其模型参数来回答用户查询,极大地简化了整个检索过程。


别再双塔了!谷歌提出DSI索引,检索效果吊打双塔,零样本超BM25!_人工智能

上图展示了经典的双塔模型(Dual Encoder)+最大内积检索(MIPS)的经典检索范式,与本文提出的可微搜索索引(DSI)的范式的区别。后者统一了模型的训练与检索。

实验结果

首先作者在不同规模的NQ数据集上,检验了DSI模型的supervised learning能力。


别再双塔了!谷歌提出DSI索引,检索效果吊打双塔,零样本超BM25!_机器学习_02

从上表可以看到,DSI模型经过finetune之后,强势吊打了BM25基线和同样finetune之后的T5模型。

此外,作者还在NQ数据集上检验了DSI模型的zero-shot能力。


别再双塔了!谷歌提出DSI索引,检索效果吊打双塔,零样本超BM25!_深度学习_03

众所周知,BM25是zero shot方面非常高的一个基线,从上表可以看出,DSI的zero shot能力也显著优于BM25。

实验表明,给定适当的设计选择,DSI不仅显著优于双塔模型为代表的强基线模型,此外,DSI展示了很强的泛化能力,在zero-shot实验中显著优于BM25基线。

标签:检索,shot,BM25,模型,zero,吊打,双塔,DSI
From: https://blog.51cto.com/xixiaoyao/6212621

相关文章

  • 推荐系统的双塔模型,问答
     想问一下各位大佬:1.推荐系统的双塔模型中,为什么用户向量和商品向量的内积可以表示用户对物品的兴趣呢?因为内积描述的是两个向量之间的相似度,而用户和物品的特征差别很大。2.即便用户和物品很相似,可以用相似度来刻画喜爱程度吗?   ......
  • 面试某大厂,被Channel给吊打了,这次一次性通关channel!
    目录一前言面试题然后我们进行一下扩展,玩转Channel!二解决面试题1.介绍一下Channel2.Channel在go中起什么作用3.Channel为什么需要两个队列实现4.Go为什么要开发Channel,而别的语言为什么没有5.Channel底层是使用锁控制并发的,为什么不直接使用锁三扩展面试题1.Channel......
  • 为什么Redis不直接使用C语言的字符串?看完直接吊打面试官!
    众所周知Redis有以下几种常见的数据类型String(字符串)、List(列表)、Set(集合)、Hash(哈希)、Sortedset(有序集合)、Stream(流)、Geo(地理空间索引)、Bitmap(位图)、HyperLogLog(基数统计......
  • BM25 二叉树的后序遍历
    https://www.nowcoder.com/practice/1291064f4d5d4bdeaefbf0dd47d78541?tpId=295&tqId=2291301&ru=/exam/oj&qru=/ta/format-top101/question-ranking&sourceUrl=%2Fexam%2......
  • 免费还开源,简直吊打同行的Flow Launcher,完美适配win11!
    大家应该用过Listary或者utool软件吧?使用 Listary 的朋友们是否有以下痛点?比如汉化不完全,UI落后,不再更新,以及盗版心理负担……如果替换为utool,那你应该又会想念上......
  • BM25
    简介从Elasticsearch5开始,Elasticsearch的默认相似度算法是OkapiBM25。OkapiBM25模型于1994年提出,BM25的BM是缩写自BestMatch,25是经过25次迭代调整之后得出的算法,该......
  • 关于一个人类智慧的DP - Vijos 1037 搭建双塔 题解
    关于一个人类智慧的DP-Vijos1037搭建双塔目录关于一个人类智慧的DP-Vijos1037搭建双塔更好的阅读体验戳此进入题面输入格式ExamplesSolutionCodeCode-C++98(JDO......
  • ​吊打labelme,这款AI开发神器的图像标注yyds!
    AI的发展有三大内核:数据、算法、算力。现如今,算法和算力在市面上的差距显然已经没有那么大,能够给AI提供充足弹药支持的当属数据了。深度学习算法精度的提升严重依赖于数......
  • 【Java面试】面试自閟了!工作5年的小伙伴今天面试被吊打问我,并行和并发有什么区别?
    “并行和并发有什么区别?”关于这个问题,很多工作5年以上的同学都回答不出来。或者说,自己有一定的理解,但是不知道怎么表达。大家好,我是Mic,一个工作了14年的Java程序员。......
  • [2007年NOIP普及组] Hanoi双塔问题
    分析:根据样例可得x(n)=2+2*2……运用高精乘进行乘#include<bits/stdc++.h>usingnamespacestd;intc[600000],jw[600000];inti,n,a[600000],j,b[600000]={0,2},bj;intma......