别再双塔了！谷歌提出DSI索引，检索效果吊打双塔，零样本超BM25！

时间：2023-04-21 13:32:03浏览次数：52

卖萌屋今日学术精选

这篇论文展示了信息检索可以用一个Transformer来完成，其中，关于语料库的所有信息都被编码在Transformer模型的参数中。

论文标题：Transformer Memory as a Differentiable Search Index
链接：https://arxiv.org/abs/2202.06991

作者提出了可微搜索索引（Differentiable Search Index，DSI)的概念，这是一种新的搜索范式，它可以学习出一个Query-to-DocID的文本检索模型，将用户Query直接映射到相关的DocID节点上；换句话说，DSI模型直接使用其模型参数来回答用户查询，极大地简化了整个检索过程。

别再双塔了！谷歌提出DSI索引，检索效果吊打双塔，零样本超BM25！_人工智能

上图展示了经典的双塔模型（Dual Encoder）+最大内积检索（MIPS）的经典检索范式，与本文提出的可微搜索索引（DSI）的范式的区别。后者统一了模型的训练与检索。

实验结果

首先作者在不同规模的NQ数据集上，检验了DSI模型的supervised learning能力。

别再双塔了！谷歌提出DSI索引，检索效果吊打双塔，零样本超BM25！_机器学习_02

从上表可以看到，DSI模型经过finetune之后，强势吊打了BM25基线和同样finetune之后的T5模型。

此外，作者还在NQ数据集上检验了DSI模型的zero-shot能力。

别再双塔了！谷歌提出DSI索引，检索效果吊打双塔，零样本超BM25！_深度学习_03

众所周知，BM25是zero shot方面非常高的一个基线，从上表可以看出，DSI的zero shot能力也显著优于BM25。

实验表明，给定适当的设计选择，DSI不仅显著优于双塔模型为代表的强基线模型，此外，DSI展示了很强的泛化能力，在zero-shot实验中显著优于BM25基线。

标签：检索,shot,BM25,模型,zero,吊打,双塔,DSI
From： https://blog.51cto.com/xixiaoyao/6212621

推荐系统的双塔模型，问答
想问一下各位大佬：1.推荐系统的双塔模型中，为什么用户向量和商品向量的内积可以表示用户对物品的兴趣呢？因为内积描述的是两个向量之间的相似度，而用户和物品的特征差别很大。2.即便用户和物品很相似，可以用相似度来刻画喜爱程度吗？ ......
面试某大厂，被Channel给吊打了，这次一次性通关channel！
目录一前言面试题然后我们进行一下扩展，玩转Channel！二解决面试题1.介绍一下Channel2.Channel在go中起什么作用3.Channel为什么需要两个队列实现4.Go为什么要开发Channel，而别的语言为什么没有5.Channel底层是使用锁控制并发的，为什么不直接使用锁三扩展面试题1.Channel......
为什么Redis不直接使用C语言的字符串？看完直接吊打面试官！
众所周知Redis有以下几种常见的数据类型String（字符串）、List（列表）、Set（集合）、Hash（哈希）、Sortedset（有序集合）、Stream（流）、Geo（地理空间索引）、Bitmap（位图）、HyperLogLog（基数统计......
BM25 二叉树的后序遍历
https://www.nowcoder.com/practice/1291064f4d5d4bdeaefbf0dd47d78541?tpId=295&tqId=2291301&ru=/exam/oj&qru=/ta/format-top101/question-ranking&sourceUrl=%2Fexam%2......
免费还开源，简直吊打同行的Flow Launcher，完美适配win11！
大家应该用过Listary或者utool软件吧？使用 Listary 的朋友们是否有以下痛点？比如汉化不完全，UI落后，不再更新，以及盗版心理负担……如果替换为utool，那你应该又会想念上......
BM25
简介从Elasticsearch5开始，Elasticsearch的默认相似度算法是OkapiBM25。OkapiBM25模型于1994年提出，BM25的BM是缩写自BestMatch,25是经过25次迭代调整之后得出的算法，该......
关于一个人类智慧的DP - Vijos 1037 搭建双塔题解
关于一个人类智慧的DP-Vijos1037搭建双塔目录关于一个人类智慧的DP-Vijos1037搭建双塔更好的阅读体验戳此进入题面输入格式ExamplesSolutionCodeCode-C++98(JDO......
吊打labelme，这款AI开发神器的图像标注yyds！
AI的发展有三大内核：数据、算法、算力。现如今，算法和算力在市面上的差距显然已经没有那么大，能够给AI提供充足弹药支持的当属数据了。深度学习算法精度的提升严重依赖于数......
【Java面试】面试自閟了！工作5年的小伙伴今天面试被吊打问我，并行和并发有什么区别？
“并行和并发有什么区别？”关于这个问题，很多工作5年以上的同学都回答不出来。或者说，自己有一定的理解，但是不知道怎么表达。大家好，我是Mic，一个工作了14年的Java程序员。......
[2007年NOIP普及组] Hanoi双塔问题
分析：根据样例可得x（n）=2+2*2……运用高精乘进行乘#include<bits/stdc++.h>usingnamespacestd;intc[600000],jw[600000];inti,n,a[600000],j,b[600000]={0,2},bj;intma......

别再双塔了！谷歌提出DSI索引，检索效果吊打双塔，零样本超BM25！

相关文章

赞助商

阅读排行