首页 > 其他分享 >Bi-encoder vs Cross encoder?

Bi-encoder vs Cross encoder?

时间:2024-06-02 14:10:49浏览次数:16  
标签:encoder Bi Cross vs 文档 相似性 查询

本文永久地址:https://wanger-sjtu.github.io/encoder-cross-bi/

Bi-encoder和Cross-encoder是在自然语言理解任务模型的两种不同方法,在信息检索和相似性搜索二者的使用更为广泛。在LLM大火的今天,RAG的pipe line中这两个模块作为提升检索精度的模块更是备受瞩目。

Bi-encoder:

  • 架构:在Bi-encoder模型中,有两个独立的编码器——一个用于编码输入的查询,另一个用于编码候选文档。这些编码器独立工作,为查询和每个文档生成嵌入表示。
  • 训练:在训练期间,模型被训练以最大化查询与相关文档之间的相似性,同时最小化查询与不相关文档之间的相似性。训练通常使用对比损失函数进行。
  • 评分:在推理时,模型独立计算查询与每个文档之间的相似性得分。相似性得分最高的文档被认为是最相关的。
    使用案例:Bi-encoder通常用于文档检索或排名是主要目标的任务,如搜索引擎或推荐系统。

双编码器为给定句子生成句子嵌入。我们独立地将句子A和句子B传递给BERT,分别得到句子嵌入u和v。然后可以使用余弦相似度来比较这些句子嵌入。

Cross-encoder

架构:在Cross-encoder模型中,查询和文档一起在单个编码器中处理。这意味着模型将查询和文档作为输入,并产生联合表示。
训练:与Bi-encoder类似,Cross-encoder被训练以最大化相关查询-文档对之间的相似性。但是,由于它们同时处理查询和文档,因此它们捕获了两者之间的交互。
评分:Cross-encoder为每个查询-文档对生成单一的相似性得分,考虑了查询和文档嵌入之间的交互。得分最高的文档被认为是最相关的。
使用案例:当捕获查询和文档之间的交互对于您的任务至关重要时,Cross-encoder非常有用,例如在理解查询和文档之间的上下文或关系很重要的任务中。

比较

Bi-encoder:当您拥有大规模数据集和计算资源时,使用Bi-encoder。由于相似性得分可以独立计算,它们在推理期间通常更快。它们适用于捕获查询和文档之间复杂交互不太关键的任务。

Cross-encoder:当捕获查询和文档之间的交互对于您的任务至关重要时,请选择Cross-encoder。它们在计算上更为密集,但可以在理解查询和文档之间的上下文或关系至关重要的场景中提供更好的性能。

标签:encoder,Bi,Cross,vs,文档,相似性,查询
From: https://www.cnblogs.com/wanger-sjtu/p/18227082

相关文章

  • 如何在VScode上写一篇MarkDown文档
    如何在VScode上写一篇MarkDown文档1.首先需要安装插件2.新增一个MarkDown文件3.编写如下文案4.生成MarkDown格式文档和大纲一级标题Markdown二级标题三级标题后续加#类推字体加粗倾斜加粗倾斜删除高亮这是上标这是下标引用引用第一段分割线居中中......
  • cmake配置VS工程配置使用dll
    cmake配置VS工程配置使用dllAuthor:ChrisZZTime:2024-06-0116:17:04目录cmake配置VS工程配置使用dll1.目的2.如果找不到dll,会发生什么?3.需要找到哪些dll?3.1“就那么几个文件,手动拷贝“3.2从依赖树递归查询3.3额外的dll文件4.找到dll后放到哪里?4.1VS工程属性......
  • 写一个 vscode 插件
    HxTranslate这是一个vscode扩展插件示例,参考:YourFirstExtension,可将helloworld更改为自己的扩展插件名称如:HxTranslate,其余默认即可.建议使用文心一言解答疑问.注意事项deepin终端运行:sudoaptinstallnodejs终端运行:npmi-gyogenerator-codety......
  • 制作可以用来控制vsftpd服务的菜单
    1:创建菜单函数文件#vimmenu#创建文件x=1#高亮行号,默认为1即可y=0#第几行menu(){#循环显示菜单的函数clearforiin1,安装ftp服务2,开关ftp服务3,退出......
  • 算法金 | 详解过拟合和欠拟合!性感妩媚 VS 大杀四方
    大侠幸会,在下全网同名「算法金」0基础转AI上岸,多个算法赛Top「日更万日,让更多人享受智能乐趣」今天我们来战过拟合和欠拟合,特别是令江湖侠客闻风丧胆的过拟合,简称过儿,Emmm过儿听起来有点怪怪的1.楔子机器学习模型是一种能够从数据中学习规律并进行预测的......
  • vs2022安装 社区版/Visual Studio 2022 Professional、Enterprise安装教程
    原文链接:https://zhuanlan.zhihu.com/p/472099786https://blog.csdn.net/qq_38390060/article/details/129580789一、Windows安装VisualStudio20221.1下载地址首先登陆VisualStudio官网:https://visualstudio.microsoft.com/zh-hans/ 2、我们双击开始安装之后会弹出安......
  • 海康威视工业相机通过MVS修改IP
    相机型号:修改IP点开MVS软件后,左侧GigE会出现网卡的静态IP,如图想要修改相机IP,首先需要修改电脑的网络设置,设置成自己想要的IP段修改好之后,相机的图标会变为黄色感叹号,表示不能连接此时双击相机,则可设置IP(IP段始终和电脑网卡的IP段保持一致,不能跨段设置)查......
  • 安防监控视频平台LntonCVS视频监控汇聚平台遏制校园暴力保护校园学生安全应用方案
    未成年人被誉为祖国的花朵,是我们国家的未来。然而,最近频繁曝出的未成年霸凌事件却引发了社会的广泛关注。这些事件手段残忍,事态恶劣,引发了全社会对如何保护未成年身心健康、规避霸凌事件发生的深刻思考。为了更好地保障学生的安全,许多学校开始引入基于“AI+视频”技术的人工......
  • 视频融合共享平台LntonCVS视频联网共享平台养殖场应用解决方案
    在当今的畜牧业中,养殖场面临着诸多挑战,如养殖密集、流动量大、差异性大以及环境污染等问题。同时,动物疫情防控、设备设施不完善和政府监管薄弱等情况也给养殖场带来了困扰。因此,智能化养殖已经成为现代畜牧业的发展趋势。为了应对这些挑战,我们提出了基于AI智能分析网关平台Ln......
  • 视频汇聚共享平台LntonCVS智能视频监控平台智慧城建应用方案
    随着城市建设正在全面展开,城市框架已初步形成,涵盖公共体育设施、绿地公园、道路网络等多个领域,城市雏形正在加速显现。然而,在推进城市建设的同时,施工安全必须作为基石,确保建设进程安全有序。本文将探讨如何通过“AI+视频”技术实现施工场地智慧化监管。行业现状:1.监管挑战:......