首页 > 其他分享 >【论文阅读笔记】【Image Retrieval】 Global Features are All You Need for Image Retrieval and Reranking

【论文阅读笔记】【Image Retrieval】 Global Features are All You Need for Image Retrieval and Reranking

时间:2023-11-15 19:45:47浏览次数:28  
标签:检索 粗粒度 Features 特征 Image Pooling Retrieval GeM 图片

SuperGlobal
ICCV 2023

读论文思考的问题

  1. 论文试图解决什么问题?

    • 图片检索方法通常由粗粒度图片检索和精确的结果重排列两个模块组成。人们通常认为图片的 local feature 在结果重排列中是不可或缺的,但对大量的 local feature 的计算需要较高的计算资源和时间

    • 能否只用图片的 global feature 来进行高效、可靠的图片检索,降低检索过程中的计算量?

  2. 文章提出了什么样的解决方法?

    • 从GeM pooling 中获取灵感,提出了 SuperGlobal 模型,针对粗粒度检索和图片重排两部分设计了一系列改进模块(可即插即用),达到了只利用图片的全局特征进行可靠、高效的检索的目的

    • 粗粒度检索:提出了 GeM+, Regional-GeM, Scale-GeM, ReLU+ 四个模块

    • 重排列:提出了 Top-M descriptor augmentation 和 reranking with maximum descriptors aggregation 两个步骤

  3. 你觉得解决方法的关键之处在哪里?

    • 通过细腻地设计 aggregation 方式,得到了既包含图片全局信息,又保留了局部信息的 image global feature
  4. 这个解决方法的局限性在哪里?有没有更好的解决方法?

  5. 文章是通过设计什么样的实验来支撑其解决方法的有效性的?(你说有效就有效吗,我不信)你觉得设计的实验有什么问题或者是缺少了什么实验?

    实验:

    1. 和其他方法的效果对比

    2. 时间和显存占比的对比

    3. 各个模块的 ablation study

要点

  1. 粗粒度检索里的四个模块

    1. GeM+

      • 以往的方法中,聚合特征所用的 GeM Pooling 方法通常会训练出得到偏低的 p

      • 原因:用于损失计算的角度间隔损失(Angular Margin Loss)会导致正样本梯度和负样本梯度的不相等,导致偏低的 p (p.s. 这个数学推导并没有看懂

      • 在一个小数据集(ROxford 5k)上进行了参数 p 搜索,对推导过程中 p 的取值进行了比较好的估计

    2. Regional-GeM

      • 如果只使用 GeM Pooling 进行全局特征聚合,会导致局部特征的损失;直接在 GeM Pooling 前面加上 \(L_p\) Pooling 又会导致全局特征中,局部特征占据主导

      • 将 \(L_p\) Pooling  后的特征和卷积层输出的特征 \(D_{h,w}\) 残差求和即可,即

        \(g=W(\frac{1}{H_dW_d}\sum\limits_{h,w}{\frac{M_{h,w}+D_{h,w}}{2}}^{p_r})^{1/p_{r}}\)

    3. Scale-GeM

      • 多尺度特征的融合在图片检索中有很好的效果,但不能直接采用类似于 GeM Pooling 的方式进行融合(因为不同特征的最小值是不一样的)

      • 每层各自加上自己的最小值,再进行类似 GeM Pooling 的操作进行融合

    4. ReLU+

      • 使激活函数 ReLU 具有类似于 GeM Pooling 的强化信号的效果

      • 将分段函数的临界点改为一个正数 \(\alpha\) ,而不使用 0

  2. 重排列中的两个步骤

    1. Top-M descriptors augmentation

      • 先用 query image 的全局特征进行搜索,得到一个粗略的 M+1 张图片的集合(包括自己),再在集合中进行 top-K DBA

      • 大大降低了 DBA 的复杂度

    2. Reranking with maximum descriptors aggregation

      • 首先利用 DBA refine 过的 query 进行检索,得到一轮分数 S1,随后根据 top K 结果来做 (maximum) aggregation。用聚合后的特征来做第二轮检索,得到分数 S2。最后将两轮分数平均

      • 实际上是一种非常激进的  query expansion

问题

  1. 那堆数学证明有点难,暂时看不懂

标签:检索,粗粒度,Features,特征,Image,Pooling,Retrieval,GeM,图片
From: https://www.cnblogs.com/yywwhh2000/p/17834615.html

相关文章

  • 如何使用ImageMagick将SVG转换为PNG?
    内容来自DOChttps://q.houxu6.top/?s=如何使用ImageMagick将SVG转换为PNG?我有一个尺寸为16x16的SVG文件。当我使用ImageMagick的convert程序将其转换为PNG时,结果得到了一个16x16像素的PNG,这个尺寸太小了:converttest.svgtest.png我需要指定输出PNG的像素大小。-size参数......
  • 解决 Fedora Live-CD 启动时出现 Invalid image 的问题
    .....安装Fedora39的时候,Live-CD启动报如下错误:InvalidimageFailedtoreadheader:UnsupportedFailedtoloadimage:Unsupportedstart_image()returnedUnsupported尝试了各种解决办法未果,后来在Fedora论坛上发现有人在Fedora37时遇到过同样的问题。......
  • [论文阅读] Latent Consistency Models@ Synthesizing High-Resolution Images with F
    1.Pretitle:LatentConsistencyModels:SynthesizingHigh-ResolutionImageswithFew-StepInferenceaccepted:arXiv2023(ICLR2024Submission)paper:https://arxiv.org/abs/2303.01469code:https://github.com/openai/consistency_modelsref:https://mp.wei......
  • Android:在按钮(Button)或图像按钮(ImageButton)上合并文本和图片。
    内容来自DOChttps://q.houxu6.top/?s=Android:在按钮(Button)或图像按钮(ImageButton)上合并文本和图片。我正在尝试在按钮背景上添加一张图片,并根据运行时发生的情况动态地添加一些文本到图片上方。如果使用ImageButton,我甚至无法添加文本。如果使用Button,我可以添加文本,但只......
  • 格式转换:相机帧void* pBuffer,QImage,cv::Mat,Halconcpp::HObject
    【说明】1、若传递的是指针,则内存共享,其一改变,另一个也被改变。为了避免输入被更改,做了些处理。如QImage2Mat中使用了两个变量mat,out。2、有的存在宽度方向4字节对齐情况,所以做了些处理。如QImage2HObject中让宽度变为4的整数倍。 【相机帧void*pBuffer赋给其他格式】 ......
  • 解决MySQL8报错:Public Key Retrieval is not allowed
    问题分析:这个是由于配置的URL中的useSSL为false导致的,当其为false后,mysql将会检查allowPublicKeyRetrieval是不是TRUE,由于开启allowPublicKeyRetrieval不安全可能遭到中间人攻击(英语:Man-in-the-middleattack,缩写:MITM),所以allowPublicKeyRetrieval的值默认为false。两项都为false后......
  • Adding Conditional Control to Text-to-Image Diffusion Models
    https://mp.weixin.qq.com/s/iL6YitT7EGP6DnrBehb9MQ1.AddingConditionalControltoText-to-ImageDiffusionModels论文地址:https://arxiv.org/pdf/2302.05543.pdf开源地址:https://github.com/lllyasviel/ControlNet(该项目已有2.4万stars)作者单位:斯坦福大学这......
  • vue 使用elementui el-image 图片地址不变,图片不刷新问题
    问题:el-image图片地址不变,图片不刷新问题原因:在Web开发中,浏览器会缓存已经加载的静态资源(比如图片、CSS、JS文件),以提高页面加载速度,减轻服务器负担。当图片的源路径不变时,浏览器会对这些图片进行缓存,如果图片内容更新了,但是浏览器还是使用缓存,这时候就需要在图片源路径后......
  • linux ImageMagick convert 报错 convert-im6.q16***
    在linux批量处理图片时候报一下错误,导致图片无法按要求转化,运行的命令如下:convert**.jpg-resize512x512new.jpg报错:convert-im6.q16:cacheresourcesexhausted`*.jpg'@error/cache.c/OpenPixelCache/4083.convert-im6.q16:noimagesdefined`./zoom/113.jpg'@erro......
  • make没有更新最新的uImage
      在LCD驱动的时候发现,linuxlogo一直弄不出来,猜想可能是因为uImage的问题,就看了一眼uImage时间:​  我现在的时间是,那可能就是没有更新make的时候没有更新,就上网搜了一下用下面的命令输出uImage:makeuImage,CALLscripts/checksyscalls.shCALLscripts/atonic/check-......