首页 > 其他分享 >【知识点】 端到端场景文本检测与识别中 Word Spotting 和 End-to-End 评价指标的区别

【知识点】 端到端场景文本检测与识别中 Word Spotting 和 End-to-End 评价指标的区别

时间:2024-01-22 11:55:40浏览次数:27  
标签:知识点 End 单词 指标 Spotting Word 词典

问题缘起

在 ICDAR-2015 的场景文本端到端检测与识别任务中,总会出现 2 个不同的检测指标,其数值一般有微小的区别(0.5个点以内)。一直搞不懂这两个指标的区别在哪,最近看到了一篇论文[1],里面给出了这两个指标的解释。
 

解答

直接贴图:

 

可以看到这里解释得很清楚。在端到端任务中,通常会提供一个词典,根据最小编辑距离(比如小于等于1)来对检测的结果进行修正。两种评价指标的区别在于是否考虑没有出现在词典里的单词。

  • End-to-End:图像中的所有单词均需要被正确识别,包括没有出现在词典中的单词。
  • Word Spotting:只需要考虑图像中在词典里出现的单词,词典之外的单词识别结果的正确与否无需考虑。
     

那如果这样推理的话,如果采用了词典修正,图片中又具有词典里没有的单词,那么 End-to-End 指标就不可能达到 100% 了,因为不出现在词典里的词有可能被错误地修改,或者因为跟词典里的词编辑距离过大而被筛除。(除非不使用词典,而且模型推导结果完全正确,End-to-End 指标才可能达到 100%)
另一个问题是:如果不引入额外的词典,那么就不能计算 Word Spotting 指标了吧?还是说两种指标的数值都视作一样呢?个人倾向于前者,但感觉这个问题无关紧要。
 

参考文献
[1] Li, Hui, Peng Wang, and Chunhua Shen. "Towards end-to-end text spotting with convolutional recurrent neural networks." Proceedings of the IEEE international conference on computer vision. 2017.

标签:知识点,End,单词,指标,Spotting,Word,词典
From: https://www.cnblogs.com/yywwhh2000/p/17979749

相关文章

  • gt-render
    ThisismostlikelythereasonyouareinterestedintheGeoToolslibrary-thismodulefinallyletsyoudrawamapusingallthatdatayousetup.SupportstherenderingofgeospatialinformationusingtheJava2DAPI. 参考1:https://docs.geotools.org/late......
  • Object.assign()详解,Object.assign()与$.extend()合并对象,浅拷贝,js给现有对象增加新属
    一、简介:Object.assign()方法用于将所有可枚举属性的值从一个或多个源对象复制到目标对象。它将返回目标对象。简单来说,就是Object.assign()是对象的静态方法,可以用来复制对象的可枚举属性到目标对象,利用这个特性可以实现对象属性的合并。二、用法:Object.assign(target,...sour......
  • 【C语言初阶篇】结构体知识点的全面讲解!
    <br><br/><center><fontcolor="#006666">......
  • k8s之构建Mysql和Wordpress集群
    一、实验目的基于Kubernetes集群实现多负载的WordPress应用。将WordPress数据存储在后端Mysql,Mysql实现主从复制读写分离功能。1、准备Kubernetes集群环境root@k8s-master01:~#kubectlgetnodesNAMESTATUSROLESAGEVERSIONk8s-master01Re......
  • Maven Dependency Version:pom依赖版本固定或自动升级
    先介绍过Maven的依赖调节机制。可选依赖(Optionaldependencies)被依赖的项目主动不把可以传递的依赖传递下去,好比卖车的主动声明自己不会让买车的人买这辆车附加的保险业务。下面在解决思路中会举例说明。解决思路有了上面的知识背景,考虑使用Maven提供的Optional和Exclusions......
  • 15 Friendly Arrays
    FriendlyArrays打表#include<bits/stdc++.h>#defineintlonglongusingnamespacestd;voidsolve(){ intn,m; cin>>n>>m; vector<int>a(n+1); vector<int>b(m+1); for(inti=1;i<=n;i++)cin>>a[i]; for(inti=1;i<......
  • Mac版 Office Word 无法设置页边距--解决方案
    问题背景某天需要修改word文档页边距信息,但是点击自定义边距,没有设置弹框!系统:MacOS14.2Word:16.81参考解决方案系统设置-打印机与扫描中没有可用的打印机,故随便添加一个网络打印机(实际不可用,并没有)或者点开打印机与扫描仪后,按住control点已经有的打印机,没有打印机的点空白......
  • Dynamics 365中安全角色的Append和Append To的作用
    Append:将指定的记录追加到另一个对象的权利。没有的话,该实体表单的lookup(其他实体)字段只读,不能查找。AppendTo:向指定对象追加另一条记录的权利。没有的话,其他实体表单的lookup(该实体)字段只读,不能查找。测试如下:首先,新建实体TestBB;然后,新建实体TestAA,并新建lookup字段TestBB......
  • win32com模块--------------------------------word文档转换PDF文档(格式转换)
    上代码:fromwin32com.clientimportgencachefromwin32com.clientimportconstants,gencache'''win32com库是Python语言与Windows操作系统中的COM(ComponentObjectModel)接口进行交互的工具库。它允许开发者使用Python来操作Windows系统中的各种COM组件,例如Office软件(Word、Exc......
  • 探索Web开发的未来——使用KendoReact服务器组件
    KendoUI是带有jQuery、Angular、React和Vue库的JavaScriptUI组件的最终集合,无论选择哪种JavaScript框架,都可以快速构建高性能响应式Web应用程序。通过可自定义的UI组件,KendoUI可以创建数据丰富的桌面、平板和移动Web应用程序。通过响应式的布局、强大的数据绑定、跨浏览器兼容......