首页 > 其他分享 >常见目标检测数据集

常见目标检测数据集

时间:2023-11-06 16:33:24浏览次数:26  
标签:检测 常见 目标 AP 图像 类别 数据

数据集

一、常见目标检测数据集

1、PASCAL VOC 07/12

Pascal Visual Object Classes(VOC)挑战赛。对四个目标类别进行分类和检测。这两个版本主要用于基准测试集。VOC2007 有5k个训练图像,超过12k的标注目标;VOC2012有11k个训练图像,超过27k个标注目标,目标类别扩展到了20类,增加了语义分割、动作识别的任务。Pascal VOC引入了[email protected]作为评价指标评估模型性能。

2、ILSVRC

ImageNet Large Scale Visual Recognition Challenge。用作评估模型性能的基准集。数据集包含1000个类别、超过100万个图像,其中精选了200个类别、超过500k个图像被于目标检测。

3、MS-COCO

The Microsoft Common Objects in Context。COCO数据集是目前最具挑战的数据集之一,包含了自然环境中发现的、四岁儿童可识别的91种常见目标。包含了超过200万个实例,且平均每张图像中有3.5个类别、7.7个实例,也包括了多种视角的图像。COCO在IoU从0.5到0.95的范围内每隔0.5计算一次mAP,然后平均这十个mAP,得到AP。除此之外,它还将AP分别用于小型、中型和大型对象,以在不同的尺度上比较性能。

:mAp(mean Average Precision),均值平均精度。

​ mAp = 所有类别的平均精度求和 / 类别总数

​ AP(Average Precision)平均精确度

4、Open Image

谷歌提供的数据集,由920万张图像组成。使用图像级标签、对象边界框和分割掩码等进行标注。对于目标检测,Open Image有1600万个包围框,包含190万张图像上的600个类别,每张图像有8.3个对象类别。

二、数据倾斜/偏差问题

图3和图6中,不同类别的图片数量差别很大。在Pascal VOC、MS-COCO、Open Image数据集中,除了前五类,后面类的图片数量显著下降。这种现象表示了数据集的一种倾斜,这必然会在任何目标检测模型的训练过程中产生一种偏差。

因此,在这些倾斜数据集上训练的目标检测模型,对于训练数据中数量较多的类,可能表现出更好的检测性能。

三、评价指标

True positive —— 预测正确,且为正样本

False positive —— 错误的预测成正样本

True negative —— 预测正确,且为负样本

False negative —— 错误的预测成负样本

image-20230323130225849

AP (average precision):每一类的平均精度;

mAP:将所有类的AP求平均值。

标签:检测,常见,目标,AP,图像,类别,数据
From: https://www.cnblogs.com/dxmstudy/p/17813051.html

相关文章

  • 羚通视频智能分析平台玩手机、打电话算法检测识别系统 玩手机、打电话行为预警系统
    羚通视频智能分析平台是一款先进的技术工具,具备强大的算法检测和识别功能。该平台主要用于准确检测和识别用户是否在使用手机或打电话。首先,该平台具备强大的算法检测功能,能通过分析视频中的图像和声音数据,准确判断用户是否在使用手机。无论是滑动屏幕、点击按钮还是......
  • Jtti:服务器的常见用途有哪些
    服务器是计算机网络中的关键组件,用于多种用途,以下是一些常见的服务器用途:Web服务器:用于托管网站和应用程序,响应来自互联网的HTTP请求,向用户提供网页内容。文件服务器:用于存储和共享文件,员工可以通过网络访问和共享文件和数据。电子邮件服务器:处理和存储电子邮件,以便用户可以发送、......
  • 羚通视频智能分析平台行人入侵算法检测 重点区域人员徘徊算法检测
    羚通视频智能分析平台是一款利用视频监控进行算法分析、算法识别。该平台具备识别监控区域内行人入侵的功能,并能实时分析报警,为工厂、园区等环境提供了极其实用的安全保障。为了满足安防监控领域中的行人入侵识别需求,羚通视频智能分析平台专门研发了一种智能算法方案。这种......
  • 实时目标检测与跟踪:机器视觉的挑战与机遇
    实时目标检测与跟踪是机器视觉领域的一个重要研究方向,它涉及到在视频或图像序列中准确地定位和跟踪多个目标对象。这个任务具有很高的挑战性,同时也带来了许多机遇。挑战:1.复杂背景:目标检测与跟踪需要在复杂的背景中准确地识别和定位目标对象。这需要算法能够有效地处理遮挡、光......
  • 羚通视频智能分析平台安防视频监控算法分析 烟火检测预警
    羚通视频智能分析平台是一种基于人工智能技术的视频分析平台,旨在通过对视频内容进行智能分析和处理,提供各种视频智能应用和服务。其中,烟火算法检测是该平台中的一个功能,用于检测视频中的烟火活动。这种算法具有高精度检测、实时性强、可扩展性强、自定义配置和智能分析和预警......
  • face-api基于tensorflow 的人像检测npm 包
    face-api基于tensorflow的人像检测npm包,原始项目为justadudewhohacks/face-api.js但是因为缺少维护,社区有人自己fork了一个新的vladmandic/face-api,可以更好的支持tensorflow新版本,当然很不错还可以支持基于wasm的backend(@tensorflow/tfjs-backend-wasm)参考使用demo.......
  • 羚通视频智能分析平台安防视频监控算法分析 烟火检测预警
    羚通视频智能分析平台是一种基于人工智能技术的视频分析平台,旨在通过对视频内容进行智能分析和处理,提供各种视频智能应用和服务。其中,烟火算法检测是该平台中的一个功能,用于检测视频中的烟火活动。这种算法具有高精度检测、实时性强、可扩展性强、自定义配置和智能分析和预警等优......
  • C7N 常见问题
    1.跨组件的数据传递推荐用什么方式推荐使用mobx2.LOV的字段值怎么获取constlovDataSet=awaitStores.LovCodeStore.getLovDataSet('LOV_CODE');import{queryIdpValue}from'services/api';constlist=awaitqueryIdpValue(fLovCode);3.Lov组件默认值复显4.在T......
  • 常见html 行内、块状元素
     行内元素:label、select、textarea、a、img、span、input、button块级元素:div、h1-6、header、form、hr、ul、ol、li、p、table 区别:块级元素会独占一行,其宽度自动填满其父元素宽度。行内元素不会独占一行,相邻的行内元素会排列在同一行里,直到一行排不下,才会换行,其宽度随元......
  • 常见面试题-MySQL专栏(三)MVCC、BufferPool
    typora-copy-images-to:imgs了解MVCC吗?答:MVCC(Multi-VersionConcurrencyControl)是用来保证MySQL的事务隔离性的,对一行数据的读和写两个操作默认是不会通过加锁互斥来保证隔离性,避免了频繁加锁互斥,而在串行化隔离级别为了保证较高的隔离性是通过将所有操作加锁互斥来实现的。......