首页 > 其他分享 >研究目标识别领域相关知识(10.11~10.18)

研究目标识别领域相关知识(10.11~10.18)

时间:2023-10-12 22:46:55浏览次数:39  
标签:检测 模型 目标 10.18 跟踪 图像 10.11 识别

这周任务(到下周三汇报):

会发给我资料,需要整理下面内容:

1、研究什么样的问题?

  目标检测/识别问题

  随着社会的发展,公共安全成为全社会的一个共同话题,与之相辅相成的视频监控系统也得到了大量的普及。视频监控系统可以直观的再现目标场景,可作为公安侦破案件的强力辅助。在执法部门的工作

中,目标的识别和定位是及其关键的一步,然而现有的监控部署下,这个关键步骤几乎是靠着人力完成的。在这个讲究数据和效率的时代,通过人工观察监控录像查找结果显然存在着很大的资源浪费以及效率的

低下。另外,由于摄像头的分辨率等硬件缺陷,很难得到清晰的人身图像,因此,已经大力推广的人脸识别技术已不再适用此场景。由于传统人工查询的不便性以及人脸识别的无法应用,研究者思考如何发明一

项更合适的技术来取代人脸识别,能在监控领域以机器代替人力分析。

 

2、通过什么方面技术解决的?

使用了BoxMOT框架:(一种可插式的STOA多目标跟踪框架)

SOTA = state of art 最先进的,最高水平的、顶级的

(1)跟踪模型:oTSORT, DeepOCSORT, OCSORT, HybridSORT, ByteTrack, StrongSORT

(2)目标检测模型:Yolov8、Yolo-NAS、YOLOX

(3)ReID模型提取特征

ReID  = Re-identification(重识别),其定义是利用算法,在图像库中找到要搜索的目标的技术,比如行人重识别,就是检测出行人,是属于图像检索的一个子问题。

CLIP = Contrastive Language-Image Pre-training,一种基于对比文本-图像进行预训练的模型。

CLIP的训练数据是文本-图像对(一张图像和它对应的文本描述),希望通过对比学习,模型能够学习到文本-图像对的匹配关系。

所以CLIP-ReID就是通过CLIP,一种基于对比文本-图像对进行预训练的模型,来实现在图像库中找到要搜索的目标。

 

为什么使用它?

(1)该框架支持主流的目标检测模型,例如:Yolov8、Yolo-NAS、YOLOX

(2)该框架支持大多数的跟踪方法(跟踪器):BoTSORT, DeepOCSORT, OCSORT, HybridSORT, ByteTrack, StrongSORT

总结:

BoxMOT可以看作一个软件封装器,将多种目标检测模型与不同的目标跟踪器组合,实现多目标跟踪

 

3、解决到什么程度了?(评价指标、展现出的效果)

评价指标:

(1)MOTA↑:Multi-Object Tracking Accuracy(表示多目标跟踪准确率,包括漏检、误检和跟踪错误等多个方面)

(2)IDF1↑:IDF1 Score(IDF1得分,表示正确识别的检测与平均真实数和计算检测数之比)

(3)HOTA↑:Higher Order Tracking Accuracy (针对MOTA有些情况下不足以衡量出多目标跟踪的性能的情况提出的,更好地对齐评价得分和人视觉上的观感)

(4)Dets:DetS是一种高效的目标检测指标,它基于目标检测中的Dice系数和sAP(strict average precision)这两种指标,对目标检测的结果进行评估。

 

后面根据这些内容,去针对性地学相关机器学习知识,读论文,做东西

 

给了个github,关于BoxMOT的

https://github.com/mikel-brostrom/yolo_tracking

介绍:

这个仓库里含有一系列可插入式的,先进的,应用在目标识别上的多目标跟踪器。

我们提供了例子关于如何将这个包和流行的目标识别模型(,比如Yolov8,Yolo-NAS,YOLOX)一起使用。

IDF1 Score [2]. The ratio of correctly identified detections overthe average number of ground-truth and computed detections.

标签:检测,模型,目标,10.18,跟踪,图像,10.11,识别
From: https://www.cnblogs.com/tkw123/p/17760782.html

相关文章

  • 人脸识别
    “比奇堡双钻”项目选题一、项目目标及意义1.1项目目标1.2项目意义二、项目可行性分析2.1规模及难度2.2人员2.3成本预算2.3.1硬件和软件成本2.3.2培训成本2.3.3人力成本2.3.4数据收集和存储成本2.4时间要求2.5风险三、项目计划3.1软件开发模型3.2时间安排3.3人员......
  • 动物识别系统python+Django网页界面+TensorFlow算法模型+数据集训练
    一、简介动物识别系统。基于Python+TensorFlow+Django网页框架+ResNet50算法模型实现实现步骤如下:收集多种动物的图片数据集,并整理归类然后使用TensorFlow搭建ResNet50算法模型网络对数据集进行多次迭代训练最后得到一个精度较高的H5模型文件基于训练好的模型,使用Django开......
  • 机器学习经典教材《模式识别与机器学习》,Pattern Recognition and Machine Learning,PR
     微软剑桥研究院实验室主任ChristopherBishop的经典著作《模式识别与机器学习》,PatternRecognitionandMachineLearning,简称PRML,被微软“开源”了。  =================================  本书介绍&下载页:(书的介绍页面)https://www.microsoft.com/en-us/research......
  • Lnton羚通视频分析算法平台工地劳务实名制人脸识别管理方案
    Lnton羚通的算法算力云平台是一款优秀的解决方案,具有突出的特点。它提供高性能、高可靠性、高可扩展性和低成本的特性,使用户能够高效地执行复杂计算任务。此外,平台还提供丰富的算法库和工具,并支持用户上传和部署自定义算法,提升了平台的灵活性和个性化能力。在建筑工地场景中,施工人......
  • 交通标志识别系统python+TensorFlow+算法模型+Django网页+数据集
    一、介绍交通标志识别系统。技术涉及:Python编程语言开发TensorFlow搭建算法模型对数据集进行训练得到一个精度较高的模型文件Django开发网页端界面平台实现对58种交通标志图片进行识别二、效果图片展示三、演示视频and代码视频+代码+介绍:https://s7bacwcxv4.feishu.......
  • 10.11
    又是运气爆表的一天!8.10切A,线段树板子看了一眼发现B有点像贪心,但是不太会,开C9.40切C换根板子,并且考过回去看B,想了想会了10.50切B打了个T4的暴力+剪枝检查跑路应得分数400=100+100+100+80实得分数372=100+92+100+80最高分400=100+100+100+100......
  • 10.11总结
    1.解决了好几个报错①数据库表设置自增,在application.properties中mybatiesplus中要写id_type=auto,实现不写入id数据,数据库进行自增操作②没写注释@Autowired导致的一系列错误③mapper映射找不到,包对不上忽略一个问题就是创建包的时候要用com/example/mapper而不是com.example.......
  • 2023.10.11 一些好题
    A你有\(m\)个相同的球,球有性能\(c\),你可以测试\(x\),若\(x\gec\),那么球会碎掉,若\(x<c\),那么球不碎。性能的范围\(n\le1e5\)。求最多要测试多少次。首先答案有一个上限是\(\logn\)。所以令\(m\to\min(m,\logn)\)所以我们记状态可以记\(dp_{l,r,k}\)表示当前确......
  • 大二打卡(10.11)
    今天做了什么:英语课,今天对于老师上课的小发问都能回答上来,不知道是不是因为坐的稍微靠后心情没那么紧张,脑子活了,听力最后一部分听的不行,比上回好了一点,但有限弄了半天建民的测试,我现在已经不知道自己搞错哪一步了,tomcat重装,connector也下了重装,web项目建立的也没问题,代码也没保......
  • 2023.10.11——每日总结
    学习所花时间(包括上课):9h代码量(行):0行博客量(篇):1篇今天,上午学习,下午学习;我了解到的知识点:1.java的一些特性;明日计划:学习......