任务:
1、解决上次老师问的一些问题?
(1)上次老师提到F1得分,再总结一下:
混淆矩阵
TP:预测正例,实际正例(预测对)
FN:预测负例,实际正例(预测错)
FP:预测正例,实际负例(预测错)
TN:预测负例,实际负例(预测对)
精确率 = TP / (TP+FP) :预测为正例的那些数据里预测正确的数据个数(预测为正例的有多少预测对了,预测为正例且预测对的占预测为正例的比例)
召回率 = TP / (TP+FN):预测为正例的那些数据里预测正确的数据个数(有多少正例被识别出来了,预测为正例且预测对的占总正例的比例)
精确率和召回率可能此消彼长,所以引入F1得分,综合考虑准确率和召回率
调和平均
(2)该github代码是跨摄像头还是单摄像头?
(3)视频中的三个数分别是标注的ID,类别,以及 目标检测的过程中计算的置信度(即矩形框框出的物体是真实物体的概率)
(4)一些细节:
目标检测:目标检测是从图片背景中分离出感兴趣的目标,并确定这一目标的描述(类别和位置)
因而检测输出是一个列表,列表的每一项使用一个数据组给出检出目标的类别和位置(常用矩形框的坐标表示)-> yolo系列
基于Tracking-by-detection的MOT:先对视频的每一帧进行目标检测,输出矩形框坐标和类别,根据矩形框对目标进行裁剪,得到图像中的所有目标。
然后转化为前后两帧的关联问题,
(5)ID-switch:
因为跟踪的每个对象都是有标注ID的,一个对象在整个跟踪过程中ID应该不变,但是如果跟踪算法不够强大,总会出现一个对象的ID在不同的帧中发生了切换,
这个指标就说明了ID切换的次数,指视频的前一帧图片和后一帧图片中对于相同GT轨迹的预测轨迹ID出现了不同(发生切换),如果ID跟丢,此情况不计算在ID切换中。
这里的t代表的是视频的第t帧图片:
标签:正例,10.21,github,预测,10.28,TP,目标,负例,ID From: https://www.cnblogs.com/tkw123/p/17783546.html