文章目录
YOLO v1笔记
一、推理阶段
1、模型结构
2、推理过程解析
该图为数据集为VOC时的情况,S=7,B=2。
生成预测框
生成条件概率
输出tensor解析
1-5、6-10为两个bounding box的(x,y,w,h,conf)。11-30为20个类别的置信度。
x,y是相对于grid cell的中心点,w,h是相对于整张图片的宽高,所以都是0-1的值。
模型训练成功之后,输入未知图片,通过运行模型的前向计算得到一个7x7x30的tensor。该tensor划分为7x7个网格,每个网格预测两个bounding box,每个bounding box包含(x,y,w,h,conf)(x,y为中心点坐标)。
该bounding box的置信度乘以20个类别的条件概率得到该bounding box的20个类别的全概率。
每个grid cell 的每个bounding box都做该操作获得该框的类别概率,最终每一个类别都有98个类别分数。
3、后处理
去掉置信度低的框、重复的框。
对每个类别进行非极大值抑制。
选得分最大的框bbmax,将后面得分低且非零的框 b b m i n i bbmin_i bbmini与bbmax进行比较。
如果两个框的交并比大于阈值时,将 b b m i n i bbmin_i bbmini的分数设为0。
所有框比较完后,只有两个框的得分非零。
对所有类都重复上面的过程。
二、训练阶段
1、confidence计算
每个gt由它的中心点位于的grid cell来负责拟合它。根据gt 框和该grid cell的两个框的iou来选择其中一个bounding box进行拟合,另外一个bounding box丢弃。其他没有gt 中心点的grid cell也丢弃。
注:每个grid cell生成的两个bounding box的中心点都位于所属的grid cell中。
2、损失函数
end~
本人水平有限,有错的地方还请批评指正。
本文参考同济子豪兄。
标签:box,类别,研读,YOLO,cell,v1,grid,中心点,bounding From: https://blog.csdn.net/Shine19/article/details/145057655什么是精神内耗?
简单地说,就是心理戏太多,自己消耗自己。
所谓:
言未出,结局已演千百遍;
身未动,心中已过万重山;
行未果,假想灾难愁不展;
事已闭,过往仍在脑中演。