首页 > 其他分享 >聊聊yolact

聊聊yolact

时间:2022-10-16 23:23:35浏览次数:75  
标签:这个 置信度 mask yolact 聊聊 类别 pdf

Yolact系列文章很多

Yolact

Yolact++

Yolactedge   https://arxiv.org/pdf/2012.12259.pdf

 

 yolact的结构

总体长的没有什么特别的,如果就看feature backbone+feature pyramid+prediction head+NMS和所有的ssd或者yolo一样,平平无奇的object detection, 事实上,只有在分割这个领域有语义分割和实例分割,在人家目标检测这个行当里面吧,都是实例检测,没有语义检测,因为一个物体就要框一个框嘛,人家也不能所有一种类别的人都用一个框去。

那么自然而然的,套用人家检测的思路来做分割嘛,只不过,人家输出的是框咱们输出mask。这里yolact就又搞了一个分支,去预测prototypes(一共32个,不是图中示意的4个),这个prototypes人家也有解释,其实就是Mask, 但是他每个mask负责的区域啥的都不一样,然后这个predictrion head还会预测一个系数,就是每个mask的系数,根据这个系数最后去计算得到每个目标框里面的物体的mask, 做一些crop,取阈值啥的。

  

 

 

 

 

 

 

 

 Yolact++改进的地方

改进的一个点挺有意思的,加了下面这个分支,号称是mask rescoring network

这个分支看起来挺简单的,其实就是在crop之后去加了一些网络计算出这个mask属于每个类别的confidene。就是根据mask去计算类别的置信度。然后这个置信度和原始的分类的置信度去乘,变成实际上的分类置信度去计算loss。就是这么简单。

 

 

 

解决啥问题?这个主要解决的就是预测得到的分类的置信度很高,但是mask的精度不高的问题。有可能分类最高的那个框他不是mask精度最高的那个框。为了解决这个问题,由mask再去预测个confidence, 然后和分类的那个乘在一起,这样可以去让网络学习使得mask的confidence也变高。因为是mask直接预测的confidence,所以和mask的精度就直接有关系了。

 

 

 

这玩意为啥有用?为啥嘞,根据mask去算类别这事情不靠谱,人类都干不了这事情。所以作者这边的mask不是一个简单的mask,特意强调是要在做二值化之前的mask, 这时候大约还是有点什么信息的吧,然后用这个mask去计算每个类别的置信度。据说这个想法是从mask scoring R-CNN https://arxiv.org/pdf/1903.00241.pdf 学来的。但是人家是feature map和mask级联起来,总觉得比这个靠谱一点。

撇开这个不谈,得到的这个各个类别的置信度和原来的分类的置信度一乘,就可以迫使网络去学习让mask的置信度变高,相当于mask的精度变高。

似曾相识?这想法也不新奇,不知道谁抄的谁,那个tinaface里面也有这么个东西。他说是又加了一个IOU-aware branch, 能让定位更准。也是嫌分类置信度很高,location精度不高,所以又根据xywh的值去预测了个置信度,乘在一起。这也算是常规操作了。

 

标签:这个,置信度,mask,yolact,聊聊,类别,pdf
From: https://www.cnblogs.com/sunny-li/p/16797569.html

相关文章

  • 聊聊技术写作的个人体会
     有群友问过,是什么原因使我开始写技术公众号,又是什么动力让我坚持写的。在我看来,写作是一件不能敷衍的事,通过写作来学习,反而要比单纯地学习的效果要好。为了写成一篇“拿得......
  • leetcode必备算法:聊聊滑动窗口
    前言我们刷leetcode的时候,经常会遇到滑动窗口类型题目。滑动窗口问题非常经典,也很有技巧性,一般大厂也喜欢问。今天跟大家一起来学习滑动窗口的套路,文章如果有不正确的地方,......
  • #yyds干货盘点#今天聊聊JS的Function
    Object.prototype是原型的创造者,任何原型都源自它;而Function.prototype是仅次于Object.prototype的存在,它是内置构造函数的创建者,任何构造函数都源自它。​Function(构......
  • #yyds干货盘点#今天聊聊大文件上传
    文件上传在开发中的需求比较多,上传的解决方案也很多,咱们下面一一来看:文件上传普通表单上传使用PHP来展示常规的表单上传是一个不错的选择。首先构建文件上传的表单,并指定表......
  • 聊聊Vuex原理
    背景Vuex是一个专为Vue.js应用程序开发的状态管理模式。Vuex是专门为Vue.js设计的状态管理库,以利用Vue.js的细粒度数据响应机制来进行高效的状态更新。如果你已......
  • Microsoft 365 解决方案:聊聊SharePoint List View Threshold 那些事
    51CTO博客链接:​​​https://blog.51cto.com/u_13637423​​ 最近一段时间,给客户或者Partner处理问题时,经常面临SharePoint列表视图阈值问题,今天整理本文给大家介绍一下......
  • 深入浅出,聊聊实时音视频中的回声消除与降噪
    在实时音频互动场景中,回声消除、降噪、自动增益(即3A算法)是直接影响音质和体验的重要环节之一。如何降低计算量,提升处理效率,如何兼容更多的设备、环境等,让3A算法可以适应......
  • 【工具】聊聊文件传输工具,网页文件传输工具Snapdrop好用不
    微信关注公众号“DLGG创客DIY”    文件传输工具很多情况下都会用到:和朋友分享各种学习资料备份各种资料同步文件到另一个电脑等等    传统的文件传输方法有:通过存......
  • 聊聊Linux中CPU上下文切换
    目录什么是CPU上下文CPU上下文切换上一任务的CPU上下文保存在哪?进程上下文切换内核空间和用户空间top命令查看CPU资源系统调用进程上下文切换和系统调用的区别?进程切换的......
  • DevOps落地实践点滴和踩坑记录-(2) -聊聊平台建设
    很久没有写文章记录了,上一篇文章像流水账一样,把所见所闻一个个记录下来。这次专门聊聊DevOps平台的建设吧,有些新的体会和思考,希望给正在做这个事情的同学们一些启发吧。​​......