语义分割入门（一）

时间：2022-11-12 16:56:30浏览次数：81

标签：分割入门 figure 卷积语义 padding 类别 FCN 预测

本文参照：FCN网络结构详解(语义分割)_哔哩哔哩_bilibili

以及：Fully Convolutional Networks for Semantic Segmentation

转置卷积（Transposed Convolution、fractionally-strrdcd、dcconvolution）

转置卷积运算步骤（设步长 stride=1、填充 padding=0，k卷积核尺寸）

在输入特征图元素间填充s-1行、列0

在输入特征图四周填充k-p-1行、列0

将卷积核参数上下、左右翻转

做正常卷积运算（填充0，步距1）

语义分割评价指标：

Pixel Accuracy

\frac{\sum_{i} n_{i i}}{\sum_{i} t_{i}}

mean Accuracy

\frac{1}{n_{c}, s} \sum_{i} \frac{n_{i i}}{t_{i}}

MIOU（Mean Intersection over Union）：均交并比

$\frac{1}{n_{cl s}} \cdot \sum_{i} \frac{n i i}{t_{i} + \sum_{j} n_{j i} - π i i}$

$n_{i j}$ :类别i被预测成类别j的像素个数

$n_{c ls}$ ：目标类别个数（包含背景）

$t_{i} = \sum_{j} n_{i j}$ ：目标类别i的总像素个数（真实标签）

Fully Convolutional Networks for Semantic Segmentation

figure 1

figure 2

FCN-32S：

将预测结果上采样32倍，还原原图大小

figure 3

VGG16 Backbone：指代figure 2 中的卷积层和池化层，最后输出7x7x512

FC6：卷积层 padding=3（论文中padding=100），不会改变特征图高和宽

　　卷积核 7x7　　步长：s=1

FC7：卷积层：padding= 　　

　　　卷积核 1x1　　步长：s=1

conv2d：高和宽不会变，卷积核个数与分类类别有关

　　　　channel=num.classes

转置卷积：上采样32倍，会恢复到原大小，

FCN-16S：

figure 4（详见figure 1）

将预测结果上采样16倍，还原原图大小

maxpool3（下采样率8）　　maxpool4（下采样率16）

FCN-8S：

将预测结果上采样8倍，还原原图大小

figure 5

交叉熵损失计算（Cross Entropy Loss）：

softmax+log+nll_loss

softmax:input网络的输出预测图像

nll_loss：负对数似然损失函数

$nll_loss = - \frac{1}{N} \sum_{i = 1}^{N} y_{i} l (log_softmax)$

例：原数据输入预测图像(预测图像两层，对应要分割的两种类别)

[[[0.12,0.36],[0.22,0.66]],

[[0.13,0.34],[0.52,-0.96]]]

图像标签（0表示背景，1表示行人，标签的shape为（1,2,2））

[[1,0],[0,1]]

标签：分割,入门,figure,卷积,语义,padding,类别,FCN,预测
From： https://www.cnblogs.com/Ms-wang/p/16882092.html

HTML-语义化标签和表格标签
语义化标签语义化标签定义：html5中为了提高程序的可读性提供了一些标签1.<header>2.<footer> HTML5代码<header></header><footer></footer>表格标签table:定......
c#创建windows服务入门教程实例
https://www.cnblogs.com/bruce1992/p/15028817.html用c#中创建一个windows服务非常简单，与windows服务相关的类都在System.ServiceProcess命名空间下。每个服务都需要继......
篇(7)-Asp.Net Core入门实战-从系统菜单功能的增删改查开始(二：修改和删除)
入门实战-从系统菜单功能的增删改查开始(一：修改和删除)上一篇讲了查询和增加，本章节就把修改和删除讲完。1.实现修改功能。（1）.在MenuController中增加2个Action：Edit，分别是......
篇(6)-Asp.Net Core入门实战-从系统菜单功能的增删改查开始(一：查询和增加)
入门实战-从系统菜单功能的增删改查开始(一：查询和增加)检验数据库配置正确与否，并且检验EF配置的连接是否可用，需要从数据库中拉取数据在视图页面显示，这样流程才通。我建个......
【图像分割】基于均值聚类+OUST+区域生长法实现MRI图像分割附matlab代码
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进。......
HTML概念介绍和快速入门
HTML概念介绍概念：是最基础的网页开发语言HaperTextMarkupLanguage超文本标记语言超文本：超文本是用超链接的方式，将各种不同空间的文字信息组织在一起的网状文......
Mybatis 入门实战(1)--简介
1、Mybatis是什么MyBatis是一款优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。MyBat......
MAUI新生-XAML语法基础：语法入门Element&Property&Event&Command
一、XAML（MAUI的XAML）和HTML两者相似，都是标签语言（也叫标记）组成的树形文档。每个标签元素，可视为一个对象，通过“键=值”形式的标签属性（Attribute），为对象的属性（Property）、事件......
篇(4)-Asp.Net Core入门实战-使用ADO.NET
入门实战-在Asp.NETCORE中使用ADO.NET在讲EF的配置之前，我想说下基于ADO.NET的数据库操作方式：原来做项目时，都是要有个DBHelper文件，来进行数据库的增删改查操作，那么在Asp.n......
【SpringBoot 技术专题】「开发实战系列」Undertow web容器的入门实战及调优方案精讲
Undertowweb容器Undertow介绍Undertow是红帽公司开发的一款基于NIO的高性能Web嵌入式服务器，红帽公司（RedHat）的开源产品，且是WildFly8（JBoss）默认的Web服务器.；官网API......