FDDWNET:模型参数仅为0.8M，速度和准确率综合性能在轻量级分割网络中达到SOTA

时间：2022-10-06 13:01:32浏览次数：60

论文链接：https://arxiv.org/pdf/1911.00632v1.pdf

一、主要思想

本文介绍了一种用于实时精确语义分割的轻量级卷积神经网络FDDWNet。相对于近年来轻量级网络更倾向于采用浅层结构的发展，FDDWNet在保持较快的推理速度和较高的分割精度的同时，努力设计更深层的网络结构。网络使用深度因式膨胀可分离卷积（FDDWC）来学习不同尺度感受野的特征表示，模型参数较少。此外，FDDWNet有多个skip的连接分支，用于从中间卷积层收集上下文线索。实验表明，FDDWNet的模型尺寸仅为0.8M，在1024×512输入图像的单台GTX 2080Ti GPU上实现了60fps的运行速度。综合实验表明，论文提出的模型在Cityscapes和CamVid数据集上，速度和精度权衡方面达到了SOTA。

现有构建轻量级分割网络的方式主要可以分为三类：

（1）基于网络压缩的方法通过剪枝技术去除预训练模型的冗余以提高效率。

（2）基于低比特的方法使用量化技术来提高效率，其中学习的模型权重由少量比特表示，而不是由高精度浮点表示。与基于压缩的方法不同，这些模型通常不会改变网络结构，但往往以分割性能差为代价。

（3）直接设计轻量级的网络架构（深度可分离卷积）以提高效率，其中卷积因子分解通常用于减小模型大小。

二、创新点

1、先前的一些语义分割网络经常消耗大量资源，这不适合内存有限并且限制和降低了计算能力的边缘设备（如手机、机器人和无人机）。

2、FDDWNet结构可以达到很深，表示能力增强，分割精度提升。

3、EERM单元利用识别映射和FDDWC，在保持小模型尺寸的情况下，无梯度消失和爆炸，促进模型训练。此外，EERM的所有操作都是可微的，这表明整个FDDWNet可以端到端地训练。

4、实验表明，FDDWNet的性能在速度和准确性之间优于现有最轻的网络。FDDWNet参数本身只占用0.8M，在单个GTX 2080Ti GPU上达到60 FPS的运行速度。FDDWNet在不使用任何其他后处理的情况下，在CityScapes和CamVid数据集上分别实现了71.5%和66.9%的mIoU性能。

三、模型结构

FDDWNet的整体结构如下所示：

FDDWNET:模型参数仅为0.8M，速度和准确率综合性能在轻量级分割网络中达到SOTA_提高效率

其中EERM结构如下图（e）所示：

FDDWNET:模型参数仅为0.8M，速度和准确率综合性能在轻量级分割网络中达到SOTA_提高效率_02

针对FDDWC：

1、对输入feature map使用空洞卷积下的深度可分离卷积，执行两个独立的一维卷积运算（1xn和nx1）

2、紧接着1x1的逐点卷积

其实思路还是比较简单的，但是却降低了参数，这样就允许参数一定的情况下，可以尽量的加深网络。

四、实验结果

轻量级分割网络准确率、参数和速度对比：

FDDWNET:模型参数仅为0.8M，速度和准确率综合性能在轻量级分割网络中达到SOTA_提高效率_03

CityScapes数据集上的性能对比：

FDDWNET:模型参数仅为0.8M，速度和准确率综合性能在轻量级分割网络中达到SOTA_3d_04

实际分割效果：

FDDWNET:模型参数仅为0.8M，速度和准确率综合性能在轻量级分割网络中达到SOTA_卷积_05

上述内容，如有侵犯版权，请联系作者，会自行删文。

标签：0.8,分割,FDDWNET,FDDWNet,卷积,模型,网络,轻量级
From： https://blog.51cto.com/u_14439393/5733557

混合深度卷积，更少参数下的轻量级网络
原文链接：https://arxiv.org/pdf/1907.09595.pdf代码链接：https://github.com/tensorflow/tpu/tree/master/models/official/mnasnet/mixnet 1、主要思想和创新点Dep......
最简单搭建前端轻量级项目开发服务
本文讨论了如何搭建一个简单的前端项目开发服务，这个服务要实现以下几点：Javascript的打包压缩；scss的编译打包压缩；简单文件http服务；监测文件变化自动刷新浏览器；零......
轻量级Web框架Flask——Web表单
安装Flask-WTF及其依赖可使用pip安装pipinstallflask_wtf配置要求应用配置一个密钥。密钥是一个由随机字符构成的唯一字符串，通过加密或签名以不同的方式提升应用的......
Android平台实现mp4文件实时推送RTMP|轻量级RTSP服务|GB28181平台
好多开发者有这样的诉求，想把本地录制的MP4文件，以实时流数据的形式，推送到RTMP服务器，注入轻量级RTSP服务，或者对接到GB28181平台，这块前几年我们就有对接。本次以MediaExtractor......
golang轻量级的代码复制粘贴检查器 cpd
golang轻量级的代码复制粘贴检查器cpd项目地址:https://github.com/dengjiawen8955/copy-paste-detector快速开始clonegitclonehttps://github.com/dengjiawen895......
leangoo轻量级看板任务协作管理平台
运营和管理一家公司的最大的难点就是无法掌握和跟踪团队人员的工作内容。看板工具可以很好的解决这个问题。leangoo是由Scrum中文网研发的一款轻量化、敏捷化、数字......
EG2124A替代FD6288、PT5619，260V0.8A三相立半桥驱动芯片
1. 特性  悬浮自举电源设计，耐压可达 260V  集成三路立半桥驱动  适应 5V、3.3V 输入电压  高频率支持 500KHZ  低端 VCC 电压范围 4.5V-20V  输出电流......
轻量级工作流引擎的设计与实现
一、什么是工作流引擎工作流引擎是驱动工作流执行的一套代码。至于什么是工作流、为什么要有工作流、工作流的应用景，同学们可以看一看网上的资料，在此处不在展开。二......
分享一个便于使用且轻量级的webapi调试工具，Postman的chrome浏览器插件“Tabbed Postma
分享一个便于使用且轻量级的webapi调试工具，Postman的chrome浏览器插件“TabbedPostman-RESTClient”https://chrome.google.com/webstore/detail/tabbed-postman-rest......
0.8精喂仪
一、按键说明按键：调试（长按进入调试）、进料、下料按键功能进入调试界面时进入日志界面时： ......

FDDWNET:模型参数仅为0.8M，速度和准确率综合性能在轻量级分割网络中达到SOTA

一、主要思想

二、创新点

三、模型结构

四、实验结果

相关文章

赞助商

阅读排行