首页 > 编程语言 >NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

时间:2023-12-07 13:23:28浏览次数:30  
标签:BiSRNet 光谱 卷积 二值 2023 ETH NeurIPS 二值化 精度

前言 本文首次探索了压缩量化在光谱压缩重建领域的应用,提出了该领域首个二值化卷积神经网络 BiSRNet,在量化指标和视觉结果上都显著地超越了当前最先进的二值化模型。

本文转载自我爱计算机视觉

仅用于学术分享,若侵权请联系删除

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

【CV技术指南】CV全栈指导班、基础入门班、论文指导班 全面上线!!

图1 BiSRNet 与当前最先进的二值网络的性能对比

目前所有的代码,预训练模型和测试结果均已开源在我们开发的一个二值化光谱压缩重建工具包 BiSCI 内,该工具包支持八类最主要的二值网络,欢迎大家来使用。同时,我们还将 BiSRNet 嵌入到了我们之前开发的光谱重建工具箱 MST 当中。目前 MST 工具包已支持超过 12 类深度学习算法,并包含各种配套的可视化函数,欢迎大家来对比。

1. 光谱压缩重建任务介绍

相比于常规的三通道 RGB 图像,高光谱图像包含几十上百个波段,从而捕获了关于成像场景更丰富的信息。也正因为这一重要特性,高光谱图像被广泛地应用于医疗,地形勘探,农业等领域。如图2所示,在医院进行检查时,如果只看常规的RGB图像可能很难诊断病因,但是如果采用高光谱图像捕获并在特定波长下渲染的话,就可以看清楚各类血管,骨骼结构等,从而辅助医生诊断。同样的原理也可应用在遥感地形勘探和农业病虫害检测。

图2 高光谱图像的应用

然而高光谱图像并容易获取,传统的成像设备采用光谱仪对成像场景进行逐波段的扫描,费时费力,难以捕捉运动场景。近些年,科学家们专门设计了单曝光压缩成像(Snapshot Compressive Imaging,SCI)系统来解决这一问题。其光路结构如图3所示。该系统首先通过一个编码孔径掩膜对成像场景的各光谱通道进行调制,然后通过一个三棱镜进行色散后在相机上捕获到一个二维的快照估计图(compressive measurement)。通过这个光路系统,我们便可将三维的光谱立方块压缩成一个二维的图像。而光谱压缩重建的任务便是从这个二维的压缩估计图上恢复出三维的高光谱数据。

图3 单曝光压缩成像系统

当前的主流方法是采用的是全精度模型如 CNN 或者 Transformer 来学一个从压缩估计图到三维光谱立方块的映射。几个比较经典算法有我们之前的工作 MST,MST++,CST,DAUHST,HDNet 等(这些方法全部都开源在我们的工具箱 MST 当中)。这类方法虽然取得了很好的重建效果,但却难以部署到移动端设备(如智能手机、相机、无人机等)上,因为移动端设备的内存空间,计算资源和电力均有限,无法运转全精度模型。另一方面,全精度模型的一些计算单元如深度展开算子和多头自注意力机制等相对复杂,移动端设备无法支持。为了推动光谱重建算法的实际应用,本文做了如下贡献:

  • (1)提出了光谱压缩重建领域内首个基于二值神经网络(Binarized Neural Network,BNN)的算法 — 二值化光谱重分布网络(Binarized Spectral-Redistribution Network,BiSRNet)。
  • (2)设计了一个新的二值化卷积单元 — 二值化光谱重分布卷积(Binarized Spectral-Redistribution Convolution,BiSR-Conv)。该卷积单元可以调整光谱表征的强度和分布,同时在反向传播中更好地逼近二值化符号(Sign)函数,从而让求得的梯度更加准确。
  • (3)制作了四个二值化卷积模块来解决特征图形变过程中的维度不匹配问题,从而让全精度信息能流通整个模型的每一层卷积单元以弥补二值卷积造成的信息损失。
  • (4)我们的 BiSRNet 显著地超越了当前最先进的二值化算法,甚至取得了能与全精度CNN比肩的效果,然而我们的BiSRNet算法却只需要极低的存储空间(约 0.06 %)和计算代价(约 1 %)。

2. 本文方法

2.1 基础模型

一般来说,用于二值化的全精度模型应该是比较轻量的且它的计算单元可以再移动端设备上运行。然而,现存的CNN 或 Transformer 模型均不满足这一要求。为此,我们重新设计了一个简单,轻量,易于部署的基础模型(Base Model)。

受到之前工作 MST,MST++,CST,DAUHST 的启发,我们设计的基础模型也采用一个 U 形结构,如图4所示。

图4 基础模型的网络结构

在这个基础模型中,采用的所有计算单元都可以被移动端设备支持,同时也不涉及计算复杂度高的操作。

2.2 二值化光谱重分布卷积单元

二值化光谱重分布卷积的细节如图 4(c)所示。将输入的全精度激活信号记为 。我们注意到,受到特定成像波长的限制,高光谱信号沿着光谱维度有着不同的强度与分布。为了适应光谱图像的这一特性,我们提议在二值化激活之前,按通道对高光谱图像表示进行重分布:

其中的 表示重分布后的激活。 和 表示可学习参数。然后 经过一个符号函数后被量化到1位的激活 :

如图 5 (b) 和 (c) 所示,由于符号函数是不可导的,之前的方法大都采用一个分段线性函数 Clip(x) 或者二次函数 Quad(x) 来在反向传播中拟合符号函数。

图 5 符号函数与各类逼近函数的对比图

Clip(x) 与 Quad(x) 的具体表达式如下:

然而分段线性函数知识一个粗略的估计,它与符号函数之间依旧有着很大的误差。图 5 中的阴影部分面积就表示这个误差的大小,Clip(x) 的误差是1。此外,一旦激活或者权重的值落在了 [-1, 1] 之外,他们就不会再被更新。尽管分段二次函数是一个更精确的逼近(误差为2/3),上述的两个问题依旧存在。为此,我们设计了一个可缩放的双曲正切函数来在反向传播中拟合符号函数:

我们仿照之前的二值化算法,然后我们可以得到:

我们计算图 5 (d) 中的阴影面积:

在二值化卷积层当中,32位的权重也被二值化到一位的权重:

由此,计算繁重的全精度卷积操作便可由纯逻辑异或非运算(XNOR)与位计数(bit-count)操作替换如下:

因为全精度信息的取值范围与二值卷积的输出差别较大,直接引入残差连接将两者相加容易导致信息被淹没掉,所以先采用一个 RPReLU 激活函数来重塑取值范围:

然后再引入残差链接:

通过我们的设计,全精度信息流就不会被二值卷积给阻断,从而能够顺畅地流过我们设计的 BiSR-Conv 单元,如图 4 (c) 中的红色箭头所示。

图6 本文卷积二值卷积块与普通二值卷积块在处理特征图维度变化时的对比

全精度信息流在二值化算法中非常重要,因为它在一定程度上弥补了量化导致的信息损失。然而在特征图的上下采样过程中,由于维度发生了变化,难以直接引入残差链接以补充全精度信息,如图 6 中每个子图的左半部分所示。蓝色箭头表示二值信号,红色箭头表示全精度信息流。普通的二值卷积模块会在特征度维度改变的同时阻断全精度信息流的传递。然而我们的二值卷积模块通过采用分割合并的技巧,让全精度信息流不被阻断,从而在整个二值模型中流通。

3. 实验结果

3.1 量化指标

表1 BiSRNet 与 SOTA BNN,传统方法,全精度CNN方法的量化指标对比

表 1 展示了我们的 BiSRNet 与 SOTA BNN,传统方法,全精度 CNN 方法的量化指标对比。可以看到,我们的 BiSRNet 显著超越了当前最先进的 BNN 算法 BTM 2.55 dB。同时超越了所有的 64 位传统算法,增幅超过了 4.49 dB。值得注意的是,我们的 BiSRNet 取得了能与全精度 CNN 方法比肩的性能,比如超过了 1.23 dB,然而却只占用了 0.06 % 的存储空间和 1 % 计算代价。

3.2 视觉对比

图7 BiSRNet 与其他 BNN 方法在仿真数据及上的视觉对比

图8 BiSRNet 与其他 BNN 方法在真实数据集上的视觉对比

4. 总结

代码,预训练权重,重建结果均开源在:

这一系列关于光谱压缩重建的工作均开源在下面两个工具箱当中,欢迎使用~

 

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

其它文章

分享一个CV知识库,上千篇文章、专栏,CV所有资料都在这了

明年毕业,还不知道怎么做毕设的请抓紧机会了

LSKA注意力 | 重新思考和设计大卷积核注意力,性能优于ConvNeXt、SWin、RepLKNet以及VAN

CVPR 2023 | TinyMIM:微软亚洲研究院用知识蒸馏改进小型ViT

ICCV2023|涨点神器!目标检测蒸馏学习新方法,浙大、海康威视等提出

ICCV 2023 Oral | 突破性图像融合与分割研究:全时多模态基准与多交互特征学习

听我说,Transformer它就是个支持向量机

HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法

南科大提出ORCTrack | 解决DeepSORT等跟踪方法的遮挡问题,即插即用真的很香

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

SAM-Med2D:打破自然图像与医学图像的领域鸿沟,医疗版 SAM 开源了!

GhostSR|针对图像超分的特征冗余,华为诺亚&北大联合提出GhostSR

Meta推出像素级动作追踪模型,简易版在线可玩 | GitHub 1.4K星

CSUNet | 完美缝合Transformer和CNN,性能达到UNet家族的巅峰!

AI最全资料汇总 | 基础入门、技术前沿、工业应用、部署框架、实战教程学习

计算机视觉入门1v3辅导班

计算机视觉交流群

标签:BiSRNet,光谱,卷积,二值,2023,ETH,NeurIPS,二值化,精度
From: https://www.cnblogs.com/wxkang/p/17881790.html

相关文章

  • CTT2023 游记
    Day?来THU上预科,报了五门课,预科真的很好玩!代价是除CF和互测外没训OI,但两者都打的稀烂,博客也停更了。好像对前三十没什么执念了(真的吗?)。在某天发了一篇鲜花,但是不会提供检索方式。Day0到苏州啦,酒店好像非常高级!室友是CJzyf,很好的人!随机组合了一堆人进行聚餐活动,游走......
  • 2023 Dec. 3rd
    应该在12.3发布的,但是鸽了noip结束之后,就投入了紧张有趣的文化课学习中。周一(11.20)正式回归的班级,但是对于补课相关事宜,一直没有通知,所以就跟着班里上了一天课,还是很魔幻的。语文英语没什么所谓;数学开的新课,对数,只讲了基本概念,早会了;物理完全听不懂;化学听个半懂。剩下的文科?......
  • 2023-2024-1 20231414 《计算机基础与程序设计》第十一周学习总结
    学期(2023-2024-1)学号(20231414)《计算机基础与程序设计》第十一周学习总结作业信息这个作业属于哪个课程<班级的链接>(2023-2024-1-计算机基础与程序设计)这个作业要求在哪里<作业要求的链接>(2023-2024-1计算机基础与程序设计第十一周作业)这个作业的目标<写上具体......
  • 试题三:(2023年软件设计师原题)
    软件需求与分析课堂测试09 –面向对象建模分析 班级:           学号:            姓名:-------------------------------------------------------------------------------------试题三:(2023年软件设计师原题)某高校图书馆购买了若干学术资源的镜像数......
  • 2023年5个自动化EDA库推荐
    EDA或探索性数据分析是一项耗时的工作,但是由于EDA是不可避免的,所以Python出现了很多自动化库来减少执行分析所需的时间。EDA的主要目标不是制作花哨的图形或创建彩色的图形,而是获得对数据集的理解,并获得对变量之间的分布和相关性的初步见解。我们在以前也介绍过EDA自动化的库,但是......
  • 2023年全国计算机技术与软件专业资格(水平)考试成绩可以查询了
    2023年全国计算机技术与软件专业资格(水平)考试成绩可以查询了查询网址:https://bm.ruankao.org.cn/分数线据说是相对固定的,卷面分的60%算,也就是45分达标,50+43分的我已哭晕在厕所。......
  • 【2023-12-06】接受就好
    20:00没有一天不写一点,每天写作、读书、工作与练习,坚持不懈的精神将使我有一场好的收获。                                                 ——梵高近期,何太加班挺多......
  • 2023最新初级难度前端面试题,包含答案。刷题必备!记录一下。
    好记性不如烂笔头内容来自面试宝典-初级难度前端面试题合集问:请详细描述HTML、CSS、JavaScript的基本结构?HTML、CSS、JavaScript是web前端开发中最常用的三种技术,它们分别负责页面结构、表现形式和交互行为。HTML(HyperTextMarkupLanguage)是一种用于构建网页的标......
  • 建投数据荣获2023信创“大比武”优秀技术应用奖
    近日,2023信创“大比武”金融业务创新应用赛道(简称金融赛道)落下帷幕,经过选手报名-资格初审-选拔阶段-总决赛等赛程,建投数据最终获得“优秀技术应用奖”。这是对建投数据在信息技术应用创新领域技术攻关、方案创新、业务场景应用以及产品的高可控、高性能、高安全等优势的全面肯定。......
  • 2023-2024 20232319《网络空间安全导论》第5周学习总结
    思维导图内容安全基础信息内容安全概述1.全球数据爆炸式发展->不良信息泛滥,带来恶劣影响->对于网络信息内容安全的关注->信息内容安全2.信息内容安全:是利用计算机从包含海量信息并且迅速变化的网络中对特定安全主题相关信息进行自动获取,识别和分析的技术。3.兼具学术......