1. 任务描述:
给定输入LR深度图 和HR RGB 图像 ,引导DSR目的是在ground-truth深度图 监督的条件下,预测HR深度图
2. Network
本文提出的SGNet主要包括两部分,即梯度校准模块(GCM)和频率感知模块(FAM)。首先将RGB图像 和上采样后的LR深度图 送入到GCM,利用RGB丰富的梯度信息在梯度域中引导LR梯度信息恢复,获得增强后的深度特征 。然后,FAM迭代执行多个频谱差分模块(SDB),其融合来自GCM增强后的深度特征 ,并在频域中传播RGB频谱信息到LR频谱。最后,同时利用梯度感知损失 、频率感知损失 和空间感知损失 约束整个训练过程。
3. 频率感知模块
FAM如图3绿色区域所示,其递归的执行多个频谱差分模块SDB来不断地在频域中优化深度特征。然后将不同阶段获取到的深度特征通过残差模块和上采样模块进行融合得到 ,最后结合由bicubic插值上采样后的深度图 , 得到最终预测的HR深度图 。
本文提出的频谱差分模块(SDB)如图5所示,其首先将来自GCM模块的梯度增强特征 与深度特征 进行融合,并利用离散傅里叶变换将RGB特征和深度特征映射到频域,获得RGB特征频谱 和深度特征频谱 ,然后对获取到的频谱特征进行分解,得到幅值和相位:
接下来,SDB分别计算RGB频谱特征和深度频谱特征的幅值减法和相位减法得到 和 ,并将其送入到卷积层分别进行幅值和相位的学习。此外,原始深度特征 的幅值和相位同样被送入到单独的卷积层,以保证深度图的低频分量也能够在频域中进行学习。最后,通过离傅里叶逆变换将融合后的幅值和相位映射到空间域,从而得到频域增强后的特征 。
4. 可学习的地方
本文章的可视化效果做的非常好
大佬链接:
标签:Map,via,E9%,Network,E5%,BC%,E6%,E7%,EF% From: https://www.cnblogs.com/yyhappy/p/17986397