一、Motivation
1、目前的方法严重依赖于具有像素级对齐的精确对齐配对数据集(感觉像是说L1,不确定==)
二、Contribution
使用离散傅里叶变换(DFT)将图像特征转换到频域,在计算预测图像和参考值GT 振幅和相位的SWD(Sliced Wasserstein Distance)距离
三、Network
Loss设计感觉比较简单:
通过DFT分别将网络预测图像和参考图像GT转化为幅值和相位,分别计算幅值和相位的SWD距离。
注:M(x),M指的是网络Model
四、Expericence
(1)这个图没看懂是怎么可视化的:
(2)损失证明的时候比较了LPIPS等损失,怎么没证明与L1之间的有效性,没懂
CTX损失:
标签:Misalignment,Loss,相位,2024CVPR,SWD,图像,Transformation From: https://www.cnblogs.com/yyhappy/p/18048670