首页 > 其他分享 >【GAN的应用】基于对抗学习的图像美学增强方法

【GAN的应用】基于对抗学习的图像美学增强方法

时间：2022-10-12 15:01:36浏览次数：55

标签：PS 网络美学如下 GAN 图像所示图片

好久不见~甚是想念

由于年底了要处理的事情变得特别多，突然间醒悟好久没更新啦

于是深夜给大家带来一篇生成对抗网络在图片美学增强上的应用。

首先来个小问题，你能猜出下图的（b）（c）那一个是手动PS，哪一个是自动PS么？？

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_02

不知道大家有没有猜对，反正我是一脸懵逼，因为觉得都不错 [摊手]

如何获得堪比手动PS的自动PS效果呢？下面就具体讲讲GAN网络实现图片风格自动增强的方法。

传统的图片自动增强方法需要全监督的分别训练图片尺寸修改模型（cropping）与颜色增强（color enhancement）模型。而作者提出的EnhanceGAN只需要弱监督（一个表示美学质量的二进制标签即可），并且可以对尺寸修改与色彩增强的模型参数实现自适应调整。

相关概念

Aesthetic Quality Assessment:

基于人的审美感知区分美学上高质量与低质量的图片。一般基于data-driven的CNN网络模型。

Automatic Image Enhancement:

主要分为以下两点

Cropping and Re-targeting: 旨在寻找最能表现美学价值的区域，将照片进行裁剪等修改使之更具有美学观赏性。

Color Enhancement and Style Transfer: 通过调整画面整体颜调使美学效果更加突出。使用regression models 和 ranking models 将输入图片映射到相应的groundtruth。

网络模型结构

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_03

Preliminary

传统的GAN网络由一个生成器G和一个判别器D构成

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_04

假设pg为z~pz时G(z)的分布，当pg收敛于实际数据分布pdata时，式(1)将达到全局最优值。

文章中作者参考了[1]里面的损失函数的定义

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_05

式中fw是K-Lipschitz连续，可通过判别网络D进行逼近。

Generator Network (NetG)

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_06

与普通GAN不同的是，文中设计的EnhanceGAN可自学习图片风格增强的参数{o}。对应不同的变换系数{To}，给定输入图片I，可得到输出

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_07

其中oL和oAB分别对应光照与颜色的调整系数，ocrop对应裁剪参数。

Generator network的结构采用ResNet-101（不含最后一层全连接层），并将最后一层池化层用来保存特征映射后的空间信息。如下图a所示。

图片裁剪的目的则是获得系数ocrop=[x,y,w,h]。基于attention models [2]，cropping模型采用了一个卷积层（2048 --1），kernel size 1*1。如下图b所示。

而Top-K average pooling则是根据概率将元素聚类。如下图c所示。

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_08

Generator网络效果如下所示

【GAN的应用】基于对抗学习的图像美学增强方法_卷积_09

而颜色增强模型在CIELab color space上，对于每一个像素点m，都有如下定义

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_10

【GAN的应用】基于对抗学习的图像美学增强方法_卷积_11

其中系数oL=[a,b,p,q]和oAB=[oA,oB]=[a,b]均可有the convolution layer (2048--7)卷积层获得。

L,A,B的输入输出关系如下图所示

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_12

Generator 的损失函数LG则可有如下几种形式

Adversarial Loss:

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_13

Perceptual Loss:

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_14

Regularization Loss:

【GAN的应用】基于对抗学习的图像美学增强方法_卷积_15

Discriminator Network (NetD)

文章所设计的判别网络用于评估图片美学质量。将ResNet-101网络中最后一层分类器转变为一个2个全连接神经元的输出层。

根据式(2)可以获得LD的损失函数为

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_16

实验

作者将所设计的网络应用于CUHK-PhotoQuality Dataset (CUHK-PQ)和AVA Dataset。

1. Quantitative Evaluation

1）图片美学质量评估

【GAN的应用】基于对抗学习的图像美学增强方法_卷积_17

2）图片自动裁剪

作者定义了一个overlap ratio与Displacement Error来对裁剪效果进行评估

【GAN的应用】基于对抗学习的图像美学增强方法_卷积_18

评估结果如下两表所示

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_19

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_20

2. User Study

我们让一个专业的修图师帮我们用PS处理下100幅图片与文中所设计的EnhanceGAN处理的100幅图片进行对比，将图片发给26个评委进行打分，具体分数分布如下所示

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_21

下列是具体图片的得分分布

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_22

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_23

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_24

【GAN的应用】基于对抗学习的图像美学增强方法_卷积_25

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_26

据统计，作者提出的 EnhanceGAN 美学评价均分为5.327，专业的人工修图得分为 5.419 ，原图得分4.254 。

可以说，设计的网络在图片风格自动增强方面还是很不错的~

【GAN的应用】基于对抗学习的图像美学增强方法_损失函数_27

【GAN的应用】基于对抗学习的图像美学增强方法_网络模型_28

[1] M. Arjovsky, S. Chintala, and L. Bottou. Wasserstein gan. arXiv:1701.07875, 2017. 2, 3, 4, 5, 7

[2] K. Xu, J. Ba, R. Kiros, K. Cho, A. C. Courville, R. Salakhutdinov, R. S. Zemel, and Y. Bengio. Show, attend and tell: Neural image caption generation with visual attention. In ICML, volume 14, 2015. 4

标签：PS,网络,美学,如下,GAN,图像,所示,图片
From： https://blog.51cto.com/u_14122493/5750775

相关文章

MNA-CNN: 如何在美学质量评估中储存照片原始信息
传统基于深度学习的图片美学评估的要求输入是fixed-size，待评估的照片经常会经过裁剪、缩放和充填等变换，造成图片质量的下降。那如何可以实现对原始图片尺寸进行美学质量评估......
【计算摄影】浅析多重曝光与自动图像融合技术
大家好，这是专栏《计算摄影》的第六篇文章，这一个专栏来自于计算机科学与摄影艺术的交叉学科。作者&编......
【计算摄影】浅析图像修复背后的核心技术
大家好，这是专栏《计算摄影》的第十篇文章，这一个专栏来自于计算机科学与摄影艺术的交叉学科。作者&编......
【计算摄影】浅析图像风格迁移背后的核心技术
大家好，这是专栏《计算摄影》的第八篇文章，这一个专栏来自于计算机科学与摄影艺术的交叉学科。作者&编......
图像处理学习笔记-05-图像复原与重建2
估计退化函数图像观察估计首先观察图像的一个小矩形区域，之后处理子图像得到想要的结果，得到一个子图像的原图像估计之后通过下式：\[H_s(u,v)=\frac{G_s(u,v)}{\hat{F}_s......
【每周CV论文推荐】StyleGAN人脸属性编辑有哪些经典论文需要阅读
欢迎来到《每周CV论文推荐》。在这个专栏里，还是本着有三AI一贯的原则，专注于让大家能够系统性完成学习，所以我们推荐的文章也必定是同一主题的。当前人脸图像领域的研究和落地......
【每周CV论文推荐】基于GAN的图像数据增强有哪些经典论文值得阅读
欢迎来到《每周CV论文推荐》。在这个专栏里，还是本着有三AI一贯的原则，专注于让大家能够系统性完成学习，所以我们推荐的文章也必定是同一主题的。当前基于GAN的二维图像生成领......
AVX图像算法优化系列二: 使用AVX2指令集加速查表算法。
查表算法，无疑也是一种非常常用、有效而且快捷的算法，我们在很多算法的加速过程中都能看到他的影子，在图像处理中，尤其常用，比如我们常见的各种基于直方图的增强，可以说，在pho......
AHK调用opencv（十九）图像金字塔 – ahk_v2_beta3
图像金字塔是指一组图像且不同分辨率的子图集合，它是图像多尺度表达的一种，以多分辨率来解释图像的结构，主要用于图像的分割或压缩。一幅图像的金字塔是一系列以金字塔性质排......
AHK调用opencv（十七）图像梯度 – ahk_v2_beta3
1.Sobel和Scharr微分Sobel算子是一种联合高斯平滑加微分运算，因此对噪声的抵抗能力更强。可以指定要计算的导数的方向，垂直或水平（分别由参数、Yorder和Xorder指定）......

赞助商

阅读排行