GAN无疑是这几年深度学习领域里最酷的技术,不管是理论的研究,还是GAN在图像生成,图像翻译,语音图像等基础领域的应用,都非常的丰富。我们公众号输出过非常多的GAN相关资源,本次做一个简单汇总,并重点介绍其中的各类GAN模型解读的专题。
内容包括生成模型基础,自编码器与变分自编码器,生成对抗网络基础,GAN优化目标设计与改进,数据生成GAN结构与应用,图像翻译GAN结构与应用,GAN的评估,DCGAN模型的原理与结构,项目的解读,训练与测试……
另一方面有三的亲师弟小米粥同学,在我们公众号开设过专栏《GAN的优化》。
本专栏及其后续内容有超过15篇文章,从生成模型出发,讲述了GAN的基本理论,包括工作原理,更具有普适性的f散度度量和Wasserstein距离,以及IPM框架;接着介绍了GAN训练困难的原因以及几个训练技巧,各种GAN的正则项的优劣;GAN中的模式崩溃问题以及几个比较好的解决方案。
为了让大家能够从理论和实践同时掌握好GAN模型,我们公众号也开设过《百战GAN》的实战专栏。
本专栏挑选经典GAN模型进行原理讲解,代码剖析,完成模型训练与测试,已有的内容包括图像生成,图像分割,图像增强,图像风格化,图像超分辨等领域,欢迎大家进行投稿。
以上,就是咱们公众号里的内容,从视频到文本,非常的丰富。但在我们知识星球中,还有着更加丰富的内容,那里才是我们社区中GAN的真正宝库,下面且听介绍!
知识星球GAN专栏
有三AI知识星球是我们公众号内容的升级,包含更多更新技术的解读,其中关于星球的介绍,大家可以看看去年的一篇文章,如下。
知识星球中一个非常重要的模块就是GAN,内有超过100期经典GAN模型的解读,下面是其中一些重要模块的归类预览。
星球里的学习方式为提供论文下载+论文解读,如下:
细分到各个方向,包括图像与语音生成GAN,图像分割与目标检测GAN,图像编辑与创作GAN,图像翻译/风格化GAN,图像增强GAN,人脸与人体GAN,以及其他各领域未明确归类的GAN。
(1) 图像与语音生成GAN。
内容覆盖基本的GAN模型(从DCGAN到SAGAN),条件GAN(CGAN等),多尺度GAN模型(从LAPGAN到StyleGAN),与VAE的结合(ALI等),图像增强与仿真GAN(从BAGAN到SimGAN),多判别器与生成器GAN(从TripleGAN到MAD-GAN),三维GAN(VON)等,视频GAN(从MocoGAN到MDGAN等)。
(2) 图像翻译/风格化GAN。
内容包括有监督的图像翻译GAN(从Pix2pix到Pix2pixHD)与无监督的图像翻译GAN。其中无监督的图像翻译GAN是重点,介绍各类基本模型(UNIT,CycleGAN等),多域拓展(从MUNIT到StarGAN),以及各类应用(Whitebox GAN等)。
(3) 图像增强GAN。
内容包括GAN在各类图像增强任务中的应用,包括图像降噪(GCBD等),对比度增强(EnhanceGAN等),超分辨(从SRGAN到Cycle in Cycle GAN),图像修复(从CE到ARGAN等),图像去模糊(从DeblurGAN到DBGAN等)。
(4) 人脸人体GAN。
内容包括GAN在人脸人体生成与编辑中的各类应用,包括人脸风格化(UGATIT等),人脸妆造(BeautyGAN等),年龄编辑(CAAE等),表情编辑(G2GAN等),姿态编辑(FFGAN等),关键点检测(Boundary-aware GAN等),人脸补全(Face De-occusion GAN等),人脸识别(Dual Agent GAN等),人脸超分辨(Pulse等),人脸修复(Old Photo Restore GAN等),人脸驱动(ReenactGAN等),通用人脸属性编辑(StyleGAN及其变种),姿态迁移(Everybody Dance GAN等),人脸换装(VITON等)。
(5) 图像分割与目标检测GAN。
内容包括GAN在图像分割与目标检测等经典任务中的应用,包括分割GAN(从SegGAN到Background Matting),检测GAN(从FindFaceTinyGAN到Perceptual GAN)。