TecoGAN视频超分辨率算法

时间：2024-01-08 15:38:51浏览次数：28

1. 摘要

对抗训练在单图像超分辨率任务中非常成功，因为它可以获得逼真、高度细致的输出结果。因此，当前最优的视频超分辨率方法仍然支持较简单的范数（如 L2）作为对抗损失函数。直接向量范数作损失函数求平均的本质可以轻松带来时间流畅度和连贯度，但生成图像缺乏空间细节。该研究提出了一种用于视频超分辨率的对抗训练方法，可以使分辨率具备时间连贯度，同时不会损失空间细节。

该研究聚焦于新型损失的形成，并基于已构建的生成器框架展示了其性能。研究者证明时间对抗学习是获得照片级真实度和时间连贯细节的关键。除了时空判别器以外，研究者还提出新型损失函数 Ping-Pong，该函数可以有效移除循环网络中的时间伪影，且不会降低视觉质量。之前的研究并未解决量化视频超分辨率任务中时间连贯度的问题。该研究提出了一组指标来评估准确率和随时间变化的视觉质量。用户调研结果与这些指标判断的结果一致。总之，该方法优于之前的研究，它能够得到更加细节化的图像，同时时间变化更加自然。

2. 模型方法

该研究提出的 VSR 架构包含三个组件：循环生成器、流估计网络和时空判别器。生成器 G 基于低分辨率输入循环地生成高分辨率视频帧。流估计网络 F 学习帧与帧之间的动态补偿，以帮助生成器和时空判别器 $TecoGAN视频超分辨率算法_人工智能$ 。
训练过程中，生成器和流估计器一起训练，以欺骗时空判别器 $TecoGAN视频超分辨率算法_人工智能$ 。该判别器是核心组件，因为它既考虑空间因素又考虑时间因素，并对存在不现实的时间不连贯性的结果进行惩罚。这样，就需要 G 来生成与之前帧连续的高频细节。训练完成后， $TecoGAN视频超分辨率算法_人工智能$

TecoGAN视频超分辨率算法_人工智能_04

TecoGAN视频超分辨率算法_计算机视觉_05

图 2：具备动态补偿（motion compensation）的循环生成器。

该研究提出的判别器结构如图 3 所示。它接收了两组输入：真值和生成结果。

TecoGAN视频超分辨率算法_人工智能_06

图 3：时空判别器的输入。

3. 损失函数

为了移除不想要的细节长期漂移，研究者提出一种新型损失函数「Ping-Pong」(PP) 损失。

TecoGAN视频超分辨率算法_超分辨率_07

图 4：a）不使用 PP 损失训练出的结果。b）使用 PP 损失训练出的结果。后者成功移除了漂移伪影（drifting artifact）。

如图 4b 所示，PP 损失成功移除了漂移伪影，同时保留了适当的高频细节。此外，这种损失结构可以有效增加训练数据集的规模，是一种有用的数据增强方式。

该研究使用具备 ping-pong ordering 的扩展序列来训练网络，如图 5 所示。即最终附加了逆转版本，该版本将两个「leg」的生成输出保持一致。PP 损失的公式如下所示：

TecoGAN视频超分辨率算法_超分辨率_08

TecoGAN视频超分辨率算法_图像处理_09

图 5：使用该研究提出的 Ping-Pong 损失， $TecoGAN视频超分辨率算法_图像处理_10$ 和之间的 $TecoGAN视频超分辨率算法_人工智能_11$

4. 实验结果

研究者通过控制变量研究说明了 $TecoGAN视频超分辨率算法_超分辨率_12$ 中单个损失项的效果。

TecoGAN视频超分辨率算法_人工智能_13

图 6：树叶场景对比。对抗模型（ENet、DsOnly、DsDt、DsDtPP、TecoGAN)。

标签：PP,判别,训练,分辨率,生成器,损失,算法,TecoGAN
From： https://blog.51cto.com/u_15457455/9145358

【C++】STL 算法 ② ( foreach 循环中传入函数对象 / Lambda 表达式处理元素 | forea
文章目录一、foreach循环中传入函数对象/Lambda表达式处理元素1、foreach循环算法2、foreach循环中传入函数对象处理元素3、foreach循环中传入Lambda表达式处理元素4、Lambda表达式-匿名函数对象/仿函数一、foreach循环中传入函数对象/Lambda表达式处理......
估计量评价与分类算法的对比
1.背景介绍随着数据量的增加，人工智能和机器学习技术在各个领域的应用也不断扩大。估计量和分类算法是这些领域中最常见的技术之一。在这篇文章中，我们将讨论这两种算法的基本概念、原理、应用和优缺点，以及它们之间的区别和联系。估计量（Estimation）和分类（Classification）算法都是用于解......
深度学习的算法：从自动编码器到生成对抗网络
1.背景介绍深度学习是一种人工智能技术，它旨在模拟人类大脑中的神经网络，以解决复杂的问题。深度学习的算法通常包括自动编码器、生成对抗网络和其他算法。这篇文章将详细介绍这两种算法的原理、数学模型和实例代码。1.1深度学习的历史和发展深度学习的历史可以追溯到1940年代的人工......
神经进化算法在社交网络领域的优化与创新
1.背景介绍社交网络已经成为了现代人们生活中不可或缺的一部分，它们为我们提供了一种快捷、高效的沟通和交流方式。然而，随着社交网络的不断发展和扩张，它们也面临着各种挑战，如信息过载、网络滥用、虚假账户等。因此，在社交网络领域，优化和创新变得至关重要。神经进化算法（NEA）是一种基于......
什么是降维算法
在机器学习中，随着数据特征的增加，需要更大的计算资源来训练模型。这可能导致模型的训练时间和内存消耗增加，甚至可能导致模型无法训练或训练结果不准确。为此，降维算法成为机器学习领域中的一种重要技术，它可以将高维空间中的数据点映射到低维空间中。降维算法可以帮助我们发现数据中的......
【教3妹学编程-算法题】对角线最长的矩形的面积
3妹：好冷啊，冻得瑟瑟发抖啦2哥 :这才哪跟哪，上海这几天温度算是高的啦。你看看哈尔滨，那才是冰城。3妹：据说沈阳千名“搓澡大姨”支援哈尔滨？哈哈哈哈2哥 :就像今年的淄博烧烤，可能有炒作的成分3妹：不不，是去年的了，今年已经24年啦。2哥，你说哈尔滨的面积是多少，这么多人涌入哈尔滨，能住的......
文心一言 VS 讯飞星火 VS chatgpt （174）-- 算法导论13.3 3题
三、用go语言，假设图13-5和图13-6中子α、β、γ、δ和ε的黑高都是k。给每张图中的每个结点标上黑高，以验证图中所示的转换能保持性质5。文心一言：在Go语言中，你可以通过以下步骤来为图13-5和图13-6中的每个节点分配黑高，以验证性质5。首先，我们需要定义一个结构体来表示图中的节点，然......
人工智能时代的大模型算法
文心大模型4.0是百度最新推出的一代知识增强大语言模型，它是基于深度学习技术构建的，通过与海量数据结合，能够为人工智能应用提供强大的算法支持。本文将详细介绍文心大模型4.0的核心技术、应用场景和优势，以及如何使用它来提高人工智能应用的性能。一、文心大模型4.0的核心技术文心大......
【教3妹学编程-算法题】赎金信
3妹：“太阳当空照，花儿对我笑，小鸟说早早早，你为什么背上炸药包”2哥 :3妹，什么事呀这么开森。3妹：2哥你看今天的天气多好啊，最近一周都是大晴天，艳阳高照2哥：是啊，天气不冷不热的，很适合生活3妹：据说南方的小土豆都跑到北方滑雪了，哈哈哈哈2哥：泼水成冰好玩是好玩，但是一定要注意防寒哦，看新闻都......
美食物管理与推荐系统Python+Django网站开发+协同过滤推荐算法应用【计算机课设项目推
一、介绍美食管理与推荐系统。本系统使用Python作为主要开发语言开发的一个美食管理推荐网站平台。网站前端界面采用HTML、CSS、BootStrap等技术搭建界面。后端采用Django框架处理用户的逻辑请求，并将用户的相关行为数据保存在数据库中。通过Ajax技术实现前后端的数据通信。创新点......

TecoGAN视频超分辨率算法

1. 摘要

2. 模型方法

3. 损失函数

4. 实验结果

相关文章

赞助商

阅读排行