首页 > 其他分享 >AI图像放大工具,图片放大无所不能

AI图像放大工具,图片放大无所不能

时间:2024-09-03 16:25:23浏览次数:12  
标签:AI 使用 ESRGAN 图像 放大器 无所不能 放大

AI图像放大工具,如ESRGAN,对于提高由Stable Diffusion生成的AI图像质量至关重要。它们被广泛使用,以至于许多Stable Diffusion的图形用户界面(GUI)都内置了支持。

在这里,我们将学习什么是图像放大器,它们如何工作,以及如何使用它们。

为什么我们需要图像放大器?

Stable Diffusion v1的默认图像大小是512×512像素按照今天的标准来看,这相当低。以iPhone 12为例。它的相机可以产生1200万像素的图像——即4032×3024像素。它的屏幕显示2532×1170像素,所以一个没有被放大的Stable Diffusion的质量是比较差的,不适合在现代的应用中使用。

另外,如果图片的分辨率太低的话,图片就缺少很多细节,使用起来也有诸多不便。

为什么我们不能使用传统的放大器?

传统放大器当然可以使用,但结果不会那么好。

用于调整图像大小的传统算法,如最近邻插值和Lanczos插值,因为仅使用图像的像素值而受到批评。它们通过仅使用图像的像素值执行数学运算来扩大画布并填充新的像素。然而,如果图像本身有损坏或扭曲,这些算法就无法准确填充缺失的信息。

AI放大器是如何工作的?

AI放大器是使用大量数据训练的神经网络模型。它们可以在放大图像的同时填充细节。

在训练过程中,图像被人为地损坏以模拟现实世界的退化。然后训练AI放大器模型以恢复原始图像。

大量的先验知识被嵌入到模型中。它可以填充缺失的信息。这就像人类不需要详细研究一个人的面孔就能记住它一样。我们主要关注几个关键特征。

如何使用AI放大器?

让我们来了解如何在AUTOMATIC1111 WebUI for Stable Diffusion中使用AI放大器。

转到Extras页面,并选择Single Image

上传你想要放大的图像到source

设置Resize因子。许多AI放大器可以原生地将图像放大4倍。所以4是一个很好的选择。如果你不希望图像那么大,可以将其设置为较低的值,比如2。

如果你的图像是512×512像素,2倍放大是1024×1024像素,4倍放大是2048×2048像素。

选择R-ESRGAN 4x+,这是一个适用于大多数图像的AI放大器。

Generate开始放大。

完成后,放大后的图像将出现在右侧的输出窗口中。右键单击图像以保存。

image-20240702223759941

可以看到页面上还有一个upscaler 2的选项,这意味着你可以把两个放大器混合使用。

后面的Upscaler 2 visibility是用来控制使用upscaler 2模型进行放大的比例。

0表示完全不是用,1表示只使用upscaler 2。

AI放大器选项

让我们来了解一些值得注意的AI放大器选项。

LDSR

Latent Diffusion Super Resolution (LDSR)放大器最初与Stable Diffusion 1.4一起发布。它是一个训练用于执行放大任务的潜在扩散模型。尽管它提供了卓越的质量,但它非常慢。我不建议使用它。

ESRGAN 4x

Enhanced Super-Resolution Generative Adversarial Networks (ESRGAN)是一个放大网络,赢得了2018年感知图像恢复和操作挑战赛。它是之前SRGAN模型的增强版。它倾向于保留细节并产生清晰锐利的图像。ESRGAN是许多其他放大器的基础模型。

R-ESRGAN 4x

Real-ESRGAN (R-ESRGAN)是对ESRGAN的增强,可以恢复各种现实世界的图像。它模拟了从相机镜头和数字压缩的各种扭曲程度。

与ESRGAN相比,它倾向于产生更平滑的图像。

R-ESRGAN在处理现实照片图像时表现最佳。

安装新的放大器

要在AUTOMATIC1111 GUI中安装新的放大器,只需要从放大模型数据库下载一个模型并将其放入文件夹中。

stable-diffusion-webui/models/ESRGAN

重新启动GUI。你的放大器现在应该可以在放大器下拉菜单中选择。

放大图像的例子

使用AUTOMATIC1111中的Extras只是一个非常简单的图片放大的例子。

如果你想是用放大的同时来进行一些细节增强,那么我们可以考虑使用SD Upscale来进行这种复杂案例的修改。

SD Upscale是AUTOMATIC1111附带的一个脚本,它使用放大器进行放大,然后使用图像到图像来增强细节。

下面具体的使用步骤:

第1步。 导航到Img2img页面。

第2步。 将图像上传到img2img画布上。(或者,使用Send to Img2img按钮将图像发送到img2img画布)

第3步。 在底部的Script下拉菜单中,选择SD Upscale

第4步。Scale factor设置为4以放大到原始大小的4倍。

第5步。 将去噪强度设置在0.1和0.3之间。越高,图像变化越大。

第6步。sampling steps的数量设置为100。更高的步骤可以改善细节。

第7步。 你可以使用原始提示和负面提示。如果没有,使用“highly detailed”作为提示。

第8步。Generate

image-20240702230413261

再来看下对比效果:

image-20240702231025766

效果不错,还增加了一些细节效果。

SD Upscale脚本有助于改善细节并减少放大伪影。

txt2img页面上的Hires Fix

还有一种图像放大的方式就是在txt2img中的Hires Fix。

你可以在txt2img页面上选择放大每个生成的图像。为此,你只需要勾选Hires fix

勾选框下将出现额外的选项。这些选项类似于使用SD Upscale脚本。

整个Hires. fix过程你可以理解为我们在图像进行放大后,再基于该图像进行了二次生成。

这个Hires steps就是我们二次生成时的步数,如果数值保持为0,就代表和原有图像生成时的步数相同。

image-20240702231920492

Hires fix会在你生成图片的同时放大所有生成的图片。

所以它会减慢图像的生成速度。

建议的做法先生成图片,然后把挑选好的图片发到img2img进行SD放大。

ControlNet Tile Upscale

上面的SD Upscale还可以跟ControlNet Tile一起使用,从而达到在放大的过程中得到更好的细节。

具体而言,就是在img2img中开启controlNet:

image-20240702233140548

Control type选择Tile。

preprocessor选择tile_resample。

Model选择control_***tile。

同时开启SD Upscale,点击生成即可。

可能会耗时比较久,但是效果应该是最好的。

点我查看更多精彩内容:www.flydean.com

标签:AI,使用,ESRGAN,图像,放大器,无所不能,放大
From: https://www.cnblogs.com/flydean/p/18394859

相关文章

  • 2024年利用AI提升视频质量的十大方法
    AI驱动的工具可以显著提升视频质量,使其对于内容创作者、电影制作人以及任何希望提升视频内容的人来说都不可或缺。以下是2024年使用AI提高视频质量的十大方法:1.AI超分辨率AI超分辨率已经成为提升视频分辨率的强大工具。通过利用深度学习算法,如TopazVideoAI和Vid......
  • Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Det
    AbstractInthispaper,wepresentanopen-setobjectdetector,calledGroundingDINO,bymarryingTransformer-baseddetectorDINOwithgroundedpre-training,whichcandetectarbitraryobjectswithhumaninputssuchascategorynamesorreferringexpre......
  • 不懂AI和Data Cloud,未来会被Salesforce行业淘汰?
    在如今的数字化时代,Salesforce的DataCloud不仅是一次普通的技术升级,更是企业发展的一张新王牌。通过将AI技术深度融合到DataCloud中Salesforce帮助企业更快、更聪明地处理数据,从而在瞬息万变的市场中占得先机。01实时数据与AI:企业成功的关键随着客户需求不断提升,企业必须加......
  • 亚马逊上最受欢迎的AI小工具
    随着人工智能(AI)席卷全球,AI操作的小工具成为体验这场革命的最直接方式之一。无论是为了让家更智能、提高工作效率,还是仅仅为了享受一些酷炫的科技,亚马逊上有多种多样的AI小工具,以满足不同的需求和偏好。以下是一些您可以加入购物车的热门AI小工具。其中一些包括:1.亚马逊Echo......
  • Adobe Illustrator (AI)2024完整版WIN/MAC中文软件免费下载安装和快捷键的使用
    目录一、软件概述1.1定义与用途1.2矢量与位图的区别1.3主要功能特点二、安装步骤2.1准备工作2.2安装过程2.3安装后设置三、常用快捷键3.1文件与视图3.2选择与编辑3.3绘图与变换一、软件概述1.1定义与用途AdobeAI是一款由AdobeSystems开发的专业......
  • AI写作新体验:芝士AI,让每个字都充满智慧!
    在很多人还不会用或者想不到用AI的时候,居然有人成功地打破了信息壁垒,开始尝试用AI解决问题,因为AI可以用来生成论文大纲、润色美化论文、阅读查找参考文献……目前市面上AI写作工具可谓是百花齐放,但良莠不齐,真正专业的论文写作工具其实并不多。下面给大家推荐一个不错的写论文......
  • 芝士AI(paperzz)一天搞定!论文降重神话,75%到3%的秘密!
    在快节奏的现代生活中,写作往往伴随着挑战:时间的紧迫、灵感的枯竭、质量的要求……如何在这样的环境中,保持写作的质量和效率?今天,让我们揭开芝士AI(paperzz)的神秘面纱,探索这款智能写作工具如何帮助我们克服写作难题,激发无限创意。芝士AI(paperzz)论文写作是一款专业满足你的论文写......
  • 芝士AI(paperzz)|论文写作必备指南,一文讲清楚,大学生进!
      众多资深研究人士达成一致的看法是,论文的最艰难一步往往在于启动这个过程。许多学子常常发现自己在精神上并未做好准备来面对这个挑战,因为大多数培训侧重于研究方法和进行实际研究,而很少涉及如何娴熟地书写论文这一方面。这种心理准备上的不足可能成为阻碍他们迈出第一步......
  • wait、notify、notifyAll 方法的使用注意事项?
    Java全能学习+面试指南:https://javaxiaobear.cn我们主要学习wait/notify/notifyAll 方法的使用注意事项。我们主要从三个问题入手:为什么wait 方法必须在synchronized 保护的同步代码中使用?为什么wait/notify/notifyAll被定义在Object类中,而sleep定义在Thread类中?wait......
  • Air780EP——硬件设计02
    Air780EP是一款基于移芯EC718P平台设计的LTECat1无线通信模组。支持FDD-LTE/TDD-LTE的4G远距离无线传输技术。另外,模组提供了USB/UART/I2C等通用接口满足IoT行业的各种应用诉求。本文将主要介绍Air780EP的应用接口,射频接口,电气特性,结构规格等内容。二、应用接口2.6USB接口Air780......