首页 > 其他分享 >ComfyUI基础篇:为什么要学 ComfyUI?

ComfyUI基础篇:为什么要学 ComfyUI?

时间:2024-07-04 10:19:55浏览次数:21  
标签:为什么 要学 AI ComfyUI 学习 产品 Midjourney SD

前言:

   在AI生成图像领域,有许多产品,例如 Midjourney 和 Stability AI 等。为什么要学习 ComfyUI 呢?我斗胆带大家一起分析一下。

目录

   1.Midjourney VS Stable Diffusion

   2.SD Web UI VS ComfyUI

   3.总结

Midjourney VS Stable Diffusion

   在回答这个问题之前,我觉得有必要介绍下目前市面上的各种 AI 生图产品,或者是 AI 生视频产品。在我的眼里,他们主要分成两大类:

   模型与产品整合的产品,比如 Midjourney,Stability AI 等等。
   模型与产品分离的产品,比如 SD Web UI、ComfyUI 等等。

这两类产品的优劣势对比如下:

不难发现,这两类产品没有哪类产品拥有绝对的优势。选择哪款产品,完全取决于你的需求。

如果你只是当成娱乐,想要时不时制作一些图片或视频,那么,我推荐你选择整合产品。 因为它的学习成本低,你可以很快地学会如何使用,而且它的产品功能也比较完善,你可以很快地制作出一些图片或视频。
但如果你是设计师,或者你想靠 AI 这个新的技术赚钱,那么,我推荐你选择分离产品。 为什么呢?我觉得很多人选择学习何种软件时,很容易忽略两个原因。
第一个原因是迁移成本:

   如果我们选择学习第一种融合产品,那就意味着我们在学习软件的同时,还会跟模型绑定。拿 Midjourney 为例,学习 Midjourney 的时候,你不仅要学习软件如何使用,同时要学习如何更好地使用模型,即如何写好prompt。同时,它的产品功能也跟模型融合得比较深,有些功能是它这个模型特有的,当你学会后,你就只能在Midjourney上使用,而不能在其他产品上使用。

   这将导致出现非常高的学习迁移成本。当你想要更换产品的时候,你需要重新学习新产品的使用方法,同时还需要重新学习与模型相关的知识。

   如果这个行业发展的速度比较慢的话,这个成本还可以接受(因为你有足够的时间去学习)。但是,现在 AI 行业发展非常快,每个月都会有新的产品,亦或者新的模型出现。你很难有时间去学习每一个产品。举个实际的例子,如果你选择学习融合产品,意味着:

   当你看到 AI 能通过输入文字的方式生成图片,你可能会去学习 Midjourney,Stability AI,甚至 Adobe 的 AI 产品。
   然后你又发现好像又有新的产品可以通过画图的方式生成图片,你可能又会去学习 Krea。
   接着你发现 AI 还能生成视频,你又跑去学习 Runway、Pika。
   最后你会发现,你好像学会了一堆软件,但又好像什么都没学会。因为每一款软件你都需要付出足够长的时间,才有可能真正学会,纯粹探索性的学习是不会有任何的积累(除非你只想娱乐一下)。

   而学习分离产品,则能大大地降低这个迁移成本。当有一个新的模型出现时,你只需要切换模型就好了,而不需要重新学习产品的使用方法。比如,你学会了类似 SD WebUI 或者 ComfyUI 这类产品,你学会了如何文生图,当你需要通过画图的方式生成图片,你也只需要切换一些模型,或者在产品里操作一下就能实现与 Krea 类似的效果。

第二个原因是自由度:

   我一直有这样的一个观点:AI 不会淘汰人类,但它会淘汰不会使用它们的人类。

   你如果想要从 AI 这波浪潮里脱颖而出,你就需要学会如何使用 AI。而且不是单纯地使用 AI。你还需要学会如何调整 AI,从而让它切合你的工作流,甚至改造你的工作流。

   因为它的自由度高,你可以自由地修改产品,甚至可以自己开发产品。这意味着你可以将产品与你的工作流结合,从而提高你的工作效率,甚至改造你的工作流。

SD Web UI VS ComfyUI

   那市面上也有很多分离型产品,为何选择 ComfyUI?

   我们先来简单看看 SD Web UI 和 ComfyUI 的 UI 界面,你应该就能知道它们的区别了。

    从上图中可以看到,SD WebUI 的 UI 更像是我们传统使用的产品,有很多输入框,还有多个按钮。而 ComfyUI 的 UI 界面则非常复杂,除了输入框,还有很多一块块的东西,并且还有很多复杂的连线。

    的确,从学习成本来看,ComfyUI 的学习成本会比 SD WebUI 高。但是这种连线其实并不复杂,你可以这么理解:

    这些小的方块跟 SD WebUI 的输入框和按钮是一样的,都是对参数进行配置,连线有点像在搭建一个自动化的工作流,从左到右依次运行,可以想象成搭积木,是一个很有意思的过程
    从功能的角度看,其实两个产品截图所提供的功能是一样的,只是 ComfyUI 变成了这种连线的方式

那这种方式有什么好处呢?我们一起来看看这两个用 ComfyUI 搭建的工作流:

   对比两个工作流,你会发现它只是有一个节点不一样,一个是直接加载图片,一个是通过提示词绘制图片。这样就实现了两个不同的功能(一个是图生图,一个是文生图)。这就意味着,你可以通过改变节点的方式来改变工作流,从而实现不同的功能。这样做有两个好处:

   你可以根据自己的需求搭建适合自己的工作流,而不需要依赖开发者。你也可以根据自己的需求,去开发并改造某个节点。
   所以,选择 ComfyUI 最核心的原因就在于它的自由和拓展。那这就意味着你可以自己调整 ComfyUI 从而让它切合你的工作流,甚至改造你的工作流。

   在现在这种 AI 发展如此迅猛的时代,我认为保持灵活才是最重要的。

   如果你看各种对比评测,还会发现 ComfyUI 在性能上会比 SD WebUI 更好,但在能力的覆盖上会比 SD WebUI 要差,比如 ComfyUI 的 Inpainting 的编辑器就比 SD WebUI 的编辑器要差。但是,这些都不是问题,这些问题未来会依托开源生态逐步完善,或者说互有优势。但是我认为 SD WebUI 不进行非常大的改变的情况下,是无法实现 ComfyUI 那样的自由度的。

总结

   对于那些刚开始探索AI绘画的好奇者来说,Midjourney 是一个理想的选择,能够帮助他们迅速适应 AI。当个人或公司有产品或设计构思时,如果只有大概的想法而没有具体的细节,可以使用 Midjourney 来实现创意,从而快速获得大量灵感。目前,Midjourney 在图像生成质量和 AI 的想象力方面依然处于顶尖水平,甚至可以说是第一。然而,目前它对图片的控制能力较差。

   如果你的公司已经有了产品,并希望对其进行提升或差异化,那么 Stable Diffusion 是一个极佳的选择。它能够在完全保留原产品的基础上,添加你所需要的新元素。正如我的一位朋友所说的那样:Midjourney 更像是艺术家,而 Stable Diffusion 则更像是美工,我认为这个比喻非常贴切。

学习ComfyUI必须要有代码基础吗?

   虽然有基础会是一个优势,但没有也没有关系。在使用 Stable Diffusion 的过程中,我发现 90% 的问题都不需要你编写或修改代码。大部分情况下,只需删除或添加一些文件即可解决。

AI版权问题

   关于AI版权问题,许多人都很关心。目前,可以自由使用自己生成的图像,随意使用,无需担心版权问题。当其他人还在网络上寻找素材、花钱下载或处理有水印和不高清的免费素材,并担心版权纠纷时,我们已经在用 ComfyUI 来解决这些问题了。AI 生成的图像是独一无二的,即使在不同设备上使用相同的种子,调整网络环境后生成的图像也会有所不同。

遵纪守法

   最后,请抛开那些潜意识里阻碍你前进的担忧,因为这些只是让自己停滞不前的借口。世上的一切事物都有其对立面,关键在于你如何去利用它们!希望大家多多使用 AI,让自己的生活更加阳光灿烂,用 AI 做一些积极向上的事情。请记住,一定要遵守法律法规!
                                                   ** 孜孜以求,方能超越自我。坚持不懈,乃是成功关键。**

标签:为什么,要学,AI,ComfyUI,学习,产品,Midjourney,SD
From: https://www.cnblogs.com/LIU-QiuXue/p/18283082

相关文章

  • 分别使用CMAKE和CLION编译,同一个cmakelists.txt, 为什么clion出错和cmake正常?clion出
    求助!!我在github上找到了一个大型的应用软件的开源代码,使用CMAKE编译,再用VS2017以生成应用程序。因为想改代码,所以使用了CLion在本地运行。但是cmake能够正常通过的文件代码,clion却出错。用的同一个cmakelists.txt,请问为什么clion出错和cmake正常呢?求求~改动了很久cmakelist......
  • comfyui使用模型两种方式
    1、huggingface1.1原始用法是模型clone到本地,直接运行下面记录了git克隆大文件报错的问题https://github.com/git-lfs/git-lfs/issues/5749打开gitbash,直接执行GIT_CLONE_PROTECTION_ACTIVE=false就行这种方式应该也可以GIT_CLONE_PROTECTION_ACTIVE=false......
  • Java 中的主方法( main 方法)签名是什么?为什么主方法必须是静态的?
    在Java中,主方法(main方法)是每个应用程序的起点,是Java虚拟机(JVM)调用的第一个方法。它的签名是固定的,必须符合以下格式:1publicstaticvoidmain(String[]args)这个签名包含了几个关键的部分:public:表明这个方法是公开的,可以从任何地方被调用。static:表示这是一个静态方法,意味......
  • 为什么网上商店需要翻译成其他语言
    网上商店不仅仅是一个可以买到商品的网站。它是一个完整的电子商务平台,为来自世界各地的用户提供购买所需物品的机会。但是,为了让这些用户舒适地使用网站,需要高质量的翻译和本地化。本地化是指产品或服务适应特定文化或市场的过程。它包括文本翻译、图形内容以及根据特定区域......
  • 为什么是视频传输用YUV格式,而放弃RGB格式?
    ......
  • 二进制中为什么负数是正数取反再加一
    二进制中的负数表示有一个重要的概念是补码,它是由对应正数二进制取反后再加1得到的。但是经常忘记为什么要这么表示,这里结合chatgpt解释做个简单的总结。补码(Two'sComplement)设计的逻辑来自于简化和统一计算机中有符号数的表示和运算。其设计逻辑可以追溯到计算机科学中的一......
  • ComfyUI流程图、文生图、图生图步骤教学!
    前言leetcode,209.长度最小的子数组给定一个含有n个正整数的数组和一个正整数target。找出该数组中满足其总和大于等于target的长度最小的子数组[numsl,numsl+1,…,numsr-1,numsr],并返回其长度。如果不存在符合条件的子数组,返回0。publicintminSubAr......
  • 01 | 为什么MapReduce会被硅谷一线公司淘汰?
    今天我要与你分享的主题是“为什么MapReduce会被硅谷一线公司淘汰”。我有幸几次与来Google参观的同行进行交流,当谈起数据处理技术时,他们总是试图打探MapReduce方面的经验。这一点让我颇感惊讶,因为在硅谷,早已没有人去谈论MapReduce了。今天这一讲,我们就来聊聊为什么......
  • 人工智能为什么建议用python
    人工智能应用开发经常选择Python语言,原因包括但不限于以下几点:1.**简洁易学**:Python语言简洁清晰,易于学习,使得开发人员可以快速上手并进行开发。2.**丰富的库和框架**:Python拥有大量的科学计算和数据分析库,如NumPy、Pandas、Matplotlib等,以及专门为机器学习和深度学习设......
  • JVM8为什么要增加元空间 ?
    持久代持久代的大小为什么移除持久代?元空间元空间的特点:持久代持久代中包含了虚拟机中所有可通过反射获取到的数据,比如Class和Method对象。不同的Java虚拟机之间可能会进行类共享,因此持久代又分为只读区和读写区。JVM用于描述应用程序中用到的类和方法的元数据也存......