提到文生图、图生图,你首先肯定会想到 Stable Diffusion、Midjourney,但最近又有一个文生图模型横空出世,它就是由 Stable Diffusion 原班人马打造的 FLUX.1。FLUX.1 包含专业版、开发者版、快速版三种模型,它们的区别如下:
FLUX.1[pro]
专业版,最先进的一个版本,具有顶级的提示词遵循、视觉质量、图像细节和输出多样性,专门面向专业用户提供定制的企业解决方案。但是模型无法下载到本地,只能调用官方提供的 API,每张图片的价格是 0.055 美元。
FLUX.1[dev]
开发者版,从 FLUX.1[pro] 提炼而来,在某些方面拥有和 pro 类似的出色表现,并且支持下载开源模型。如果你有一个好的显卡,那么推荐开发者版,这样不管生成多少张图片,都不用花一分钱。但如果你的显卡性能不够,也可以调用官方的 API,每张图片价格是 0.03 美元。注:开发者版的模型虽然是开源的,但不可以商用。
FLUX.1[schnell]
快速版,支持下载开源模型,该模型最简单、响应速度最快,对机器的配置要求也更低,专为本地开发和个人使用而定制。如果是调用官方的 API,那么每张图片价格是 0.003 美元。注:该版本的模型可以在 Apache2.0 协议许可下商用。
相比其它模型,FLUX.1 在视觉质量、图像细节方面做的更好,比如文字生成、复杂构图、人手描绘等,一直是各大模型的重灾区,但 FLUX.1 可以做的很好。另外根据官方测试,专业版和开发者版均击败了 SD3-Ultra 等主流模型,即使是简单的快速版也击败了 Midjourney v6.0、DALL·E 3 等大模型。
FLUX.1 模型采用了一种创新的混合架构,融合了多模态处理能力和并行扩散机制的Transformer技术,并将其扩展至高达 120 亿个参数。这些模型在训练生成模型的方法上采用了流匹配技术,这种方法不仅通用性强,而且概念简洁,特别适用于包括扩散过程在内的各种情况。
官网也给出了很多 FLUX.1 生成的样例图片,可以去看一下,感受 FLUX.1 的强大,这里就不展示了。
- FLUX.1 的官网:https://blackforestlabs.ai
- FLUX.1 的 GitHub 地址:https://github.com/black-forest-labs/flux
然后我们来看一下如何使用 Python 操作 FLUX.1 生成想要的图片。
# 将 FLUX.1 项目克隆下来
git clone https://github.com/black-forest-labs/flux
# 进入项目的主目录
cd flux
# 创建个虚拟环境
python3 -m venv venv
# 安装依赖包
./venv/bin/pip install ".[all]"
安装完成之后,我们来编写代码生成图片。
未完待续
标签:FLUX.1,文生,模型,Python,API,开发者,图片 From: https://www.cnblogs.com/wan-ming-zhu/p/18355185