首页 > 其他分享 >【FLUX资讯】黑森林团队发布文生图新模型Flux 1.1 pro,性能全面升级,最新prompt小妙招一键原图直出。

【FLUX资讯】黑森林团队发布文生图新模型Flux 1.1 pro,性能全面升级,最新prompt小妙招一键原图直出。

时间:2025-01-14 10:28:22浏览次数:3  
标签:提示 原图 黑森林 绘画 文生 pro Flux1 AI Flux1.1

在上周三,Black Forest Labs 发布了 Flux 系列续作 Flux1.1 pro。

画质不亚于相机直拍,各大网友已经玩嗨了。

全面升级

先来看看几个例子

提示:“使用 VSCO 滤镜的宝丽来照片,1990 年,女人,夜晚,闪光灯照片,金发碧眼,年轻的脸庞,美丽的阴影,热带植物,公寓内,数码单反相机,相机闪光灯,手里拿着笔记本上的手写标志,上面写着‘2024年10月7日解密验证’。女人用另一只手比出和平手势。”

下面两张图均是由 Flux1.1 pro 生成。

可以看出,在适当提示下生成的图像与真实图像并无二异,几乎无需挑剔,同时改进了 Flux 初始模型的喷绘效果。

灯光与相机闪光灯一致,都聚焦于拍摄对象,但又不会照亮整个房间,VSCO 滤镜增强了真实感,即时贴合度极佳

需要注意,这次生成的字体不是手工挑选的样本,而是前两代,因为在使用文生图时,最好的通常是经过几代和几段编辑后才能实现。

总体来看,图中字体与提示一致,手绘效果有所改善,但还不够完美

与 Flux1 相比,乍一看两代模型在真实感方面非常相似,但在使用相同的提示时,新模型会产生更自然的姿势和更一致的身体。

例如,Flux1 会产生看起来像是一条额外腿的东西,而 Flux1.1 避免了这一现象,这种改进更多地与准确性有关,而不是整体逼真的美感。

这份完整版的AI绘画全套学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

提示:“一只白猫在弹钢琴,戴着太阳镜和帽子,穿着紫色夏威夷风格的衣服,全身照在灰色工作室背景下,配有灯光元素,天花板上悬挂着一只翼手龙,商业视频截图。墙上写着‘Emerge by Decrypt’。”

在 Flux1 制作的图中并不包括照明元素或翼手龙,此外,新一代提示更加逼真,感觉更加自然。

与 Flux1 pro 相比,Flux1.1 pro 在提示贴合方面更进了一步,成功地将更多元素融入场景中,没有遗漏任何细节。

提示:“一只狗站在电视机顶上,屏幕上显示着‘解密’两个字。左边是一位身着西装的女性,手里拿着一枚硬币,右边是一个机器人站在急救箱上。整体场景非常超现实。”

在空间感知方面,Flux1.1 和 Flux1 都差不太多,两者都可以完美地生成所有元素。

但是,在更多细节方面 Flux1.1 pro 要更胜一筹

例如在 Flux1.1 中,只有女人拿着一枚硬币,并没有看见多余的硬币,而 Flux1 却在狗旁边生成了一堆硬币。

此外,Flux1.1 pro 中不存在额外手的错误,超现实主义风格在 Flux1.1 中得到了更好的体现。

还有奇招

有网友发现,如果向 Flux1.1 发出“IMG_1018.CR2”之类的提示,可以很好地去除 AI 味。

将真实感又提升了一个 level

其实原理很简单,就是在提示词添加模仿单反相机的文件命名格式。

只需要输入 “IMG”+随机编号+“.CR2” 这种格式 ,其中的**“.CR2”**指的是来自佳能数码相机的原始图像文件。

除此之外还有索尼相机的**“ARW”、尼康相机的“NEF”,以及苹果的“HEIC”**格式。

运用这种方法,仅仅在原有的提示词上加上这么一小段话,就可以生成在不同时代的主题公园自拍。

就连滤镜都非常符合当时的时代背景。

也难怪有网友猜测:这难道真的不是直接从训练数据中拿出来的吗?

再来看看下面这张照片,大家猜猜,Real or AI?

即使有人用 AI 浏览器 Arc 中的功能检查图片是否为 Deepfake,也会判断其为 100% 非 AI 生成。

表示看起来像个真人

但很可惜,实际上它就是一张全由 AI 生成的图片。

阿xin感觉接下来不是看谁的骗术更高,就是看谁的眼更尖了。

原来是你

在官宣前几天,还记得在文生图模型的排行榜上一个代号**“blueberry”的模型,当时超越了排行榜上的所有其他模型,获得了最高**的总体 Elo 分数,成为最大的两匹黑马。

当时还以为是 OpenAI 在将 o1 LLM 测试为“strawberry”之后对 Sora 进行的测试,毕竟大家都知道,OpenAI 钟爱“莓”。

随着 Flux1.1 pro 的性能通过在 Artificial Analysis 上的亮相得到验证,实锤“blueberry”正是 Flux1.1。

在速度和质量上都击败了 Ideogram 和 MidJourney。

Flux1.1 pro 的生成速度比其前身 Flux1 pro 快六倍,提高了图像质量、及时性和多样性。

同时还更新了 Flux1 pro,以前同样的生成和输出,但速度提高两倍。

大家也可以发现在图表上没有显示出 MidJourney 模型,毕竟它的速度实在是太慢了,慢得甚至超出了图表范围。

然而,它的 Elo 分数大约在1100分左右,略低于 Ideogram V2。

定价方面上,Flux1.1 Pro 每张图片售价0.04美元,低于市场上许多其他型号,包括原版 Flux1 Pro。

这种定价直接让 MidJourney 和 Ideogram 等其他付费服务不用玩了,后者的年费分别为96美元和84美元。

MidJourney 和 Ideogram 不仅每个 Token 成本高,速度还慢

Flux1 dev 每张图2.5美分(约RMB 0.18元);Flux1 pro:每张图5美分(约RMB 0.35元);Flux1.1 pro:每张图4美分(约RMB 0.28元)。

Flux1.1 pro 还即将在 API 中推出原生设置为快速超高分辨率生成,可以生成最多2k的图像,而不会牺牲任何提示。

目前 Flux1.1 pro 支持通过 Together.ai 、Replicate 、fal.ai、Freepik等在线平台提供。

Black Forest Labs

八月初,Stable Diffusion 原班人马 Robin Rombach、Patrick Esser 和 Andreas Blattmann 成立 Black Forest Labs。

在两个月前,Black Forest Labs 就已经获得了3100万美元的种子资金,由 Andreessen Horowitz 领投,并得到了 Brendan Iribe、Michael Ovitz 和 Garry Tan 等知名投资者的支持。

发展至今,Flux 1.0 一共有三种版本:Flux1 Pro、Flux1 Dev 和 Flux1 Schnell。

基于这些模型的开源特性,尤其是 Flux1 Dev 和 Flux1 Schnell,让 BFL 成为开源与专有 AI 之争中的佼佼者

不限制于文生图,Black Forest Labs 已将目光投向文本转视频系统,致力于将其生成式 AI 功能扩展到图像之外。

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍

标签:提示,原图,黑森林,绘画,文生,pro,Flux1,AI,Flux1.1
From: https://blog.csdn.net/m0_56144365/article/details/145132511

相关文章

  • 【FLUX】目前最强的文生图模型?!FLUX完全解读!附体验地址
    几天前,PoeAI新增了一个文生图的模型,在给用户发放的邮件通知中,Poe形容这个文生图模型是“thebestimagegenerator”,它便是FLUX。说起FLUX模型,可能很多小伙伴都没听说过。这并不奇怪。FLUX是由BlackForestLabs(黑森林实验室)推出的一款最新的文本生成图像模型。而BlackF......
  • (14-2)基于Latent Diffusion Transformer的文生视频系统:系统配置
    6.3 系统配置在“configs”目录中,保存了本项目中涉及的不同数据集和任务提供配置文件。这些配置文件定义了模型的训练、验证和测试过程中的关键参数和设置,包括网络结构、优化器参数、学习率调度、数据预处理方式等。目录中每个子文件夹或文件的命名(如ffs、sky、t2x、taich......
  • 第10章图10.16-10.20《分析模式》原图和UML图对比
    DDD领域驱动设计批评文集做强化自测题获得“软件方法建模师”称号《软件方法》各章合集图10.16创建传统期权类型。这可以使处理状态模型变得更容易,但不那么自然。图10.17“投资组合浏览器”以及它和领域模型的关系。“投资组合浏览器”和“浏览器行”是应用......
  • 第10章图10.11-10.15《分析模式》原图和UML图对比
    DDD领域驱动设计批评文集做强化自测题获得“软件方法建模师”称号《软件方法》各章合集之前给出的图10.3改编有错误,修正重发图10.3使用期权过程的事件图。期权只能在到期日开始后行使,并且只有在"价内(inthemoney)"时才会行使,即行使期权比以当前价格进行现货交易更......
  • 开源flux适配昇腾NPU分享,体验120亿参数AI文生图模型
    这一期我们分享一位开源开发者参与flux适配昇腾NPU的实践经验,欢迎广大开发者对华为技术栈适配进行讨论。开源适配实践flux是一个AI图像生成模型,有120亿参数量,具有大量的用户基础,可以根据命令行输入的文字去生成对应的图片。本次适配使用的flux模型权重文件是schnell版本。下面......
  • 自学资料 - Dalle2模型 - 文生图技术
    Dalle2模型-论文中为unCliP目录Dalle2模型-论文中为unCliP1.Dalle2的引言2.GAN模型优缺点优点缺点3.AE和DAE(denoisingAE)原理共同点4.VAE(变分自编码器)优点5.VQVAE(向量自编码器)原理优点6.Dalle模型原理7.Diffusion模型模型更新过程优点缺点:8.Dalle2......
  • 汉语新解——图文生成工作流详细教程,适用于各种自媒体创作
    ......
  • 用StartAI Flux文生图,轻松打造新年元旦海报背景图
    随着新年元旦的脚步日益临近,各个行业的竞争也愈发激烈。在这个关键的时刻,一张独具匠心、充满新年氛围的海报背景图,无疑将成为吸引顾客眼球、提升销量的重要法宝。现在,StartAI的Flux文生图功能为你提供了一个全新的创意平台,助你轻松打造独特的新年元旦海报设计。一、功能优势......
  • 学AI绘画必知!StableDiffusion文生图与图生图的基本认知
    在AI绘画的学习与使用中,无论是入门小白还是进阶高手,都绕不开两个核心概念:文生图和图生图。这是所有AI绘画工具的根本操作方法。掌握这两者的基本原理,你便能轻松驾驭大多数AI工具,无论是MidJourney、StableDiffusion,还是其他图像生成平台。什么是文生图?简单来说,文生图就......
  • 最新的强大的文生视频模型Pyramid Flow 论文阅读及复现
    《PYRAMIDALFLOWMATCHINGFOREFFICIENTVIDEOGENERATIVEMODELING》论文地址:2410.05954https://arxiv.org/pdf/2410.05954项目地址:jy0205/Pyramid-Flow:用于高效视频生成建模的金字塔流匹配代码https://github.com/jy0205/Pyramid-Flow论文提出了一种新的视频生成模型,......