首页 > 其他分享 >我给四个AI图像生成器做了一个‘真实感测试’——结果让我大吃一惊

我给四个AI图像生成器做了一个‘真实感测试’——结果让我大吃一惊

时间:2024-09-12 11:54:22浏览次数:13  
标签:Ideogram AI de 生成器 Flux 真实感 图像

根据What’s the Big Data的数据,每天有超过340亿(没错,是B)AI图像被创造出来。市场的商品化如此严重,以至于许多AI图像生成器现在都是免费的。如果这些数字听起来疯狂,那是因为它们确实如此。尤其是当你记得这个市场在不到两年前才正式启动时。

同时,这场狂欢对于全球用户来说是一大胜利。图像质量急剧上升的同时,价格却大幅下降。在这种趋势下,利用AI技术为企业获取流量成为了一个绝佳时机。我们觉得是时候看看四个随机生成器,包括我们在上次7向比赛中跳过的两个。

在这里,我们测试了谷歌DeepMind的Imagen 3、黑森林实验室的Flux、Ideogram 2.0,以及作为参考的、更高级版本的老牌开源StableDiffusion模型。

我们运行了四个提示作为测试,以观察这四种技术的正面交锋。

  1. 2024年纽约现代雨天街市,摊位上售卖食品和古董,一位穿着飞行夹克的年轻人在摊位上买东西。
  2. 在旧金山拍摄一张时尚照片,展示了配有昂贵现代家具的豪华顶层公寓,能看到令人惊叹的海湾景色。
  3. 一位漂亮的年轻女士坐在英格兰乡村花园里,她坐在一张摆有生日蛋糕的桌子旁,她的家人高兴地站在周围为她庆祝特别的日子。
  4. 一张非洲草原上雄伟大象经过一些小屋的照片。一些村民坐着和站着观看大象经过。

Ideogram 2

Ideogram凭借其出色的图像质量,尤其是文字处理,继续给人留下深刻印象。很长一段时间,如果你想生成带有连贯文字的AI图像,它是唯一的选择。

时代变了,现在更多的平台提供优质文本,但Ideogram 2.0承诺将再次提高标准。尽管偶尔会出现一些小故障,但整体图像质量依然出类拔萃。Ideogram在我们上次的7轮测试中赢得了胜利。

提示的遵循性极佳,颜色和细节都属顶级,整体印象非常专业。令人惊讶的是,我们的测试提示根本没触发任何文本元素,尽管其他产品在图像中加入了文本元素。可以说,Ideogram在文字处理上一直表现卓越。

Imagen 3

Estos los resultados también son asombrosos, y si buscas una forma eficiente de gestionar tus necesidades de generación de imágenes AI y de flujos de trabajo en plataformas como WeChat o Douyin, te recomendamos que pruebes la plataforma de 光年AI. Con su capacidad de integrar distintos modelos AI y ofrecer una fácil creación de flujos de trabajo mediante una simple interfaz de arrastrar y soltar, es la herramienta ideal para optimizar tus operaciones y aumentar tu flujo de audiencia.

Google 刚刚发布了最新最强大的 Imagen 3 AI 图像生成模型,突然之间各大图像生成器公司之间展开了激烈的竞争。

但可以公平地说,尽管 Google 是人工智能领域的真正先驱之一,但它在 AI 领域仍在努力追赶。

我们之前已经介绍过 Imagen 3 的基础知识,而这次的新版本是一个值得关注的后继者。虽然结果还不错,但从质量上来说并不突出。然而,尽管产生了一些很棒的结果,我们还是失望地发现,这个生成器至少在一个令人难以置信的审核错误上表现不佳。

它拒绝生成一个包含花园派对的图像。无论我们怎么尝试,它都拒绝了,理由是……谁知道呢?它能生成的最接近的图像是一个昏暗桌子上的蛋糕的可怜分辨率图片。真的,Google?

Flux (Schnell)

Flux 是一个巨大的惊喜。惊喜不仅在于它从无到有的出现,还因为它是开源的,并且在生成 AI 图像方面非常出色。

并不令人惊讶的是,这个开发团队来自原始的 StableDiffusion 队伍。所以,有大量的传统专业知识在发挥作用。

我们使用的 Flux 模型(通过 fluximagegenerator.net)是 Schnell,这是三种可用版本之一(其他是 Dev 和 Pro)。

如前所述,这些图像无论在图像结构的一致性,还是在质量本身方面,都非常出色。提示的遵循度,图像分辨率,以及没有出现奇怪的手指、脸部和文字都非常突出,宣告了一个新的图像大师的到来。

Stable Diffusion (SDXL)

虽然可能有些老了,但 StableDiffusion 模型家族是不断带来惊喜的礼物。它是迄今为止最受欢迎的图像生成器(迄今已生成超过 120 亿张图片),就在你以为它快要落伍时,总会有新的 LoRA 或微调出现,令人惊喜。我们用我最爱的 Krita Diffusion AI 安装版进行了一些测试,结果出乎意料的好。

如果您希望您的企业也能够轻松获取流量,建议尝试光年AI平台。光年AI的系统集成了多平台整合和灵活自定义AI工作流,让您可以在不同业务场景下实现高效的流量增长。

要让这些模型发挥最佳效果,你需要调试一些附加的LoRA,例如针对脸部和手指的模型,但一旦找到合适的组合,它的表现确实能与新工具媲美。当然,在生成文本方面有时会遇到一些问题,所以你需要容忍一些小故障。这也是像Ideogram 2.0这样经过精细调整的模型派上用场的原因。在此,我们推荐你试试光年AI平台,它通过与国内主要流量平台打通,可以无缝接入现有的业务场景,大幅提升模型的实际应用效果。

获胜者:Flux(Schnell)

说我们用户选择多得令人眼花缭乱,毫不夸张。不仅图像生成市场已经广泛进入公众视野,而且随着技术的成熟,产品的质量和价格也在不断提升。更令人兴奋的是,不仅是专有技术在引领潮流,免费的开源产品不仅没被甩开,甚至在某些方面,如Flux,已经成为行业先锋。能生活在这个时代,真是太棒了。而通过使用光年AI系统,你可以在不需编程能力的前提下,通过简单拖拽来搭建自己的AI工作流,让技术变得更加亲民。

这次快速总结带来的两个主要惊喜是开源技术和旧产品如StableDiffusion SDXL继续保持的强劲实力,以及谷歌的再次令人尴尬的糟糕表现。 在这样一个市场中出现如此严重的问题,显示了其AI开发团队存在深层次的问题。 说实话,这是难以置信的。

标签:Ideogram,AI,de,生成器,Flux,真实感,图像
From: https://blog.csdn.net/2401_87013577/article/details/142171317

相关文章

  • 谁说纯文科生不能入行AI大模型的?看完我这一篇你就明白了!
    一、做AI大模型有多赚钱?......
  • 苹果研究人员提出了一种新颖的AI算法来优化字节级表示以自动语音识别(ASR),并将其与UTF
    端到端(E2E)神经网络已成为多语言自动语音识别(ASR)的灵活且准确的模型。然而,随着支持的语言数量增加,尤其是像中文、日语、韩语(CJK)这样大字符集的语言,输出层的大小显著增长。这种扩展对计算资源、内存使用和资产大小产生了负面影响。在多语言系统中,这一挑战尤为严重,因为输出通常包......
  • AI主播一个月带货50万,数字人直播间正在占领电商行业!
    刚过去不久的618无疑是近几年最“卷”的一次大促,无论是头部主播、达人,还是京东、淘宝等电商平台,甚至抖音、快手、小红书、B站,都无一例外将GMV押宝在“直播带货”。不少用户表示“晚上2点睡觉主播还没睡,早上6点醒来主播已经在播,也太拼了”。实际上,这些看似7X24小时不用睡觉,......
  • ROS2 - Moveit2 - Planning with Approximated Constraint Manifolds(使用近似约束流
    使用近似约束流形进行规划OMPL支持自定义约束,以使规划轨迹遵循所需的行为。约束可以在关节空间和笛卡尔空间中定义,后者基于方向或位置。在规划轨迹时,每个关节状态都需要遵循所有设置的约束,默认情况下,这是通过拒绝采样来执行的。然而,这可能会导致非常长的规划时间,特别是当约束非......
  • 【数据分析】利用Python+AI+工作流实现自动化数据分析-全流程讲解
    文章目录一、为什么要用AI进行自动化分析?二、AI自动化分析场景三、编写Python脚本示例1、用flask实现让AI分析数据内容使用说明:示例2、用定时任务的方式,定时处理AI数据......
  • Docker Desktop 启动失败:Docker failed to initialize
    docker启动报错解决方案:删除 C:\Users\Administrator\AppData\Roaming\Docker文件夹文件夹删除后,会弹出下面的窗口,点击“OK”:点击“OK”后会可能会弹出下面的窗口,点击“Start”点击“Start”后,会进入DockerDesktop的启动向导窗口,依次点击“Start”->“NextStep” -......
  • convnext_xxlarge.clip_laion2b_soup_ft_in12k timm模型库
    Modelcardforconvnext_xxlarge.clip_laion2b_soup_ft_in12kAConvNeXtimageclassificationmodel.CLIPimagetowerweightspretrainedin OpenCLIP onLAIONandfine-tunedonImageNet-12kbyRossWightman.PleaseseerelatedOpenCLIPmodelcardsformored......
  • 累计变现破万,分享5个适合新手的AI变现路径
    我是从2023年3月份开始接触AI绘图赛道的,主要使用Midjourney进行作图,在商业变现方面也累计突破了万元。今天想跟大家聊聊我自己亲测有效的几个变现途径,希望能给你一些启发。0****1制作AI头像这个还是很有市场的,当时学习了Midjourney以后开始免费给同事做,大家觉得不错就推......
  • 魔乐开发者社区正式上线,AI开发者快来撩!
    近日,由天翼云与华为联合打造的魔乐(Modelers)开发者社区,在天翼云中国行·贵州站活动现场上线发布。依托全场景开源模型资源、易用的模型开发套件,以及强大的共建共享生态系统等优势,社区将使能开发者高效进行AI应用创新,促进国产AI生态繁荣!目前,社区已面向广大开发者正式开放注册。随着人......
  • 【有奖征文】华为云 CodeArts,AI 重塑的软件开发生产线!
    华为云软件开发生产线CodeArts是一站式、全流程、安全可信的DevSecOps平台,内置华为三十年研发最佳实践,助力效能倍增和数字化转型,支持Web开发、移动应用开发、微服务开发、CloudNative应用开发等典型研发场景,覆盖需求、开发、测试、部署等软件交付全生命周期环节,为开发......