首页 > 其他分享 >AI绘图之Midjourney初体验

AI绘图之Midjourney初体验

时间:2024-05-27 21:56:28浏览次数:25  
标签:初体验 prompt AI MJ -- 绘图 图像 Midjourney 图片

Midjourney (MJ) 使用笔记

最近尝试了 Midjourney 绘图,简单记录下使用流程。

注册及登陆

首先是账号注册和登陆,基本上就是一路下一步,唯一需要注意的是加入MJ频道,具体流程为:

  1. 打开Discord,点击右上角Login进入登陆界面
  2. 点击登陆页面下方的Register,进入注册页面
  3. 输入用于注册的相关信息,点击下方continue完成注册。
  4. MJ会发送一份验证邮件,需要进入邮箱点击完成验证。
  5. 继续登陆MJ,进入MJ主界面
  6. 点击左侧的探索可发现的服务器按钮,打开服务器界面,找到下方的Midjourney群组并点击。如果下方没有找到,也可以在搜索框搜索

  7. Getting Started进入到服务器,进来之后点击最上面的加入Midjourney,加入MJ群组。如果此处一直加入不了群组,可能是代理的国家人数太多受限了。尝试切换代理的国家,再次尝试。但是如果IP换得频繁,也有可能触发风控。
  8. 加入群组后,点击左上角的私信,打开Midjourney Bot,即可打开和MJ机器人的对话框。
    20240527211811
  9. 如果需要订购会员,在对话框输入/subscribe命令,点击弹出的Manage Account,进入订阅界面。此处选择月付的标准版会员,切换到Monthly Billing,点击Standard Plan下放到的Subscribe进行订阅,在弹出的窗口中输入自己的支付方式,完成支付即可。

下次使用时,从 https://discord.com/channels/@me 登陆即可。

运行指令

登陆以后,点击左上角私信,接着选中Midjourney Bot,即可打开和MJ机器人的对话框。
20240324204643

在对话框中输入各种指令(按下/即会有智能提示,可以通过Tab键进行选择),并回车执行指令。常用参数包括:

  1. /imagine <prompt> 为生成图像的指令,其中 prompt 是用于生成图像的文本命令
    20240324205934
  2. /info 了解账户的订阅信息和剩余时间
  3. /relax 切换到relax模式。该模式生成图像不消耗账户的GPU时间,但是需要排队,可能生成速度较慢
  4. /fast 切换到fast模式,该模式可以在60s内生成图像,但是需要消耗账户的GPU时间。
  5. /blend 将两个图片进行融合
  6. /settings 调整MJ的设置,包括MJ的版本、风格、质量参数、风格参数和输出模式等。
    20240324205908
  7. /stealth 切换到隐身模式,标准版不可用
  8. /describe 图片生成文字。上传图片,MJ返回对该图片的文字描述
  9. /ask 问问题,类似ChatGPT
  10. /show 使用图片作业ID(job id可在MJ记录中查看或复制)重新生成 Discord 中的作业
  11. /help 查看帮助信息
  12. /subscribe 管理订阅
  13. /prefer option set 创建指定变量
  14. /prefer option list 列出之前设置的所有变量
  15. /prefer suffix 指定要添加每个提示末尾的后缀,用来统一调整后续绘图的参数

绘图

掌握了MJ的基本用法后,就可以开始绘图了。比如使用命令 /imagine Diagrammatic isometric the water cycle or water cycle diagram shows four seasons of watering of Earth's surface, in the style of forest vistas, whistlerian, photoillustration, left forests but right fragment trees, 2d game art, rough-edged 2d animation Three dimensional 命令生成一个四季的水文循环的图。

命令运行时,可以在右侧看到进度,等待进度到100%,即会展示绘制的图片。

20240324213708

绘图最关键的就是设计prompt。比如上面的绘图命令中:

  1. Diagrammatic isometric提示用于科研绘图展示
  2. four seasons 指定4个子图分别生成4季的图像
  3. rough-edged 2d animation Three dimensional 用于展示2d风格和三维风格

可以尝试让ChatGPT生成绘图prompt,再自己微调。

也可以考虑上传先找到一张样图,使用/describe命令获取MJ对该图片的描述。将该描述略微修改后,作为/imagine命令生成图像的prompt。

比如先使用 /describe 命令对下图进行描述。

20240324212128

描述后,生成了4个可选的图片介绍,选择第一个描述,稍作修改后作为prompt生成图像 /imageine An educational poster titled "The Water JCyle" that depicts the water cycle from its source to oceans, highlighting key elements such as clouds and raindrops in blue color on one side of the page. The other half shows an illustration showing vegetation, rivers, lakes, etc., with arrows connecting them all around. There is also text detailing each step in the process, along with notes about soil, air, atmosphere, and Earth's surface waters.

等待片刻,即可得到基于该图生成的示意图。还是有一些相似,可以在此基础上再修改。可以看到,MJ对文字的支持不好,推荐只用MJ生成图片,后期自己加文字标注。

20240324212437

绘图参数

绘图时,可以在绘图的prompt后面添加一些参数,用来控制绘图的一些设置,如图像比例、清晰度之类的。常用的参数有:

  1. --aspect--ar,绘图比例,比如 4:3、16:9,默认为1:1
  2. --chaos <0-100> 或者 --c <0-100>,控制图片的创意度和多样性,数字越大,创意性越强,默认为0
  3. --no,控制图片中不要出现的元素,比如--no dogs,会尝试从图像中移除狗
  4. --quality--q,控制图片的精细质量程度,默认值是1。数值越大,越多细节,但渲染时间越长
  5. --seed <0-4294967295>,绘图种子,用来控制图片相似性。使用相同的种子编号和提示将产生相似(也就是并不相同)的结果图像。seed值可以影响图像的细节、颜色、形状等方面,但不会改变图像的主题和内容
  6. --stop <10-100>,控制图片渲染到哪一个进度停止,默认为100,即全部渲染完成后再停止
  7. --style <1, 2, 3, 4, 5.0, 5.1, 5.2, or 6>,模型版本切换,从MJ V1到MJ V6有非常多个版本可以切换。默认使用最新的 V6版本
  8. --stylize <0-1000>或者--s,控制图片的风格化程度,数值越高图片的艺术性越强,和写的内容偏差就越大,默认是100 (style med)
  9. --iw <0–2> 设置相对于文本粗细的图像提示粗细。默认值为 1
  10. --repeat <1–40> 重复运行n次,用于多次运行选最好的。

图片调整

MJ可以在之前绘图的基础上做各种调整。比如,初次绘图后,图片的下方会出现9个图标,可以对之前生成的图像进行调整:

  1. U1~U4 (Upscale) 可以选择刚才的某一个子图放大,并添加更多的细节
  2. V1~V4 (Vary) 可以对所选图像进行进一步变化,生成图的风格和构图会与所选图像相似
  3. 最后一个循环箭头的图标用于重新生成图像。

20240324213824

选择需要的子图后,可以继续点击下方按钮对图片进行修改,主要包括 Upscale(提高分辨率)、Zoom out(向外括图)、vary(更新图像)和平移括图。

  1. Upscale 是提升图片的分辨率,并添加更多细节。
  2. Zoom out 是以当前图像为中心,根据提示词向外括图
  3. Vary 是对图像的原始内容进行更新。其中:
    1. Vary (Subtle) 和 Vary (Strong) 是对图像整体进行重绘,Strong修改程度比Subtle更大
    2. Vary (Region) 则是对图片的局部进行重绘。点击按钮后,在弹出的新窗口中通过方框或者套索选择要重绘的区域,然后在下方窗口中输入用于重绘的prompt。该prompt仅需要提示如何对选定区域进行重绘,不需要添加原来的prompt。
  4. 4个方向按钮则是在不改变原来图像的情况下,向指定方向平移括图。

20240324214610

更具体的解释Vary (Region):

  1. 为了保证整体的协调,局部修改仍然受之前全局prompt的约束,所以如果要大面积的修改图像,仍然需要调整全局的prompt,而不是选中大范围后进行局部重绘
  2. 局部重绘后,没有选中的地方不会变化,选择的地方重绘后可能和原来差别很大。如果想要保证和原来绘图尽量一直,可以在绘图时设置和原来相同的随机数种子(--seed xx),并且增大iw参数 (比如--iw 2,iw的范围为[0,2])。其中,2就是深度参考之前的图片,基本上构图不会发生什么变化。

如果想要重绘部分也尽可能的与原来保持一致,可以尝试Stable Diffusion。SD中绘图时可以使用ControlNet,可以在该模型中使用Candy边缘检测,使生成的图像与原图轮廓比较相近,具体可参考 stable diffusion 绘图 局部重绘

prompt设计的技巧

MJ的prompt包含3部分:图像prompt、文本prompt和参数。其中:

  1. 图像prompt以图像链接的形式给出,可以影响最终结果的样式和内容。图像prompt始终应该在prompt的最前方
  2. 文本prompt,最常用的prompt,给出要生成的图像的文本说明
  3. 参数,用来更改图像的生成方式,可以更改纵横比、型号、升频器等。位于prompt的末尾。

20240324222208

对于prompt的设计,官方有一些建议:

  1. 用词尽量具体。在许多情况下,更具体的同义词效果更好。比如对于大小,可以使用try tiny, huge, gigantic, enormous或者immense等词。
  2. 控制描述的长度。更少的词意味着每个词的影响力更大。单词间通过逗号、括号或者连字符来组织想法。如果描述太复杂,可能产生一些克苏鲁的东西……
  3. 专注于想要的,而不是不想要的。描述时不要写反向表达,就正向思维说想要XX呈现在图片中。如果想要控制这个XX不在生成的图片中,可以使用--no参数
  4. 尽可能处理好背景和细节,可以从以下几个方面来描述:
    1. 主题:人、动物、人物、地点、物体等 (Subject: person, animal, character, location, object, etc.)
    2. 媒介:照片、绘画、插图、雕塑、涂鸦、挂毯等 (Medium: photo, painting, illustration, sculpture, doodle, tapestry, etc.)
    3. 环境:室内、室外、月球上、纳尼亚、水下、翡翠城等 (Environment: indoors, outdoors, on the moon, in Narnia, underwater, the Emerald City, etc.)
    4. 照明:柔和、环境、阴天、霓虹灯、工作室灯等 (Lighting: soft, ambient, overcast, neon, studio lights, etc)
    5. 颜色:充满活力、柔和、明亮、单色、彩色、黑白、柔和等 (Color: vibrant, muted, bright, monochromatic, colorful, black and white, pastel, etc.)
    6. 情绪:稳重、平静、喧闹、精力充沛等 (Mood: Sedate, calm, raucous, energetic, etc.)
    7. 构图:人像、头像、特写、鸟瞰图等 (Composition: Portrait, headshot, closeup, birds-eye view, etc.)
  5. 如果要控制图片中某个物体的数量,尽量具体化。比如说"two dogs",或者"flock of birds"
  6. 不用考虑大写英文单词

个人感觉MJ对文字的支持不好,不要企图让MJ在图片中加入文字,不然可能会很怪。

关于MJ的更多使用,可以查看其官方文档


本文参考:

  1. Midjourney官方文档
  2. Midjourney 新手快速起步指南
  3. Midjourney尝试科研绘图,图文摘要,效果惊艳!
  4. Midjourney指南 - 生成高分辨率图片(内容已更新至V5)
  5. midjourney人工智能绘图如何上手,新手小白完全攻略
  6. Midjourney的安装和订阅
  7. stable diffusion 绘图 局部重绘
  8. 爆肝!超详细的胎教级Midjourney使用教程,看这一篇就够!

标签:初体验,prompt,AI,MJ,--,绘图,图像,Midjourney,图片
From: https://www.cnblogs.com/geoli91/p/18216619

相关文章

  • AIGC行业现在适合进入吗
    简介:探讨当前时机是否适合进入AIGC行业,考虑行业发展阶段和市场需求。当你考虑进入AIGC(人工智能生成内容)这个迷人的世界时,真的,有很多事情需要思考。教育科技这一块,特别是,看起来充满了无限的可能性,不是吗?但就像任何大胆的新旅程一样,它也需要仔细规划和准备。欲扬先抑:想象进入之......
  • AI大模型入门基础教程(非常详细),AI大模型入门到精通,收藏这一篇就够了!
    什么是AI大模型?AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。为什么要学AI大模型?2024人工智能大模型的技术岗位与能力培养随着人工智能技术......
  • AI大模型知识点大梳理
    文章目录AI大模型是什么AI大模型发展历程AI大模型的底层原理AI大模型解决的问题大模型的优点和不足影响个人观点AI大模型是什么AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。这些模型可以通过学习大量的数据来提高预测能力,从而在自然语言......
  • AI 艺术码绘画实操教程
    一、概念说明艺术二维码是一种结合了AI绘画艺术设计元素的二维码,它在保持传统二维码功能的基础上,通过视觉设计上的创新,使得二维码本身成为一种视觉艺术作品。与传统的黑白二维码相比,艺术二维码通常具有以下特点和区别:艺术二维码的特点视觉吸引力:艺术二维码通过颜色、......
  • SpringAi
    SpringAI初学SpringAI官方地址”spring不生产AI,只是AI工具的搬运工“项目可以查看giteeOpenAI前期准备OpenAI官方地址,需要使用魔法才能打开,同时购买很麻烦,建议淘宝进行购买,只需要购买openai的apikey即可。apikey形如sk-xxxxxxxxxxxxxxxxx项目创建Idea......
  • AI智能体研发之路-模型篇(四):一文入门pytorch开发
    博客导读:《AI—工程篇》AI智能体研发之路-工程篇(一):Docker助力AI智能体开发提效AI智能体研发之路-工程篇(二):Dify智能体开发平台一键部署AI智能体研发之路-工程篇(三):大模型推理服务框架Ollama一键部署​​​​​​​AI智能体研发之路-工程篇(四):大模型推理服务框架Xinference一......
  • 时空AI软件:地理信息与遥感领域的智慧引擎
    在地理信息与遥感技术的广阔疆域,时空AI软件如同一颗璀璨新星,将时空信息与智能深度融合,驱动着地理信息分析、决策支持、环境监测、城市规划等领域的深刻变革。本文将深入剖析其技术核心、应用实例、未来趋势,探索时空AI软件如何在地理信息与遥感领域中引领智慧进程。时空AI软件:智能......
  • Go + AideLua 实现云端布局
    需求最近有Android和Lua联动的需求,但考虑到安全性想采用Go实现云端布局分发,Lua获取到本地再进行解压刷新。思路后端:Golang安卓端:Java+Lua云端编写代码,Go-server实时进行分发安卓端定时监听云端的文件变化,获取到本地后解压并装载.通过SQLite等本地数据库,实......
  • portainer及agent 安装教程
    1.简介Portainer是一个强大的开源工具,用于管理Docker环境。它提供了一个直观的Web界面,简化了容器的管理过程。在这篇博客中,我们将介绍如何部署Portainer及其Agent。2.PortainerServer首先,我们需要在主机上部署PortainerServer。它提供了一个Web界面,用于管理Dock......
  • TCP_UNACCEPTABLE_14: [close-wait] out-of-wdw SEQ | unacceptable ACK -> ACK (seq,
    测试目的:验证TCP在CLOSE-WAIT状态下,接收到一个窗口外的序列号或不可接受的ACK号的段时,是否能够返回一个带有正确的序列号和ACK号的ACK段,并保持在相同的状态。描述:在TCP连接的CLOSE-WAIT状态下,如果接收到一个序列号超出当前窗口或ACK号不可接受的段,TCP必须回应一个空的ACK......