首页 > 其他分享 >”言出法随“最懂你的AI绘画工具,无需关键词、一键整合包教程

”言出法随“最懂你的AI绘画工具,无需关键词、一键整合包教程

时间:2024-09-03 14:50:43浏览次数:6  
标签:Diffusion Stable AI Omost 一键 生成 提示 图像 言出法随

2024年,AI绘画技术已经日新月异,但仍有不少工具依赖于关键词描述,无论是Midjourney还是Stable Diffusion,都需要用户提供详细的关键词描述。尽管聪明的用户可以借助大语言模型(如GPT-4)自动生成关键词,但这仍旧不是最直观的方式。

今天,我们要介绍的是Omost——一个真正理解你的AI绘画工具。

github项目,stars飙升。

2ae0faab38b13c1f293c0d24b9da5087.jpeg

Omost不仅是ControlNet作者倾力打造的创新项目,更是一场图像生成技术的革命。Omost通过将大型语言模型(LLM)的强大编码能力转化为直观且高效的图像生成能力,带来了前所未有的创作体验。


Omost的独特之处

Omost的核心技术在于其独特的图像合成方法,能够深刻理解并响应极短的提示词,生成既详细又空间表现准确的图像。这意味着即使你对图像生成技术不甚了解,也能轻松生成令人惊叹的视觉作品。

项目名称“Omost”寓意深远,其中“O”代表“omni”多模态,象征着项目支持多种形式的输入与输出;“most”则表达了项目挖掘LLM模型潜力的决心,力求从每一个细节中释放出最多的图像生成可能性。


技术亮点

  1. 自动扩展提示词:Omost能够将简单的提示词拆解成详细的描述,生成符合你预期的完整图像。
  2. 高灵活性:生成的图像可以轻松调整,用户可以通过简单的提示词对图像中的某个元素进行修改。
  3. 图像位置编码:通过将图像划分为729个不同的位置,确保生成图像的准确性和细致度。
  4. 子提示系统:Omost的LLM可以提供严格定义的“子提示”,大幅提高提示词的灵活性和准确性。
  5. 注意力操纵:通过调整注意力分数,Omost能够实现更精细的图像生成。
  6. 提示前缀树:通过提示前缀树技术改进提示理解和描述,确保生成图像与提示词高度一致。


Omost的应用

Omost的背后是经过混合数据训练的LLM模型,这些模型不仅能够编写代码,还能与内置的虚拟画布代理紧密协作。用户只需简单描述所需画面,虚拟画布代理便会理解并转化为视觉指令代码,并最终生成符合要求的图像。

更为重要的是,你可以将Omost生成的关键词复制到其他AI绘画软件中,比如Stable Diffusion,同样能够生成酷炫的效果。



获取指南

  1. 一键启动:无需复杂配置,下载后解压直接点击 一键启动.exe,即可启动程序。
  2. 下载速度取决于您的网速,无需开通会员。
公  众  呀!
InnoTechX
ce73362d2c4a12a668c1b7c582713378.jpeg


发送

e0736fd5976002f33c738936f116d056.jpeg



前置条件

此一键包win10、win11可用,并且需要配备至少8GB显存的 NVIDIA 显卡。cuda版本需要大于等于12.1,如果cuda版本小于12.1,可以按照教程按装指定版本的cuda [https://www.zhisk.com/1154.html]。

cuda查询cmd指令

nvcc –version

或:

nvidia-smi

(请注意某些 9XX 或 10XX 或 20XX GPU 可能无法正常运行,具体自测)



使用步骤

  1. 下载并解压整合包到本地目录。
  2. 进入目录后,点击 一键启动.exe 启动程序。
  3. 注意:程序运行期间,请勿关闭 CMD 命令窗口。
c4a2a9fef41da2549213223973b7cbc0.jpeg

点击启动后会自动打开网页跳转到 http://localhost:7860/ 没有就自行复制到浏览器打开

13e570444ba6a543bee743a1e97d3175.jpeg

只需要简单描述一下你想要绘画的内容,中文和英语都可以,submit点击提交,等待左侧Render the Image!按钮出现,再次点击Render the Image!就会开始绘画了 7a60e9b6e03c092a2a2bff0bd5ecbc81.jpeg

生成结果

70ac0ceacd885fa9f9433ed27e1a8034.jpeg

你也可以将已经生成的视觉内容的关键词复制到Stable Diffusion中去绘画,比如我随便找了一个在线Stable Diffusion平台

将tags内容复制过去

7bdac26b3560caad30d2226ec557526f.jpeg

0533dd559f546f09b783f7457be602ce.jpeg

这平台免费的还要排队,无语,第一次生成等了半天,还给我吃了。

f7cbacb3b3f96639d545c00ea3671c4e.jpeg

6bc6b987e4258e63dafa18569238c5c9.jpeg

再次排队后生成,再等待了九九八十一分钟后,终于出图了。

cedbb6db8b4e60491b80a65a7ebfe8fb.jpeg


真是受不了这平台,等待太慢。共用GPU服务器资源还是垃圾,自己显卡好情愿用自己电脑跑。


下期文章还是出一个Stable Diffusion的极简中文离线整合包以及优质真人模型推荐。



标签:Diffusion,Stable,AI,Omost,一键,生成,提示,图像,言出法随
From: https://blog.csdn.net/m0_72580657/article/details/141861507

相关文章

  • HivisionIDPhotos :一款开源的轻量级且高效的AI证件照制作工具
    HivisionIDPhotos是一款开源的轻量级且高效的AI证件照制作工具,它通过AI算法实现了对多种用户拍照场景的识别、抠图以及证件照生成。这款工具能够根据不同的尺寸规格生成标准证件照和排版照,适用于护照、签证等多种用途。HivisionIDPhotos的主要特点包括轻量级抠图、生成标准证......
  • “言出法随”最懂你的AI绘画工具,只需简单描述,无需复杂繁琐关键词、一键整合包教程
    2024年,AI绘画技术已经日新月异,但仍有不少工具依赖于关键词描述,无论是Midjourney还是StableDiffusion,都需要用户提供详细的关键词描述。尽管聪明的用户可以借助大语言模型(如GPT-4)自动生成关键词,但这仍旧不是最直观的方式。今天,我们要介绍的是Omost——一个真正理解你的AI绘画工具......
  • 你的AI绘画工具SD该更新啦!6款超好用的SDXL负面提示词Embedding模型,让你的出图效果好上
    大家好,我是强哥AI绘画SDXL1.0模型发布以来,优质的SDXL大模型不断涌现,让图像的生成质量越来越高。但版本迭代后,之前的SD1.5的负面提示词Embedding并不能和SDXL大模型配合使用,而每次都输入一大串的反向提示词又实在麻烦。所以今天就给大家推荐6款可以配合SDXL......
  • L1-064 估值一亿的AI核心代码 分数 20
    测试点5是混过去的,已知测试点5只涉及大小写转换,n=3,第一个句子长度为奇数#include<bits/stdc++.h>usingnamespacestd;boolis_biaodian(charc){if(c>='a'&&c<='z'||c>='A'&&c<='Z'||c>='......
  • 专业级语义搜索优化:利用 Cohere AI、BGE Re-Ranker 及 Jina Reranker 实现精准结果重
    专业级语义搜索优化:利用CohereAI、BGERe-Ranker及JinaReranker实现精准结果重排1.简介1.1RAG在说重排工具之前,我们要先了解一下RAG。检索增强生成(RAG)是一种新兴的AI技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。基本的RAG应用包括四个关......
  • 专业级语义搜索优化:利用 Cohere AI、BGE Re-Ranker 及 Jina Reranker 实现精准结果重
    专业级语义搜索优化:利用CohereAI、BGERe-Ranker及JinaReranker实现精准结果重排1.简介1.1RAG在说重排工具之前,我们要先了解一下RAG。检索增强生成(RAG)是一种新兴的AI技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。基本的RAG应用包括四个关......
  • Project 1: Specification for Automail
    Project1:SpecificationforAutomailBackground:AutomailDeliveringSolutionsInc.(DS)hasrecentlydevelopedandprovidedaRoboticMailDeliverysystemcalledAutomailtothemarket.Automailisanautomatedmailsortinganddeliverysystemdesigned......
  • 基于ChatTTS与zhipuai虚拟聊天助手(demo)
        demo采用的是streamlit,首先可以是能进行文字沟通,然后ai能够返回语音。正好streamlit中有streamlit.audio可以播放语音。所以剩下的就是如何将输入输出串起来,能够被streamlit.write。虚拟聊天助手的具体思路可以参考上篇文章baseline基于ChatTTS与zhipuai虚拟聊天助......
  • DNF85 仿官复古版单机安装教程 + 虚拟机一键端
    前言今天给大家带来一款单机游戏的架设:地下城与勇士85仿官复古版单机安装。另外:本人承接各种游戏架设(单机+联网)本人为了学习和研究软件内含的设计思想和原理,带了架设教程仅供娱乐。教程是本人亲自搭建成功的,绝对是完整可运行的,踩过的坑都给你们填上了。如果你是小白也没问......
  • 西游再现,函数计算一键部署 Flux 超写实文生图模型部署
    从花果山的灵石出世,到取经路上的九九八十一难,再到大闹天宫的惊心动魄……这些耳熟能详的西游场景,如今都能通过Flux模型,以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的flux.1-dev-fp8大模型,搭配Lora模型,无需复杂的配置,一键部署,你就能成为这场视觉盛宴的创造者......