【AI绘画】Alpha-VLLM 的 Lumina-Next：新一代图像生成器

时间：2024-11-18 12:19:04浏览次数：3

标签：T2I Lumina AI torch 生成器 diffusers Next conda

在这里插入图片描述

简介

Lumina-Next-T2I 是在 Lumina-T2I 成功基础上发展起来的尖端图像生成模型。它采用了带有 2B 参数模型的 Next-DiT 和 Gemma-2B 文本编码器，推理速度更快，生成样式更丰富，并增强了多语言支持。

模型架构

Lumina-Next-T2I 的生成模型建立在 Next-DiT 骨干之上，文本编码器是 Gemma 2B 模型，而 VAE 则使用由 stabilityai 微调的 sdxl 版本。

生成模型： Next-DiT
文本编码器 Gemma-2B
VAE: sdxl-vae

新闻和更新

2024 年 5 月 12 日，Lumina-Next-T2I 型号发布，为图像生成提供了更快更低的内存使用率。

安装

创建 conda 环境并安装 PyTorch
注意：您可能需要根据驱动程序版本调整 CUDA 版本。

conda create -n Lumina_T2X -y
	conda activate Lumina_T2X
	conda install python=3.11 pytorch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 pytorch-cuda=12.1 -c pytorch -c nvidia -y

安装依赖

pip install diffusers huggingface_hub
pip install flash-attn --no-build-isolation

Diffusers推理

from diffusers import LuminaText2ImgPipeline
import torch

pipeline = LuminaText2ImgPipeline.from_pretrained("/path/to/ckpt/Lumina-Next-SFT-diffusers", torch_dtype=torch.bfloat16).to("cuda")

# or you can download the model using code directly
# pipeline = LuminaText2ImgPipeline.from_pretrained("Alpha-VLLM/Lumina-Next-SFT-diffusers", torch_dtype=torch.bfloat16).to("cuda")

image = pipeline(prompt="Upper body of a young woman in a Victorian-era outfit with brass goggles and leather straps. "
                        "Background shows an industrial revolution cityscape with smoky skies and tall, metal structures").images[0]

鉴赏效果

在这里插入图片描述

A winter landscape with a frozen lake, snow-covered pine trees, and a small cabin with smoke coming out of the chimney.

在这里插入图片描述

An astronaut standing on a moonlit alien planet, with purple mountains and two large moons in the sky.

在这里插入图片描述

A rustic farmhouse kitchen with a wooden table, a bowl of fresh apples, and a cat curled up on a chair.

在这里插入图片描述

This is the Lumina output, and I wanted to show it because it was cartoony

感谢大家花时间阅读我的文章，你们的支持是我不断前进的动力。点赞并关注，获取最新科技动态，不落伍！

标签：T2I,Lumina,AI,torch,生成器,diffusers,Next,conda
From： https://blog.csdn.net/weixin_41446370/article/details/143849360

toolchain build host target
一个程序开发完成以后，对源代码进行编译，将编译后的文件发布出去形成所谓的各个平台的安装版本（非开源的都是这么干的，开源的也可以这样编译后不同运行平台的编译版本），这就是所谓的交叉编译。下面介绍有关这平台相关性的选项。 --build=BUILD configureforbuildingonBU......
普通人如何使用 AI？ | AI 使用入门
在当今时代，人工智能（AI）已经逐渐渗透到我们生活的各个角落，为我们的工作和生活带来了诸多便利。那么，作为普通人，我们该如何使用AI呢？本文将为你提供一份AI使用入门指南。一、了解AI的基本概念和功能（一）什么是AIAI是人工智能（ArtificialIntelligence）的英文缩写，它是一门......
AI多模态的5大核心关键技术，让高端制造实现智能化管理
结合思通数科的大模型应用场景，可以通过AI技术解析高端制造业的复杂设备与文档数据，自动化地将大型零件、机械图纸、操作手册等文档结构化。大模型能够识别、拆解并分类零部件及其维修保养方法，建立零件与耗材的关系网络，构建出一个庞大的数据库。这种基于多模态技术和语义理解的能力，......
如何看待AI技术的应用前景
AI技术的应用前景AI技术的广泛应用AI技术的应用前景非常广阔，其影响和潜力正在迅速扩展到各个领域。从现有的证据来看，AI技术不仅在现有领域中发挥着重要作用，还在不断开拓新的应用场景。AI技术正在改变企业的运营、创新和竞争方式。随着2024年的临近，AI技术的进步将重新定义企业......
【tokenization分词】WordPiece, Byte-Pair Encoding(BPE), Byte-level BPE(BBPE)的原
目录前言1、word(词粒度)2、char(字符粒度)3、subword(子词粒度)WordPieceByte-PairEncoding(BPE)Byte-levelBPE(BBPE)总结前言Tokenization（分词）在自然语言处理(NLP)的任务中是最基本的一步，将文本处理成一串tokens用于后续的处理，把文本处理成token有一系列的......
上海AI Lab Mono-InternVL环境搭建&推理测试
引子原生多模态大模型性能瓶颈，迎来新突破！上海AILab代季峰老师团队，提出了全新的原生多模态大模型Mono-InternVL。与非原生模型相比，该模型首个单词延迟最多降低67%，在多个评测数据集上均达到了SOTA水准。OK，那就让我们开始吧。一、模型介绍将......
langchain long term memory
Messagehistorieshttps://python.langchain.com/docs/integrations/memory/众多数据库支持。 redis数据库https://www.cnblogs.com/mangod/p/18243321fromlangchain_community.chat_message_historiesimportRedisChatMessageHistoryfromlangchain_core.promptsimpo......
百度发布“秒哒”，AI真的可以取代程序员吗？
2024年11月12日，百度公司董事长李彦宏在2024百度世界大会上宣布推出“秒哒”应用，预计于2025年1月初正式发布。秒哒的主要特性介绍为：“秒哒”由大模型和智能体组成，是多智能体协作工具。包括无代码的编程、多智能体的协作，以及规模化地调用各种工具的能力。“秒哒”跟现在市面......
JavaScript中的迭代器和生成器
迭代器和生成器迭代器在JavaScript中迭代器是一个对象，它是一个使用了next()方法实现了迭代器协议的的对象（方法名是约定的，必须是next，不能是其他的）。JavaScript中可以使用迭代器的常见对象有Array、Map、Set、String。我们可以通过Symbol.iterator属性获取当前实例的迭代器......
AI大模型如何重塑软件开发
随着AI技术的不断发展，AI大模型正在重塑软件开发流程，从代码自动生成到智能测试，未来，AI大模型将会对软件开发者、企业，以及整个产业链都产生深远的影响。欢迎与我们一起，从AI大模型的定义、应用场景、优势以及挑战等方面，探讨AI是如何重塑软件开发的各个环节以及带来的新......

【AI绘画】Alpha-VLLM 的 Lumina-Next：新一代图像生成器

简介

模型架构

新闻和更新

安装

鉴赏效果

相关文章

赞助商

阅读排行