首页 > 其他分享 >【AI绘画】Alpha-VLLM 的 Lumina-Next:新一代图像生成器

【AI绘画】Alpha-VLLM 的 Lumina-Next:新一代图像生成器

时间:2024-11-18 12:19:04浏览次数:3  
标签:T2I Lumina AI torch 生成器 diffusers Next conda

在这里插入图片描述

简介

Lumina-Next-T2I 是在 Lumina-T2I 成功基础上发展起来的尖端图像生成模型。它采用了带有 2B 参数模型的 Next-DiT 和 Gemma-2B 文本编码器,推理速度更快,生成样式更丰富,并增强了多语言支持。

模型架构

Lumina-Next-T2I 的生成模型建立在 Next-DiT 骨干之上,文本编码器是 Gemma 2B 模型,而 VAE 则使用由 stabilityai 微调的 sdxl 版本。

  • 生成模型: Next-DiT
  • 文本编码器 Gemma-2B
  • VAE: sdxl-vae

新闻和更新

  • 2024 年 5 月 12 日,Lumina-Next-T2I 型号发布,为图像生成提供了更快更低的内存使用率。

安装

  1. 创建 conda 环境并安装 PyTorch
    注意:您可能需要根据驱动程序版本调整 CUDA 版本
conda create -n Lumina_T2X -y
	conda activate Lumina_T2X
	conda install python=3.11 pytorch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 pytorch-cuda=12.1 -c pytorch -c nvidia -y
  1. 安装依赖
pip install diffusers huggingface_hub
pip install flash-attn --no-build-isolation
  1. Diffusers推理
from diffusers import LuminaText2ImgPipeline
import torch

pipeline = LuminaText2ImgPipeline.from_pretrained("/path/to/ckpt/Lumina-Next-SFT-diffusers", torch_dtype=torch.bfloat16).to("cuda")

# or you can download the model using code directly
# pipeline = LuminaText2ImgPipeline.from_pretrained("Alpha-VLLM/Lumina-Next-SFT-diffusers", torch_dtype=torch.bfloat16).to("cuda")

image = pipeline(prompt="Upper body of a young woman in a Victorian-era outfit with brass goggles and leather straps. "
                        "Background shows an industrial revolution cityscape with smoky skies and tall, metal structures").images[0]

鉴赏效果

在这里插入图片描述

A winter landscape with a frozen lake, snow-covered pine trees, and a small cabin with smoke coming out of the chimney.

在这里插入图片描述

An astronaut standing on a moonlit alien planet, with purple mountains and two large moons in the sky.

在这里插入图片描述

A rustic farmhouse kitchen with a wooden table, a bowl of fresh apples, and a cat curled up on a chair.

在这里插入图片描述

This is the Lumina output, and I wanted to show it because it was cartoony

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。点赞并关注,获取最新科技动态,不落伍!

标签:T2I,Lumina,AI,torch,生成器,diffusers,Next,conda
From: https://blog.csdn.net/weixin_41446370/article/details/143849360

相关文章

  • toolchain build host target
    一个程序开发完成以后,对源代码进行编译,将编译后的文件发布出去形成所谓的各个平台的安装版本(非开源的都是这么干的,开源的也可以这样编译后不同运行平台的编译版本),这就是所谓的交叉编译。下面介绍有关这平台相关性的选项。  --build=BUILD  configureforbuildingonBU......
  • 普通人如何使用 AI? | AI 使用入门
    在当今时代,人工智能(AI)已经逐渐渗透到我们生活的各个角落,为我们的工作和生活带来了诸多便利。那么,作为普通人,我们该如何使用AI呢?本文将为你提供一份AI使用入门指南。一、了解AI的基本概念和功能(一)什么是AIAI是人工智能(ArtificialIntelligence)的英文缩写,它是一门......
  • AI多模态的5大核心关键技术,让高端制造实现智能化管理
    结合思通数科的大模型应用场景,可以通过AI技术解析高端制造业的复杂设备与文档数据,自动化地将大型零件、机械图纸、操作手册等文档结构化。大模型能够识别、拆解并分类零部件及其维修保养方法,建立零件与耗材的关系网络,构建出一个庞大的数据库。这种基于多模态技术和语义理解的能力,......
  • 如何看待AI技术的应用前景
    AI技术的应用前景AI技术的广泛应用AI技术的应用前景非常广阔,其影响和潜力正在迅速扩展到各个领域。从现有的证据来看,AI技术不仅在现有领域中发挥着重要作用,还在不断开拓新的应用场景。AI技术正在改变企业的运营、创新和竞争方式。随着2024年的临近,AI技术的进步将重新定义企业......
  • 【tokenization分词】WordPiece, Byte-Pair Encoding(BPE), Byte-level BPE(BBPE)的原
    目录前言1、word(词粒度)2、char(字符粒度)3、subword(子词粒度)WordPieceByte-PairEncoding(BPE)Byte-levelBPE(BBPE)总结前言Tokenization(分词)在自然语言处理(NLP)的任务中是最基本的一步,将文本处理成一串tokens用于后续的处理,把文本处理成token有一系列的......
  • 上海AI Lab Mono-InternVL环境搭建&推理测试
    ​引子        原生多模态大模型性能瓶颈,迎来新突破!上海AILab代季峰老师团队,提出了全新的原生多模态大模型Mono-InternVL。与非原生模型相比,该模型首个单词延迟最多降低67%,在多个评测数据集上均达到了SOTA水准。OK,那就让我们开始吧。一、模型介绍        将......
  • langchain long term memory
    Messagehistorieshttps://python.langchain.com/docs/integrations/memory/众多数据库支持。 redis数据库https://www.cnblogs.com/mangod/p/18243321fromlangchain_community.chat_message_historiesimportRedisChatMessageHistoryfromlangchain_core.promptsimpo......
  • 百度发布“秒哒”,AI真的可以取代程序员吗?
    2024年11月12日,百度公司董事长李彦宏在2024百度世界大会上宣布推出“秒哒”应用,预计于2025年1月初正式发布。秒哒的主要特性介绍为:“秒哒”由大模型和智能体组成,是多智能体协作工具。包括无代码的编程、多智能体的协作,以及规模化地调用各种工具的能力。“秒哒”跟现在市面......
  • JavaScript中的迭代器和生成器
    迭代器和生成器迭代器在JavaScript中迭代器是一个对象,它是一个使用了next()方法实现了迭代器协议的的对象(方法名是约定的,必须是next,不能是其他的)。JavaScript中可以使用迭代器的常见对象有Array、Map、Set、String。我们可以通过Symbol.iterator属性获取当前实例的迭代器......
  • AI大模型如何重塑软件开发
    随着AI技术的不断发展,AI大模型正在重塑软件开发流程,从代码自动生成到智能测试,未来,AI大模型将会对软件开发者、企业,以及整个产业链都产生深远的影响。欢迎与我们一起,从AI大模型的定义、应用场景、优势以及挑战等方面,探讨AI是如何重塑软件开发的各个环节以及带来的新......