目前lora训练有很多很好的打标工具,这次尝试使用comfyui工作流进行打标,使用的模型是MiniCPMv2.6,面壁者的小刚炮
工作流地址
https://github.com/pzc163/Comfyui_MiniCPMv2_6-prompt-generator
安装与准备
-
安装插件:在ComfyUI Manager中搜索并安装“MiniCPMv2_6-prompt-generator”插件,安装后重启。
-
下载模型:将模型下载至
ComfyUI/custom_nodes/
目录下。模型地址:
https://huggingface.co/pzc163/MiniCPMv2_6-prompt-generator
这是一个基于 MiniCPM-V 2.6 的 int4 量化版本的提示生成模型微调。微调模型在 midjourney 提示数据集上进行训练,并使用 2 个 4090 24GB GPU 进行训练。 该模型使用 3000 多个样本进行训练,其中包含来自 Midjourney 的图像和提示,该模型可以为具有自然语言风格的图像生成短提示和长提示。它可以用于在 lora 训练时制作图像标签。 使用 int4 版本运行时将使用较低的 GPU 内存(约 7GB)。
工作流
该工作流能读取图片目录并生成相应的文本提示文件,支持两种打标方式:
短提示生成:
-
上传图片。
-
将
caption_method
设置为short_prompt
。
长提示生成:
-
上传图片。
-
将
caption_method
设置为long_prompt
。
这两种方式可以根据具体的LoRA训练需求灵活选择。该工具帮助快速生成自然语言风格的图像标签,非常适合高效打标。
谢谢你的关注和喜欢
标签:教程,prompt,训练,提示,ComfyUI,模型,生成,工作,打标 From: https://blog.csdn.net/m0_58477260/article/details/143736501