Datawhale X魔搭 AI夏令营

时间：2024-08-17 19:57:50浏览次数：17

标签：可图 AI 模型 Datawhale 生成文生 Kolors 夏令营

Datawhale X魔搭AI夏令营 AIGC方向Task02学习笔记

1.活动简介

从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动（ “AIGC”方向），基于魔搭社区 “ 可图Kolors-LoRA风格故事挑战赛 ” 开展的实践学习——

适合想 入门并实践 AIGC文生图、工作流搭建、LoRA微调 的学习者参与

学习内容提要：从通过代码实现AI文生图逐渐进阶，教程偏重图像工作流、微调、图像优化等思路，最后会简单介绍AIGC应用方向、数字人技术（选学）

2.理论部分

1.AI生图自破圈以来，被科研界、业界广泛关注，且引发了各大厂商的模型之战，如我们这次学习活动所需要用到的Kolors（可图）模型(点击即可跳转魔搭模型介绍页)，就是其中的一个产物——

Kolors（可图）模型(点击即可跳转魔搭模型介绍页) 是快手开源的文本到图像生成模型，该模型具有对英语和汉语的深刻理解，并能够生成高质量、逼真的图像。

代码开源链接：https://github.com/Kwai-Kolors/Kolors

模型开源链接：https://modelscope.cn/models/Kwai-Kolors/Kolors

技术报告链接：https://github.com/Kwai-Kolors/Kolors/blob/master/imgs/Kolors_paper.pdf

魔搭研习社最佳实践说明：https://www.modelscope.cn/learn/575?pid=543

2.过去文生图主要以 SD 系列基础模型为主，仅支持英文的prompt，但可图是支持中文的文生图模型，文生图的prompt格式较为固定，魔搭社区还开源了专门的各种风格的可图优质咒语书(点击即可跳转)，可以针对600+种不同风格，完善prompt，生成各种风格图片，可以在我们的学习当中使用——

3.实践部分

了解了理论之后，我们就开始实战——基于话剧的连环画制作

1.使用人工智能工具生成话剧并将其划分成八幕（我使用的是智谱，当然也可以使用通义、GPT等其他工具）

2.根据需求调整提示词

这一部分中大家可能会遇到人物不一致的问题，我通过查阅资料，这边给出一种解决方案：

prompt格式为：【明星A：明星B：小于1的一个系数（如0.4）】

理由：人工智能其实认识很多明星，我们可以使用这种提示词告诉人工智能先画40%的明星A再画60%的明星B，从而使生成的人物相似

最后展示我生成的八张图片：

最后提醒一下：图片生成具有强随机性，请大家耐心抽卡（我做了一个多小时才生成出这八张还不错的图片）

标签：可图,AI,模型,Datawhale,生成,文生,Kolors,夏令营
From： https://blog.csdn.net/2401_84407045/article/details/141202790

Datawhale X魔搭 AI夏令营第四期 AIGC方向 task03笔记
一、ComfyUI 1、这次课首先介绍了ComfyUI，什么是ComfyUI？ComfyUI主要用于生成图像。它采用基于节点的工作流程，为用户提供更大的控制力和灵活性。用户可以通过连接不同的节点来直观地构建工作流程，并且允许对图像进行高级定制。用户还可以拖放节点、轻松调整参数，并实时查看......
SciTech-BigDataAIML-LLM-Transformer Series-Self-Attention：由Dot-Product(向量点乘)
SelfAttention:由Dot-Product(向量点乘)说起https://lulaoshi.info/deep-learning/attention/transformer-attention.html#self-attention-从向量点乘说起Transformer[1]论文提出了一种Self-Attention(自注意力机制),Self-Attention的最核心的公式为：\(\large\begin{align*}......
【网络流模板题 EK增广路】luogu P2740 [USACO4.2] 草地排水Drainage Ditches)
[P2740USACO4.2]草地排水DrainageDitches)大意:网络流模板做法:EK增广路#include<cstdio>#include<queue>#include<deque>#include<stack>#include<map>#include<cmath>#include<algorithm>#include<iostream>#include......
NP2011-SW-23-DHCP Snooping_DAI_IP源保护
dhcp欺骗dhcpsnooping原理：一启用后，可以将交换机的端口分为trusted接口和untrusted接口，默认在交换机上启用后，所有接口变为untrusted接口，需要手工设置trunsted接口。对于untrusted接口，只能收到dhcp请求消息，drop掉dhcp的相应消息，并且也不会向这个接口发送出dhcp的请求消息。对于......
使用RAG-Chroma和LangChain构建强大的问答系统
标题:使用RAG-Chroma和LangChain构建强大的问答系统内容:使用RAG-Chroma和LangChain构建强大的问答系统引言在人工智能和自然语言处理领域,检索增强生成(Retrieval-AugmentedGeneration,RAG)技术正在迅速崛起。本文将介绍如何使用RAG-Chroma模板和LangChain框架构建......
AI时代的程序员：如何在变革中保持竞争力
随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的接连涌现，AI辅助编程工具正以惊人的速度改变着程序员的工作方式。这些工具不仅可以加速代码编写和调试，还能帮助开发者解决复杂问题。AI的崛起引发了广泛的讨论：程序员是否会被AI取代？还是说，AI将成为程序员工......
sleep()和wait()区别
importlombok.*;/*o.wait();释放锁...Thread.sleep(6000);6004...**/publicclassT{@SneakyThrowspublicstaticvoidmain(String[]args){Objecto=newObject();newThread(()->{synchronized(o)......
Datawhale X 魔搭 AI夏令营 AIGC方向 Task3
ComfyUI简介ComfyUI是一个基于节点工作流稳定扩散算法的图形界面，它通过将稳定扩散的流程巧妙分解成各个节点，成功实现了工作流的精准定制和可靠复现。基本概念节点工作流：ComfyUI的核心是基于节点式的工作流程，这种设计允许用户将复杂的稳定扩散过程分解为多个可独立操作的节点，通......
Langchain pandas agent - Azure OpenAI account
Langchainpandasagent结合AzureOpenAI账户使用时，主要涉及到通过AzureOpenAI提供的自然语言处理能力，来操作pandasDataFrame或进行相关的数据处理任务。以下是关于这一结合使用的详细解析：一、Langchainpandasagent概述在LangChain中，Agent是一个核心概念，它代表了......
在亚马逊云科技上部署开源大模型并利用RAG和LangChain开发生成式AI应用
项目简介：小李哥将继续每天介绍一个基于亚马逊云科技AWS云计算平台的全球前沿AI技术解决方案，帮助大家快速了解国际上最热门的云计算平台亚马逊云科技AWSAI最佳实践，并应用到自己的日常工作里。本次介绍的是如何在亚马逊云科技上利用SageMaker机器学习服务部署开源大模型，使用La......

Datawhale X魔搭 AI夏令营