首页 > 其他分享 >diffusion扩散模型\datawhale组队学习——v3先运行一半

diffusion扩散模型\datawhale组队学习——v3先运行一半

时间:2023-10-23 18:23:19浏览次数:40  
标签:diffusion 采样 权重 32 模型 datawhale v3 步数

今天我们一起学习如何对模型微调和引导。

微调,用原模型,跑新数据,得到新输出。

引导,引导生成过程,改变输出结果。

 

作者之前用过sd模型,不同的采样方法在不同的采样步数下有不同的效果。首先采样步数并非越高越好或越低越好,有一个最佳使用区间,其次,不同采样方法有自己不同的最佳采样步数区间。

一般而言30左右大部分不会出错。

liblibai 搜索即可找到 

 

 

这是在sd模型里随便截的图,其包含的采样方法。本次实验所用的就是其中的DDIM模型。

 

 

本次数据结果,有点像,上述的采样步数的设置特点:

 

 

梯度积累

英文名:gradient accumulation

对于一批数据,假设有32个图像,可以将其分成4批8个图像,分别进行训练,但前3次不改变权重,第4次改变权重,同样可以实现迭代训练。这样可以减轻硬件负担,拿时间换可行性。

如何实现:

设置一个切分数,比如32个图分成4批,然后在权重更新之前加一句判断,仅当迭代次数是切分数的整数倍时更新权重。

 

 

经过一番努力(不停地点击运行代码),获得了一堆 奇怪的东西。

 

标签:diffusion,采样,权重,32,模型,datawhale,v3,步数
From: https://www.cnblogs.com/cosmowind/p/17783084.html

相关文章

  • JeecgBoot低代码平台 v3.6.0大版本发布—1024 程序员节快乐~
    项目介绍JeecgBoot是一款企业级的低代码平台!前后端分离架构SpringBoot2.x,SpringCloud,AntDesign&Vue3,Mybatis-plus,Shiro,JWT支持微服务。强大的代码生成器让前后端代码一键生成!JeecgBoot引领低代码开发模式(OnlineCoding->代码生成->手工MERGE),帮助解决Java项目70%的重复......
  • DataWhale DAY5 条件语句
    DataWhaleDAY5条件语句本次学习python中的条件语句。语法博客:https://www.cnblogs.com/hewo/p/17635277.html注意点位:1.减少炫技般的使用特殊方法的判断,从理解方面简化你的代码,对于python,没有必要时不用使用奇技淫巧优化。对于true/false和0/1:​ 首先,bool是int的......
  • OSPFV3
    配置流程1)启用ipv6系统视图模式:ipv62)启用端口link-localinterfaceg0/0/0ipv6enableipv6addressautolink-local3)创建ospfv3进程ospfv3100//100为进程号router-id1.1.1.1//唯一标识,不能有重复area0//进程规划为area0中4)将端口分配给area0interfaceLoopBack0ipv6enabl......
  • 短说PC端V3.1.0测试版发布|全新发布页、草稿箱、DIY门户首页新增页脚模块
    Hi大家好,我是给你们带来惊喜的运营小番茄。本期更新为短说PC端3.1.0测试版。此次V3.1.0版本带来的功能更新:①发布页全新设计;②草稿箱功能上线;③门户首页新增页脚模块。此外,优化了V3.0.1中的一些功能。一、新增功能01.PC端发布页全新设计保留原版动态类型内容支持快速发布的特点上,......
  • DataWhale DAY4 变量和函数
    DataWhaleDAY4变量和函数语法部分:https://www.cnblogs.com/hewo/p/17635277.html上文提到过的一点,python是动态数据类型,它没有传统的定义,自然就可以在赋值的时候,新值不一定要和旧值相同类型。老生常谈的问题:别乱用关键词,其实python的关键词啊什么的还好,基本上要先加上库,不......
  • diffusion扩散模型\datawhale组队学习——v2-抄别人代码还要矫情一下
    如果想学diffusion,又没有买纸质书咋办捏?datawhale为我们提供了大佬的中文笔记!学习来源:https://relph1119.github.io/my-team-learning/#/diffusion_models_learning51/ch03/ch03 甚至比看github的代码还方便。但是又不得不矫情一下,跟着做还有点问题。(小弟就不放大佬的笔记......
  • DataWhale DAY3 数据类型和操作
    DataWhaleDAY3数据类型和操作写在前面的:python基本操作统一放在https://www.cnblogs.com/hewo/p/17635277.html本文放一些有意思的东西首先味大的python提供了很是自动的动态类型。对象性质作为一个面向对象的语言,python具有很好的“面向对象友好”性质。举个例......
  • Pika v3.5.1发布!
    Pika社区很高兴宣布,我们今天发布已经过我们生产环境验证v3.5.1版本,https://github.com/OpenAtomFoundation/pika/releases/tag/v3.5.1 。该版本不仅做了很多优化工作,还引入了多项新功能。这些新功能包括动态关闭WAL、ReplicationID检测是否增量复制、在K8s环境上......
  • RX66T优化用于电机控制R5F566TFFGFP、R5F566TKGGFP、R5F566TKCGFP搭载第三代RXv3 CPU
    1、RX66T 框图2、描述RX66T32位MCU是基于第三代RXv3CPU内核的旗舰32位RXMCU系列中的首款产品。这些MCU优化用于电机控制,可满足实时性能和增强稳定性要求。这些特性帮助实现下一代智能工厂设备和智能家电中的逆变器控制。这些MCU还具有下一代设计中嵌入式AI所需的额外处理能......
  • DataWhale DAY2 基础语法1
    DataWhaleDAY2基础语法1今天主要是一点入门语法,import什么的,所以重点不放在上面。语法部分专门开一章:https://www.cnblogs.com/hewo/p/17635277.html关于浮点数精度问题,倒是有点意思。以前学c++的时候,尤其是计算几何的时候,经常设一个极小常量来比较,现在明白本质上是进......