首页 > 其他分享 >解决|diffusion transformer的环境安装慢问题、vae预训练模型下载失败问题、扩散模型的损失变化相关讨论

解决|diffusion transformer的环境安装慢问题、vae预训练模型下载失败问题、扩散模型的损失变化相关讨论

时间:2024-12-07 21:58:55浏览次数:5  
标签:diffusion loss transformer 模型 huggingface vae https 下载

目录

环境安装慢

这个问题有很多解决方法,我比较喜欢的是以下两种:

1、换源

我体验下来,清华源是最快最稳的,以安装timm为例,如下:
pip install timm -i https://pypi.tuna.tsinghua.edu.cn/simple

2、直接下载包到本地

可看参考链接,这里就不写了

vae预训练模型下载失败

一般是因为用的远程服务器的网络问题

1、去huggingface官网下载对应的模型

sd-vae-ft-ema网址:https://huggingface.co/stabilityai/sd-vae-ft-ema/tree/main
sd-vae-ft-mse网址:https://huggingface.co/stabilityai/sd-vae-ft-mse/tree/main
任选一个,就使用经验而言,EMA 会更锐利、MSE 会更平滑
下载config.jsondiffusion_pytorch_model.safetensors

2、传输至服务器的某个文件夹

3、在代码里直接加载下载好的模型:

local_vae_path = "/xxx/xxxx/"
vae = AutoencoderKL.from_pretrained(local_vae_path).to(device)

扩散模型的损失

可以看看参考链接中[1]和[2]两个讨论帖
总的来说,loss一开始下降很快,然后一直不降/平稳/小波动,是正常的。因为训练的时候每次是随机取的t,如果真的要看loss下降,要用采样得到的同一个t的loss作比较
此外,真正看模型是否在有效训练,还是得合成图像来看看

参考链接

[1]https://www.reddit.com/r/MachineLearning/comments/14wobo3/d_weird_loss_behaviour_with_difusion_models/
[2]https://www.zhihu.com/question/623044009
[3]https://ascend.github.io/docs/index.html
[4]https://blog.csdn.net/weixin_43135178/article/details/136614403
[5]https://blog.csdn.net/qq_43811536/article/details/141963366

标签:diffusion,loss,transformer,模型,huggingface,vae,https,下载
From: https://www.cnblogs.com/xjl-ultrasound/p/18589726

相关文章

  • 什么是隐马尔可夫模型
    隐马尔可夫模型(HiddenMarkovModel,HMM)隐马尔可夫模型(HMM)是一个统计模型,用来描述一个由不可观测(隐含)状态组成的马尔可夫过程,并且这些隐状态是通过可观测的变量(观测数据)来间接推测的。模型基本结构HMM是一个典型的概率图模型,由以下几个主要元素组成:隐状态集合(Hidden......
  • 【推荐算法】推荐系统中的单目标精排模型
    前言:推荐系统中模型发展较快,初学者【也就是笔者】很难对模型进行一个系统的学习。因此,这篇文章总结了王树森中的视频以及《深度学习推荐系统》中的单目标精排模型,绘制了一个单目标精排模型的思维导图来帮助初学者【笔者】更好的学习。在后面的学习过程中,会加入更多的单目标精排论......
  • BlueLM-V-3B:在手机上实现高性能多模态大型语言模型的创新路径
    目录一、前言二、方案概述三、技术创新1、动态图像分辨率优化2、硬件感知的系统优化3、令牌下采样4、模型量化与整体框架优化四、方案亮点五、性能展示1、宽松纵横比匹配效果2、不同基准测试中的表现3、部署效率评估六、应用场景1、智能语音助手2、图像识别与理解3、多......
  • 大模型真的带来了很多机会,关键是找准赛道
    先做个自我介绍:【如果咱们已经是老朋友了,这部分文字请直接跳过。】我是一位20年经验的编程老师傅。做过创业公司的CEO,也在上市企业担任过技术总监和首席专家。现在是中科院某重点实验室的高级工程师、研究组负责人。一直在这个领域深耕,我也深刻感受到随着软件系统越来越庞......
  • CycleNet模型训练笔记
    关于开始训练环境配置完成后在终端执行:pythonrun.py--is_training1--model_idtest01--modelCycleNet--dataETTh1run.py 是训练脚本--is_training1 表示这是一个训练过程--model_idtest01 指定了模型的ID,这个I用于记录或识别不同的训练过程--modelCycleNet ......
  • 【用于医学图像分割的轻量级边界感知Transformer】
    代码:BATFormer发表时间:2023发表期刊:IEEETMI这篇论文介绍了一种新的Transformer架构,称为BATFormer(Boundary-AwareLightweightTransformer),旨在改进医学图像分割的效率和效果。目标解决现有问题:传统的卷积神经网络(CNNs)由于感受野有限,在处理需要长距离依赖关系的任务时......
  • 腾讯终于出手了,发布的AI 视频生成模型!完全免费开源,生成质量高!HunyuanVideo AI文生视频
    腾讯发布超强AI视频生成模型!完全免费开源,生成质量极高!HunyuanVideo模型,一、下载链接1、邀请你一起来体验腾讯元宝的应用【AI视频】,让每个创意瞬间生动。点击以下链接:【抢先体验手机APP版本】:https://yuanbao.tencent.com/bot/app/share/chat/VR8O83A/videoTrafficDiv......
  • 助力花生作物智能化采摘,基于最新脉冲目标检测模型SpikeYOLO全系列【n/s/m/l/x】参数模
    秋天,是大地回馈辛勤耕耘者的季节,金黄的稻田、硕果累累的果园、还有那一片片郁郁葱葱的花生地,共同绘制出一幅幅丰收的画卷。对于农民而言,秋收不仅仅是收获的季节,更是他们与土地情感交织、汗水与希望交织的见证。花生,作为重要的经济作物之一,其采摘过程历来是农业生产中的重要环节......
  • 助力花生作物智能化采摘,基于最新融合超图计算目标检测模型HyperYOLO模型全系列【n/s/m
    秋天,是大地回馈辛勤耕耘者的季节,金黄的稻田、硕果累累的果园、还有那一片片郁郁葱葱的花生地,共同绘制出一幅幅丰收的画卷。对于农民而言,秋收不仅仅是收获的季节,更是他们与土地情感交织、汗水与希望交织的见证。花生,作为重要的经济作物之一,其采摘过程历来是农业生产中的重要环节......
  • 基于人工智能强化学习构建的高准确率角球预测模型
    一、引言在当代竞技体育数据分析领域,预测比赛中的特定事件已成为一项极具挑战性的任务。本文旨在探讨一种基于人工智能强化学习的高准确率角球预测模型。该模型通过深度学习算法捕捉比赛中的复杂模式,为专业编程师和数据分析爱好者提供了一种全新的视角来解读比赛。二、模型......