diffusion常见VAE使用及其训练

时间：2024-03-15 23:02:21浏览次数：28

标签：diffusion EMA 训练 f8 VAE ft MSE vae

kl-f8-VAE

Latent Diffusion Models 包含很多Kl8/4...的VAE，这些VAE可以使用自己的数据集进行预训练：

所用损失函数： L1 + LPIPS

网址：GitHub - CompVis/latent-diffusion: High-Resolution Image Synthesis with Latent Diffusion Models

f8-ft-EMA 、f8-ft-MSE

没有发现训练代码...

他俩与“kl-f8-VAE”的区别：

kl-f8-VAE是在“ImageNet”进行训练的，而f8-ft-EMA /f8-ft-MSE它们是为了增强stable diffusion人脸的训练

1）. sd-vae-ft-ema

- trained on LAION-aesthetics+human：The first, ft-EMA, was resumed from the original checkpoint, trained for 313k steps and uses EMA weights. It uses the same loss configuration as the original checkpoint (L1 + LPIPS).

stabilityai/sd-vae-ft-ema（https://huggingface.co/stabilityai/sd-vae-ft-ema）

2）. sd-vae-ft-mse

- continue training on same dataset but in such a way to make the outputs more smooth：The second, ft-MSE, was resumed from ft-EMA and uses EMA weights and was trained for another 280k steps using a different loss, with more emphasis on MSE reconstruction (MSE + 0.1 * LPIPS). It produces somewhat ``smoother'' outputs. The batch size for both versions was 192 (16 A100s, batch size 12 per GPU).

stabilityai/sd-vae-ft-mse（https://huggingface.co/stabilityai/sd-vae-ft-mse）

在上面的链接中有这两个模型在辅助生成图片时的效果对比。就使用经验而言，EMA 会更锐利、MSE 会更平滑。

标签：diffusion,EMA,训练,f8,VAE,ft,MSE,vae
From： https://blog.csdn.net/weixin_43135178/article/details/136614403

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的花卉检测与识别系统（附完整资源+PySide6界面+训练代
摘要：本篇博客介绍了一种基于深度学习的花卉检测与识别系统，并详细展示了其实现代码。系统采取先进的YOLOv8算法，并与YOLOv7、YOLOv6、YOLOv5等早期版本进行了比较，展示了其在图像、视频、实时视频流及批量文件中识别花卉的高准确度。文章深入阐释了YOLOv8的工作机制，并配备了相应的Pyt......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的火焰检测系统（Python+PySide6界面+训练代码）
摘要：本研究详述了一种采用深度学习技术的火焰检测系统，该系统集成了最新的YOLOv8算法，并与YOLOv7、YOLOv6、YOLOv5等早期算法进行了性能评估对比。该系统能够在各种媒介——包括图像、视频文件、实时视频流及批量文件中——准确地识别火焰目标或着火点等。文章深入阐述了YOLOv8算法......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的火焰与烟雾检测系统详解（深度学习模型+UI界面升级版
摘要：本研究详细介绍了一种集成了最新YOLOv8算法的火焰与烟雾检测系统，并与YOLOv7、YOLOv6、YOLOv5等早期算法进行性能评估对比。该系统能够在包括图像、视频文件、实时视频流及批量文件中准确识别火焰与烟雾。文章深入探讨了YOLOv8算法的原理，提供了Python实现代码、训练数据集，以及......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的番茄成熟度检测系统（Python+PySide6界面+训练代码）
摘要：开发番茄成熟度检测系统对于提高农业产量和食品加工效率具有重大意义。本篇博客详细介绍了如何利用深度学习构建一个番茄成熟度检测系统，并提供了完整的实现代码。该系统基于强大的YOLOv8算法，并结合了YOLOv7、YOLOv6、YOLOv5的对比，展示了不同模型间的性能指标如mAP、F1Score等......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的癌症图像检测系统（深度学习模型+UI界面代码+训练数
摘要：本文介绍了一种基于深度学习的癌症图像检测系统的代码，采用最先进的YOLOv8算法并对比YOLOv7、YOLOv6、YOLOv5等算法的结果，能够准确识别图像、视频、实时视频流以及批量文件中的摘要：本篇博客深入介绍了如何借助深度学习技术开发癌症图像检测系统，以提高医疗诊断的精度和速度。系......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的车型识别与计数系统（深度学习模型+UI界面代码+训练
摘要：开发车型识别与计数系统对于提高交通管理效率和城市规划具有重要意义。本篇博客详细介绍了如何利用深度学习构建一个车型识别与计数系统，并提供了完整的实现代码。该系统基于强大的YOLOv8算法，并结合了YOLOv7、YOLOv6、YOLOv5的对比，给出了不同模型之间的性能指标如mAP、F1Score......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的行人车辆检测与计数（Python+PySide6界面+训练代码）
摘要：开发行人车辆检测与计数系统对于提升城市交通管理和监控系统的效率至关重要。本篇博客详细介绍了如何利用深度学习构建一个行人车辆检测与计数系统，并提供了完整的实现代码。该系统基于强大的YOLOv8算法，并结合了YOLOv7、YOLOv6、YOLOv5的对比，给出了不同模型之间的性能指标如mAP......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的教室人员检测与计数（Python+PySide6界面+训练代码）
摘要：开发教室人员检测与计数系统对于优化教学资源和提升教学效率具有重要意义。本篇博客详细介绍了如何利用深度学习构建此系统，并提供了完整的实现代码。该系统基于强大的YOLOv8算法，并对比了YOLOv7、YOLOv6、YOLOv5的性能，展示了不同模型的mAP、F1Score等性能指标。文章深入探讨了......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的夜视行人检测系统（Python+PySide6界面+训练代码）
摘要：开发高效的夜视行人检测系统对于提升夜间安全和监控效能至关重要。本篇博客详尽介绍了如何利用深度学习技术搭建一个夜视行人检测系统，并提供了完整的实现代码。本系统采用了先进的YOLOv8算法，并与YOLOv7、YOLOv6、YOLOv5进行了性能比较，展示了不同模型间的mAP、F1Score等关键性......
基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的舰船检测与识别系统（Python+PySide6界面+训练代码）
摘要：开发高级的舰船检测与识别系统对于提升海上安全监控和航运管理至关重要。本篇博客详细阐述了如何应用深度学习技术构建舰船检测与识别系统，并提供了完整的实施代码。本系统采用了性能强大的YOLOv8算法，并与YOLOv7、YOLOv6、YOLOv5进行了细致的性能对比，展示了不同模型的mAP、F1S......

diffusion常见VAE使用及其训练

kl-f8-VAE

f8-ft-EMA 、f8-ft-MSE

1）. sd-vae-ft-ema

2）. sd-vae-ft-mse

相关文章

赞助商

阅读排行