首页 > 其他分享 >扩散模型学习顺序推荐

扩散模型学习顺序推荐

时间:2024-10-24 15:18:24浏览次数:7  
标签:顺序 Models 模型 Flow 学习 DDPM 扩散

关注B站可以观看更多实战教学视频:hallo128的个人空间

扩散模型学习顺序推荐

目录

1.扩散模型学习目录

  1. 基础
  • (1)从同一视角理解扩散模型(VAE)

  • (2)DDPM -> DDIM

  1. 分数匹配(SMLD)
  • 朗之万动力学公式(Langevin Dynamics)-SMLD【了解】
  1. 基于SDE的生成模型(随机微分方程)
  • (1)SDE

  • (2)EDM

  • (3)Consistency Models

  1. 流匹配(Flow)
  • ODE(常微分方程)-> normalizing flow -> Flow Matching -> Rectified Flow

2.学习顺序推荐

  1. 基础部分
    非常建议大家先从VAE(变分自动编码器)到DDPM,VAE可以帮助大家了解扩散目标提出的思路。DDPM是扩散模型最经典和基础的,务必了解。在前期了解DDIM可以先跳过,可以在学了部分后面的内容再了解。

  2. 不同改进方向
    剩下这3块是不同的方向,可以任选一块开始。每块关键的学习内容,见上述。

3.扩散模型论文精读

目前,我已经进行了不少扩散模型的论文精读,涉及到的论文系列如下,大家也可以按照这个顺序来学习。后续有时间,我再把手写的笔记整理为电子版,再分享给大家。

1.Understanding Diffusion Models: A Unified Perspective(从统一视角理解扩散模型)

2.Denoising Diffusion Probabilistic Models(DDPM)

3.DENOISING DIFFUSION IMPLICIT MODELS(DDIM)

4.Tutorial on Diffusion Models for Imaging and Vision(朗之万动力学公式-SMLD)

5.Score-Based Generative Modeling through Stochastic Differential Equations(SDE)

6.Elucidating the Design Space of Diffusion-Based Generative Models(EDM)

7.Flow Matching For Generative Modeling(Flow)

4. 代码实战

更多学习内容,看我个人主页:hallo128的个人空间

标签:顺序,Models,模型,Flow,学习,DDPM,扩散
From: https://blog.csdn.net/weixin_43633501/article/details/143194376

相关文章

  • 上交2024最新-《动手学大模型》实战教程及ppt分享!
    这份完整版的《动手学大模型》实战教程及ppt已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】本课介绍今天分享一个上海交大的免费的大模型课程,有相关教程文档和Slides,目前是2.2K星标,还是挺火的!文末附本课ppt及实战教程免费下载......
  • 大模型分布式计算的优化方法思考
    转发请附原文链接:https://mp.weixin.qq.com/s/2Dox8nG2hKFQUfGoTvkNCQ一‍引言近年来,以ChatGPT、Sora为代表的通用生成式大模型的研究取得了显著进展。生成式大模型的参数规模已实现了从千万级别到万亿级别的飞跃,并朝着十万亿级别前进。由于大模型的参数规模巨大,单块GPU无法装......
  • Anthropic 升级版 Claude 3.5 Sonnet 模型:向类人电脑操控迈进?
    目录引言一、模型发展与新特性亮相二、编程能力与性能提升三、实际应用与行业探索四、安全性与可靠性考量五、模型的潜力与未来展望引言在人工智能的创新之路上,Anthropic公司再次成为焦点,其推出的升级版Claude3.5Sonnet模型引发了广泛关注与热议。一个核心问题......
  • [C++]在windows基于C++编程署yolov11-pose的openvino姿态估计模型cmake项目部署演示源
    【算法介绍】在Windows系统上,基于C++编程部署YOLOv11-Pose的OpenVINO姿态估计模型,可以通过CMake项目来实现。以下是简要介绍:首先,需要准备开发环境,包括安装OpenVINOToolkit、CMake、OpenCV和C++编译器(如GCC或MSVC)。OpenVINO是英特尔开发的一款用于优化和部署深度学习模型的工具套件......
  • [C++]在windows基于C++编程署yolov11-cls的openvino图像分类模型cmake项目部署演示源
    【算法介绍】在Windows系统上,基于C++编程部署YOLOv11-CLS的OpenVINO图像分类模型,可以通过CMake项目来实现。以下是简要介绍:首先,需要准备开发环境,包括安装OpenVINOToolkit、CMake、OpenCV和C++编译器(如GCC或MSVC)。OpenVINO是英特尔开发的一款用于优化和部署深度学习模型的工具套件,......
  • 开源模型应用落地-Qwen2.5-7B-Instruct与vllm实现离线推理-CPU版本
    一、前言   离线推理能够在模型训练完成后,特别是在处理大规模数据时,利用预先准备好的输入数据进行批量推理,从而显著提高计算效率和响应速度。通过离线推理,可以在不依赖实时计算的情况下,快速生成预测结果,从而优化决策流程和提升用户体验。此外,离线推理还可以降低云计算成本......
  • 2024最新最全AGI大模型资料包:学习路线+书籍+视频+实战+案例...
    一、基本概念GPT:GenerativePre-TrainingTransformer(生成式预训练模型)。生成式:内容实时生成。预训练:提前学习过大量知识。模型:算法。误解:ChatGPT是搜索引擎?ChatGPT不是搜索引擎,所有的结果都是ChatGPT通过给定的上下文逐字实时生成的。它能够创造不存在的文本......
  • 计算机毕业设计Spark+大模型某音视频情感分析 某音可视化 某音舆情监测 预测算法 某音
    《Spark+大模型抖音视频情感分析》开题报告一、研究背景与意义随着移动互联网和社交媒体的快速发展,短视频平台如抖音(TikTok)已成为全球范围内广受欢迎的娱乐和信息获取渠道。用户在这些平台上发布的视频内容涵盖了娱乐、教育、新闻等各个领域,形成了海量的用户行为数据和视频内......
  • 计算机毕业设计Hadoop+大模型在线教育大数据分析可视化 学情分析 课程推荐系统 机器学
    一、研究背景和意义“互联网+”和大数据带来了网络教育的蓬勃发展,学习分析技术和自适应学习也在近年内得到了重大突破。在线教育是互联网技术与传统教育的结合,是当前中国教育信息化发展最快的领域,而当下最迫切的是有效整合教育资源和互联网技术,推出高互动性与个性化学习的在线......
  • 【有啥问啥】CLIP Adapter:提升视觉语言模型性能的利器
    CLIPAdapter:提升视觉语言模型性能的利器1.引言在视觉语言预训练领域,CLIP(ContrastiveLanguage-ImagePre-training)模型凭借其强大的跨模态表征能力,在多个任务上取得了显著成果。然而,如同其他预训练模型一样,CLIP在特定任务或领域上的性能仍有提升空间。为了应对这一挑战......