vae
  • 2024-09-22药物分子生成算法综述:从生成对抗网络到变换器模型的多样化选择
    创作不易,您的打赏、关注、点赞、收藏和转发是我坚持下去的动力!基于已有的药物数据生成新的药物分子是一项复杂的任务,通常涉及到生成模型和机器学习算法。以下是一些常用的算法和方法:1.生成对抗网络(GANs)特点:由生成器和判别器两个神经网络组成,生成器生成新分子,判别
  • 2024-09-14Open-Sora代码详细解读(2):时空3D VAE
    DiffusionModels视频生成前言:目前开源的DiT视频生成模型不是很多,Open-Sora是开发者生态最好的一个,涵盖了DiT、时空DiT、3DVAE、RectifiedFlow、因果卷积等Diffusion视频生成的经典知识点。本篇博客从Open-Sora的代码出发,深入解读背后的原理。目录3DVAE原理代码剖析
  • 2024-09-10AE & VAE
    一、AE自编码器自编码器模型结构图编码器网络可以将原始高维网络转换为潜在的低维代码解码器网络可以从低维代码中恢复原始数据,并且可能具有越来越大的输出层自编码器针对从代码重建数据进行了显式优化。一个好的中间表示不仅可以捕获潜在变量,而且有利于完整的解
  • 2024-08-26第十五期 02 Diffusion扩散模型
    一:马尔可夫链(一)什么是马尔可夫链又称离散时间马尔可夫链,那就是某一时刻状态转移的概率只依赖于它的前一个状态。举个简单的例子,假如每天的天气是一个状态的话,那个今天是不是晴天只依赖于昨天的天气,而和前天的天气没有任何关系。马尔科夫链在很多时间序列模型中得到广泛的应用
  • 2024-08-17“Datawhale X 魔搭 AI夏令营”Day03
    一、打卡Datawhale二、学习1、ComfyUI(1)、什么是ComfyUIGUI是"GraphicalUserInterface"(图形用户界面)的缩写。简单来说,GUI就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI是GUI的一种,是基于节点工作的用户界面,主要用于操作图像的生成技术,Comfy
  • 2024-08-17将VAE用于时间序列:生成时间序列的合成数据
    变分自编码器(VAEs)是一种生成式人工智能,因其能够创建逼真的图像而备受关注,它们不仅可以应用在图像上,也可以创建时间序列数据。标准VAE可以被改编以捕捉时间序列数据的周期性和顺序模式,然后用于生成合成数据。本文将使用一维卷积层、策略性的步幅选择、灵活的时间维度和季节性
  • 2024-08-06一维变分自动编码器的错误重建
    我想实现一个变分自动编码器,它将一维Numpy数组(声音文件的波形)作为输入。运行该文件不会引发错误,但损失收敛到2000左右,并且重建看起来像纯粹的噪声。我使用了Goffinet等人的代码并尝试重写它以采用一维输入,因为我之前使用过他们的(二维)VAE。这是网络和转发功能的
  • 2024-08-01深度学习(RNN+VAE):高质量的音乐作品让音符飞舞起来
    深度学习在音乐生成领域有着广泛的应用,其中循环神经网络(RNN)和变分自编码器(VAE)是两种重要的模型。下面是这两种模型在音乐生成中的应用概述:1.循环神经网络(RNN)在音乐生成中的应用:序列建模:RNN特别适合处理序列数据,如音乐作品中的音符序列。它可以捕捉音乐中的时序依赖性,生成连
  • 2024-07-30关于Stable diffusion的各种模型,看这篇就可以了!
    大家好,这里是《Stablediffusion小白入门》系列的第3篇,主要是帮大家梳理下Stablediffusion里面的各种模型,模型在Stablediffusion中占据着至关重要的地位,不仅决定了出图的风格,也决定了出图质量的好坏。但在第一次接触SD的时候,我就被里面的模型搞到头大,不仅有多种模型后缀,
  • 2024-07-21生成模型---变分自编码器
    1.设计思路1.1自编码器基础自编码器(Autoencoder)是一种神经网络模型,由编码器和解码器组成。编码器将输入数据压缩成一个潜在空间的表示(即编码),解码器则将这种表示重构为原始数据。设定:输入数据为x
  • 2024-07-19腾讯开源可控视频生成框架 MimicMotion
    腾讯开源可控视频生成框架MimicMotion来源:投稿作者: 菠萝的海子2024-07-1617:01:19 4腾讯宣布开源可控视频生成框架MimicMotion,该框架可以通过提供参考人像及由骨骼序列表示的动作,来产生平滑的高质量人体动作视频。公告称,大量的实验结果和用户调研表明Mim
  • 2024-07-15用于变分自动编码器 (VAE) 的 Copula 变分贝叶斯算法(Matlab代码实现)
  • 2024-07-12VAE(Variational auto-encoder)
    1.VAE(Variationalauto-encoder)笔记来源及推荐文章:1.变分自编码器(一):原来是这么一回事2.变分自编码器(二):从贝叶斯观点出发3.变分自编码器(三):这样做为什么能成?4.变分自编码器(四):一步到位的聚类方案5.变分自编码器=最小化先验分布+最大化互信息6.变分自编码器(六):从几何
  • 2024-07-11图生图流程解析
    一、介绍本篇来介绍下图生图的流程,图生图只是在文生图基础上做了一点点的改动,再结合原理查看,你会发现和文生图类似。二、流程步骤回顾一下上一篇的文生图的完整流程采样器通过模型形成一个Latentspace我们输入的参数有textprompt,通过clip编码器,是由模型提供的,变成token
  • 2024-07-08生成扩散模型漫谈(二):DDPM = 自回归式VAE
    在文章《生成扩散模型漫谈(一):DDPM=拆楼+建楼》中,我们为生成扩散模型DDPM构建了“拆楼-建楼”的通俗类比,并且借助该类比完整地推导了生成扩散模型DDPM的理论形式。在该文章中,我们还指出DDPM本质上已经不是传统的扩散模型了,它更多的是一个变分自编码器VAE,实际上DDPM的原论文中也
  • 2024-07-08变分自编码器(六):从几何视角来理解VAE的尝试
    前段时间公司组织技术分享,轮到笔者时,大家希望我讲讲VAE。鉴于之前笔者也写过变分自编码器系列,所以对笔者来说应该也不是特别难的事情,因此就答应了下来,后来仔细一想才觉得犯难:怎么讲才好呢? 对于VAE来说,之前笔者有两篇比较系统的介绍:《变分自编码器(一):原来是这么一回事》和《变分
  • 2024-07-08变分自编码器(七):球面上的VAE(vMF-VAE)
    在《变分自编码器(五):VAE+BN=更好的VAE》中,我们讲到了NLP中训练VAE时常见的KL散度消失现象,并且提到了通过BN来使得KL散度项有一个正的下界,从而保证KL散度项不会消失。事实上,早在2018年的时候,就有类似思想的工作就被提出了,它们是通过在VAE中改用新的先验分布和后验分布,来使得KL散
  • 2024-07-08UniVAE:基于Transformer的单模型、多尺度的VAE模型
    大家都知道,Transformer的$\mathscr{O}(n^2)$复杂度是它的“硬伤”之一。不过凡事有弊亦有利,$\mathscr{O}(n^2)$的复杂度也为Transformer带来很大的折腾空间,我们可以灵活地定制不同的attentionmask,来设计出不同用途的Transformer模型来,比如UniLM、K-BERT等。本文介绍笔者构思的一
  • 2024-07-07(三)变分自动编码器
    过去虽然没有细看,但印象里一直觉得变分自编码器(VariationalAuto-Encoder,VAE)是个好东西。于是趁着最近看概率图模型的三分钟热度,我决定也争取把VAE搞懂。于是乎照样翻了网上很多资料,无一例外发现都很含糊,主要的感觉是公式写了一大通,还是迷迷糊糊的,最后好不容易觉得看懂了,再去看看
  • 2024-07-03SD中的VAE,你不能不懂
    什么是VAE?VAE,即变分自编码器(VariationalAutoencoder),是一种生成模型,它通过学习输入数据的潜在表示来重构输入数据。在StableDiffusion1.4或1.5模型中,通过VAE对模型进行部分更新,以提升模型渲染眼睛的能力。通过这种更新,模型在生成图像时能够更准确地捕捉和再现眼睛的细节,从
  • 2024-06-21Unet已死,Transformer当立!详细解读基于DiT的开源视频生成大模型EasyAnimate
    DiffusionModels视频生成-博客汇总前言:最近阿里云PIA团队开源了基于DiffusionTransformer结构的视频生成模型EasyAnimate,并且提出了专门针对视频的sliceVAE,对于目前基于Unet结构的视频生成最好如SVD形成了降维打击,不论是生成质量、生成时长上都是遥遥领先。这篇博客详细
  • 2024-06-15【第9章】“基础工作流”怎么用?(图生图/局部重绘/VAE/更多基础工作流)ComfyUI基础入门教程
  • 2024-06-02九天毕昇深度学习平台 | 升级python版本3.8
    下载3.8版本https://www.python.org/ftp/python/3.8.18/Python-3.8.18.tgz解压!tar-xvfPython-3.8.18.tgz在终端配置./configure#(可选--prefix=/usr/local/python3.8.18)makesudomakeinstall不指定--prefix时,configure会将可执行文件安装到/usr/local/bin,库
  • 2024-05-14大模型中的VAE
    俗称外挂模型在大型神经网络模型中,VAE指的是变分自动编码器(VariationalAutoencoder),是一种用于生成模型的神经网络结构。VAE结合了自动编码器(Autoencoder)和概率推断的思想,通过学习数据的潜在表示来生成新的数据样本。在VAE中,编码器将输入数据映射到一个潜在空间中的概率分布,通
  • 2024-03-25快速了解 变分自编码器 VAE
    概述变分自编码器(VariationalAuto-Encoders,VAE)是自编码器AE的变体,由Kingma等人于2014年提出的生成式网络结构。以概率的方式描述潜在空间,在数据生成方面潜力巨大。自编码器AE自编码器(Auto-Encoder,AE),是一种无监督式学习模型。它可以将输入\(X\)映射为数据量小得多的潜