vqvae 论文阅读

时间：2023-11-25 23:11:05浏览次数：25

标签：概率 vqvae 阅读论文 encoder embedding 里面我们向量

https://arxiv.org/abs/1711.00937

直接3.1

首先我们定义一个嵌入空间. 是K*D维度的. K是离散空间向量的数量. D是每一个向量的维度.

所以e_i 中的i属于 1到K.

模型的输入是x, 也就是图片. 然后模型编码成一个z_e(x). 然后使用最近算法来得到 z_q

具体公式是下面1和2.

理解q这个分布.

给定x之后, 是一个0,1 离散分布. 对于下表 i 属于1到K进行分布. i 等于最接近 z_e=ej时候取1, 其他时候取0.

第一项代码里面是mse用来更新embedding里面的参数. (具体就是图片x 给定, x找到索引i, 然后i从embedding_sapce里面计算出z_q, 后续生成xhat, 所以学习之后的结果是embedding和decoder里面参数进行了更新,让索引i找到的向量很能最后生成xhat趋近于x)

第二项是用来训练encoder的. 从上面第一项分析看得出来, encoder参数没法更新. 所以这里面我们设计让z_e趋近于e, e是embedding得到的向量, 也就是我们如果训练完得到的z_q. 这样我们的损失也可以让encoder来学习参数了.

第三项是让每次z_q和z_e不要变化太大. 利于网络收敛.

P概率定义如下.

变分推断--理解变分推断中的ELBO

z是隐变量. 用来生成x

下面这个条件概率是我们需要的. 知道这个概率之后,我们就可以知道给定x, 之后z 取什么值概率最大了. 之后我们直接取概率最大的那个z值作为隐变量即可.

如果我们用一个分布q(z)来你和上面分布. 那么需要

所以我们优化p, 就可以改为优化elbo(q).

https://blog.csdn.net/Jimmy_dovici/article/details/127739578 这个讲的很好

标签：概率,vqvae,阅读,论文,encoder,embedding,里面,我们,向量
From： https://www.cnblogs.com/zhangbo2008/p/17855819.html

《人件》阅读笔记（三）
第五篇：在这里工作应该很开心这一篇强调了工作开心的重要性，并给出了一些建议如何让员工感觉到在这工作开心。在我们的观念里认为工作是费力的，如果你乐意做某事，那就不是真正的工作。事实上，工作应该是一种乐趣。对于任何一个特定的项目，不要实验多于一种以上......
西安体院篮球专项队训练现状及策略研究——论文文档
摘要：随着时代的进步，篮球已成为一项全民健身的活动。为了满足人们日益增长的需求，培养优秀的篮球运动员已成为当务之急。为此，提升运动员的训练水平和积极性显得尤为重要。只有通过不断努力，才能真正让他们的技术和实战水平达到最佳状态。通过问卷调查和因素分析法，我们对西安体育学......
施工环境对施工质量影响的研究——论文文档
研究意义工程质量监督管理是工程项目全过程中质量管理工作的重要内容,产品质量重要程度直接决定了建筑施工质量管理水平。但近年来,企业虽对项目中工程质量监督管理的关注程度日益增强,但针对工程施工涉及面较广、过程复杂繁杂的特点,在建筑工程质量管理体系方面仍需要完善。影响......
开源小说站源码php+付费阅读小说网站系统源码附全自动采集和搭建教程
随着互联网的普及，网络小说已成为现代人生活不可或缺的一部分。与此同时，越来越多的人开始关注小说网站源码的开发，希望通过开发自己的小说网站来满足读者的需求。本文将从小说网站源码的设计、开发、运维等方面进行探讨，以帮助读者更好地了解小说网站源码的相关知识。源码：xsymz.icu......
如何写论文的笔记
#论题陈述改善稀疏奖励的强化学习有助于移动机器人动态避障#收集论证#阅读文献-记录阅读时做一个word文档，五列的表格。第一列，文献标题。第二列，期刊名称。第三列，研究对象、问题。第四列，研究方法、理论、视角。第五列，数据来源。为了对抗网络上不相关，不准确，动机险恶的信息，你们......
陕西太泉酒营销策略研究——论文文档
摘要：中国作为一个白酒消费大国，拥有众多的白酒品牌，但由于市场竞争的激烈，许多白酒品牌的知名度并不高，导致企业在品牌建设上的表现并不理想。宝鸡太泉酒业已经成功打造了一个以眉县为核心的区域，并在岐山、太白、陈仓、扶风四个县级城市取得了良好的发展，其市场份额高达60%，此外，还在河南......
vqvae的loss计算
loss=torch.mean((z_q.detach()-z)**2)+self.beta*torch.mean((z_q-z.detach())**2)z_q是codebook找到的最接近z的向量.z是encoder生成的向量.L对z求导=2(z_q.detach()-z)*(-1)=2(z-z_q.detach()) #这个部分对于encoder做了训练.L对z_q求导=2(z_q-z.......
网页顶部添加阅读进度条方法（适用于任何网页）
第一种方法顶部添加直接加入html，不需要分别放到css和js里<style>progress{/*position:fixed;left:0;*//*right:0;*//*bottom:0;*//*top:0;width:100%;text-align:center;height:0.5rem;borde......
【论文阅读笔记】【OCR-End2End】 ESTextSpotter: Towards Better Scene Text Spottin
ESTextSpotterICCV2023读论文思考的问题论文试图解决什么问题？场景文本端到端识别任务中，检测和识别两个任务的协同作用十分关键，然而以往的方法通常用一些十分隐式的方式来体现这种协同作用（sharedbackbone,sharedencoder,sharedquery…），不能完全释放这种两个任务相互......
【略读论文|时序知识图谱补全】Learn from Relational Correlations and Periodic Eve
会议：SIGIR，时间：2023，学校：国防科技大学摘要：之前模型存在的问题：未能利用快照内结构信息的关系之间的语义相关性与快照间时间交互沿时间轴的周期性时间模式。本文的工作：提出了一种新的推理模型（RPC）；它通过两个新的通信单元，即关系通信单元(RCU)和周期通信单元(PCU)，充分挖掘关系关联和周......

vqvae 论文阅读

变分推断--理解变分推断中的ELBO

相关文章

赞助商

阅读排行