Disentangling the independently controllable factors of variation by interacting with the world

时间：2023-03-18 23:45:30浏览次数：51

标签：Disentangling controllable independently prime policy world 表征

发表时间：2018（Learning Disentangled Representations, NIPS 2017 Workshop）
文章要点：这篇文章想说，可以分解出独立的可控的各种因素的表征才叫好的representation，作者就说通过policy和环境交互的过程是可以实现这种表征的。具体的，作者定义了一个度量标准来作为policy学习的reward

这里\(h\)是经过编码的初始状态，\(h^\prime\)是经过编码的终止状态，\(\phi\)代表变化的因子。\(A\)就度量由\(\phi\)造成的\(h,h^\prime\)之间的变化。

作者还举了个开关灯的例子来解释

然后训练policy的目标就是找一个最大化相应表征的策略

总结：感觉也过于抽象了吧，感觉很高深，但是又感觉啥都没讲，完全看不懂啊。而且最后还挂了Yoshua Bengio的名字，估计还是我太菜了。
疑问：里面这个训练过程也没细说，实验部分也不知道在干啥。不过作者还是个实在人，直接就说不好训

标签：Disentangling,controllable,independently,prime,policy,world,表征
From： https://www.cnblogs.com/initial-h/p/17232219.html

Diffusion-LM Improves Controllable Text Generation
目录概符号说明流程代码LiX.L.,ThickstunJ.,GulrajaniI.,LiangP.andHashimotoT.B.Diffusion-lmimprovescontrollabletextgeneration.arXivpreprinta......
Diffusion-LM improves controllable text generation
Diffusion-LMimprovescontrollabletextgeneration扩散语言模型改善可控文本生成（翻译）论文作者：XiangLisaLi……StanfordUniversity论文链接：https://arxiv.o......

Disentangling the independently controllable factors of variation by interacting with the world

相关文章

赞助商

阅读排行