首页 > 其他分享 >Auto Encoder(自编码器)

Auto Encoder(自编码器)

时间:2023-07-21 16:25:50浏览次数:26  
标签:输出 编码器 Disentanglement Auto Encoder Decoder 向量

Auto Encoder(自编码器)

  • Self Supervised Learning(自监督学习):用没有标注的资料训练模型,发明不需要标注资料上的任务,例如:做填空题、预测下一个token(符号);在BERT和GPT之前,有一种方法就是Auto Encoder
  • Auto Encoder(自编码器):也是一种用没有标注的资料训练的模型

Auto Encoder运作方式:

其中包括两个Network,分别是Encoder和Decoder,Encoder把图片转换为一个vector(向量),Encoder就是Dimension reduction(降维),Decoder再把生成的向量转化为图片,要求与原图片越接近越好,所以Decoder的架构像GAN中Generator,(Auto Encoder的概念和Cycle GAN的概念一模一样),有些人把Vector当成Code

降维的技术还有PCA、t-SNE;

  • De-Noising Auto Encoder:输入Encoder的图片加入一些杂讯

所以BERT的过程就像De-Noising Auto Encoder:输入时遮盖部分内容就是添加杂讯,BERT输出向量就像Encoder,根据输出向量输出结果时就是Decoder:

 Feature Disentanglement(功能解开纠缠)

  • Feature Disentanglement:把原来纠缠在一起时的东西解开

引入:

  • 把图片、一段声音或文章丢进Encoder,得出一个向量,而输入的全部资讯都混杂在这个向量中;现在需要把这些资讯清晰的分开

如:输入一段声音,普通的Auto Encoder输出的向量不知道内容在多少维度、说话人的特征在多少维,所以想办法训练一个模型Auto Encoder,使得出的向量前k维度代表说话的内容、后k维代表说话人的特征,这个过程就是Feature Disentanglement

应用:

  • voice Conversion(声音转换)

变声器,在过去,需要A和B两个人所同样的话得到训练资料;在出现Feature Disentanglement之后不需要A和B说同样的话,甚至不需要说同一种语言,都可能转换,只需要训练出Feature Disentanglement,把向量中两个人的声音内容部分保留,交换声音特征,便可以将声音转换

 Discrete Latent Representation(离散潜在表征)

引入:

  • 输入一张图片,让Encoder输出的向量为二进制向量,任意维代表图片中的特征的有无,如:第一维代表是女生,第三维代表是否戴眼镜

如:Encoder输入一段文字,输出向量,再传入Decoder输出原文章,现在将Encoder输出向量改成输出另一段文字(文章的摘要)

事实证明行不通,因为Encoder输出的文字人看不懂;需要再用GAN的概念加入Discriminator,因为Discriminator看过人写的句子,所以Encoder输出的句子要“骗”过Discriminator,就需要输出人能看懂的句子

注:并且每一个Decoder都是Generator。

  Encoder就是一个压缩的过程,Decoder 就是一个解压缩的过程;并且这个压缩是有损压缩

标签:输出,编码器,Disentanglement,Auto,Encoder,Decoder,向量
From: https://www.cnblogs.com/TianLiang-2000/p/17571729.html

相关文章

  • Python3 pyautogui安装成功,但是不能引用
    安装使用的是pycharm,python3.8python-mpipinstallpyautogui-ihttps://pypi.tuna.tsinghua.edu.cn/simple,显示Successfully。 引用importpyautogui报错:Nomodulenamed'pyautogui'解决办法尝试各种网上的方法,查询环境等,不太懂,感觉没有问题偶然发现虽然piplist有......
  • spring boot使用mongodb时,xxxRepository不能Autowired的问题
    默认情况下,当继承MongoRepository的CRUD在@SpringBootApplication的子包下时,xxxRepository是能够自动被扫描和创建代理的。但是如果不在默认路径下,就无法注入了,即使是扫描路径加到了@ComponentScan也一样。解决方法:在springboot启动类中添加@EnableMongoRepositories注解,标注mon......
  • 用Power Automate获取SharePoint文件内容
    1.根据文件夹路径获取路径下所有文件内容使用SharePoint连接器的“获取文件(仅属性)”操作,站点地址选SharePoint的默认站点,库名选择对应文档库,我这里把SharePoint集成到Dynamics365的实体附件,库名就是对应的实体名。仅限文件夹条目为 /entityname/relativeurl,entityname为实体名,r......
  • 【雕爷学编程】Arduino动手做(40)---KY-040旋转编码器模块2
    37款传感器与模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的。鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的,这里准备逐一动手试试多做实验,不管成功与否,都会记录下来——小小的进步或是搞不掂的问题......
  • C# 程序中使用AutoMapper实体映射
     我的开发环境framework为4.7.2添加AutoMapper9.0引用创建实体映射公共类publicclassAutoMapperUnity{publicstaticIMapperautoMapperTool;publicAutoMapperUnity(){autoMapperTool=AutoMapperUnit......
  • Python与UIAutomator测试
    1.APP测试UI测试:导航测试,图形测试,内容测试功能测试性能测试:响应能力测试(安装卸载功能性操作),压力测试(反复/长期)兼容性测试安全测试:发送信息拨打电话链接网络访问手机信息联系人信息设置权限;执行某些操作时导致的输入有效性验证授权数据加密;将网络协议的测试,防止恶......
  • CentOS报错/bin/sh: autoconf: command not found
     目录一、问题描述二、解决方法1.查看autoconf、automake是否已安装2.查看autoconf、automake对应的包3.安装 一、问题描述CentOS7下执行makeconfigure命令时报错:/bin/sh:autoconf:commandnotfound 二、解决方法1.查看autoconf、automak......
  • Proj. CMI Paper Reading: Conversational Automated Program Repair
    Abstract背景:之前APR与大模型的结合仅仅使用了一些特殊构建的input/prompt本文:conversationalAPR方法:使用long-termcontextwindow来记录之前的validationfeedback实验:在10个LLMs上进行对比展示改进......
  • Pycharm安装CodeWhisper插件后登录仍然不显示“Pause Auto-Suggestions”选项的解决办
    一、检查PyCharm版本建议升级到最新,AWS不支持2022.03以前的版本。二、设置插件存储库FromtheJetBrainsmainmenu,openyour Preferences menu(expand File choose Settings,forWindowsusers).Fromthe Preferences/Settings menu,choose Plugins toope......
  • 使用Power Automate上传附件到Dynamics 365集成的SharePoint
      在Dynamics365中使用SharePoint集成做实体的附件管理,这里不像用Annotation实体存放附件可以直接用代码直接创建Annotation记录,如果想要对外部提供接口把附件上传到SharePoint,我们可以使用PowerAutomate中的SharePoint组件来生成文件,通过HTTP流供给外部系统调用。  下......