使用合成数据进行自我提升的扩散模型

时间：2024-09-16 14:52:09浏览次数：12

文章提出了一种新的训练方法，称为使用合成数据自我改进的扩散模型（SIMS），旨在解决生成模型因使用合成数据训练而可能导致的模型自噬障碍（MAD）问题。通过在生成过程中引入负向引导，SIMS能够避免模型陷入合成数据循环导致的性能退化，提升模型生成质量，并在多个图像生成任务中取得了优异的表现。此外，SIMS还具备调节合成数据分布的能力，有助于减轻模型偏见并确保生成结果的公平性。

使用合成数据进行自我提升的扩散模型_生成模型

1 SIMS方法

扩散模型是一种生成模型，通过逐渐对训练数据进行噪声扩散，最终通过逆向建模的方式从噪声中恢复数据分布。具体来说，模型通过对数据实例逐步添加噪声，形成一个从真实数据到噪声数据的序列，并通过学习逆向过程生成新的数据样本。该模型在图像生成任务中表现出色，并逐渐成为生成模型的重要研究方向。

自我消耗循环及MAD

自我消耗循环（Self-consuming loop）是指生成模型在训练时使用了由先前模型生成的合成数据，这种循环可能导致模型逐渐偏离真实数据分布，最终陷入模型自噬障碍（Model Autophagy Disorder, MAD）。MAD是一种生成模型的退化现象，随着生成模型的迭代训练，使用合成数据训练的新模型会逐渐失去生成高质量、多样性数据的能力，导致模型性能下降和偏见的加剧。

SIMS方法

1)避免合成数据的累积：SIMS避免将真实数据和合成数据混合成一个训练集，因为这会导致模型分布与真实世界数据之间的偏差，进而降低模型质量并强化偏差。相反，SIMS利用合成数据在生成过程中提供负向指导，以使模型生成过程远离非理想的合成数据流形。
2)使用负向指导：通过训练一个辅助模型，该模型不仅使用来自基础模型的真实数据，还使用由基础模型生成的合成数据。然后可以结合这个辅助模型的得分函数与基础模型的得分函数，以反向推导出一个新的得分函数，这个新的得分函数更接近于真实的数据分布。
3)迭代训练：SIMS能够在不陷入模型自噬（MAD）的情况下，对自我生成的合成数据进行迭代训练。实验显示，在一定条件下，经过100代的迭代训练后，SIMS仍能保持模型性能不下降。
4) 控制分布：SIMS能够调整扩散模型生成的合成数据分布，以匹配任何期望的域内目标分布，这对于减少偏见和确保模型公平性具有重要意义，同时也能提高生成输出的质量。

使用合成数据进行自我提升的扩散模型_迭代_02

2 结语

文章提出了一种利用合成数据自我改进的扩散模型（SIMS），通过负向引导避免模型自噬障碍，提升生成模型的性能和公平性。

论文题目： Self-Improving Diffusion Models with Synthetic Data

论文链接： https://arxiv.org/abs/2408.16333

PS: 欢迎大家扫码关注公众号^_，我们一起在AI的世界中探索前行，期待共同进步！

使用合成数据进行自我提升的扩散模型_迭代_03

精彩回顾

1. 从学习到的因果网络中估计因果效应

2. 基于大语言模型智能体的自主机器学习

3. 基于人机偏好的协作

标签：SIMS,训练,合成,自我,生成,扩散,数据,模型
From： https://blog.51cto.com/u_16811054/12031384

“情商必备技巧：10个快速自我提升秘诀“
情商的形成过程情商EQ形成于婴幼儿时期，成型于儿童和青少年阶段，它主要是在后天的人际互动中培养起来的。青春期是一个人的黄金时代，因为这是一个人走向成人的一个过渡时期。在这个时期，其学习和发展任务是非常重要的。但是，中学生由于面临着生理上、心理上的急剧变化，还有学业上的......
自我介绍
这个作业属于哪个课程计科1班这个作业要求在哪里作业要求这个作业的目标<设计一个论文查重算法，给出一个原文文件和一个在这份原文上经过了增删改的抄袭版论文的文件，在答案文件中输出其重复率>自我介绍大家好，我是阿依努尔.麦麦提艾麦尔，目前在读于在广东工业大......
ThreeJS Shader的效果样例光影墙、扩散面(四)
一、实现一个光影墙1. 根据自定义坐标点，输出一个光影墙/***添加光影墙*/functionaddLightWall(){constgeometry=newTHREE.BufferGeometry();constvertices=newFloat32Array([5,0,2,3,0,5,-2,0,5,-4,0,2,-4,......
深度解析音频增强与合成技术：从理论到实践
目录1.什么是音频增强？2.关键的音频增强方法3.多进程处理和并行音频生成4.剪切文件和低活动性文件的检测与统计结语在语音识别、语音合成和语音增强等领域，生成高质量、增强后的音频数据是提升模型性能的关键。今天我们将详细探讨音频增强与合成的核心概念与方法，从......
【学习归纳自我总结版】尚硅谷学习第二天
数据存储和运算符1.进制1.1进制的分类十进制二进制八进制十六进制数字范围0-90-10-70-9，a-f进位规则逢十进一逢二进一逢八进一逢十六进一示例12501111757F说明每三位二进制是一位八进制值每四位二进制是一位十六进制值1.2在代码中如何表示四种进制的常量值十进制：正常表......
ffmpeg实现视频的合成与分割
视频合成与分割程序使用作者开发了一款软件，可以实现对视频的合成和分割，界面如下：播放时，可以选择多个视频源；在选中“保存视频”情况下，会将多个视频源合成一个视频。如果只取一个视频源中一段视频，就实现了视频分割。对视频的处理采用了ffmpeg库。作......
绩效考核中如何做自我评估
绩效考核中，员工的自我评估是一个重要环节。如何能将自己的现状，表现，能力等等用文字表达出来，是很多员工的痛苦。国外很多研究中，给了我们很多启示，今天就让我们来介绍一下海外在员工自我评估中的一些研究成果。自我评估的重要性自我评估对员工和管理者同样有用。评估通常很短，只需......
GST-Tacotron学习资料汇总 - 端到端语音合成中的无监督风格建模、控制和迁移
GST-Tacotron简介GST-Tacotron是GoogleAI团队提出的一种端到端语音合成系统,在Tacotron的基础上引入了全局风格令牌(GlobalStyleTokens,GST)机制,实现了对语音风格的无监督建模、控制和迁移。该项目的主要特点包括:无需显式标注就能学习建模大范围的语音表现力可以通过控......
自我介绍+软工五问
|这个作业属于哪个课程|https://edu.cnblogs.com/campus/gdgy/CSGrade22-34||这个作业要求在哪里|https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13228||这个作业的目标|初步学会使用博客园|自我介绍========基本情况大家好，我是王峥，来自广东佛山......
自我介绍+软工5问
这个作业属于哪个课程2022级计算机科学与技术1班这个作业要求在哪里作业要求这个作业的目标准备一个GitHub账号和一个博客园账号，学习markdown语法，在博客园发布一个包括但不限于自我介绍，想弄懂的问题，想收获什么的随笔自我介绍姓：李，名：明佳，对软件开发有初步了解......

使用合成数据进行自我提升的扩散模型

1 SIMS方法

2 结语

精彩回顾

相关文章

赞助商

阅读排行