扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法

时间：2024-10-04 14:00:20浏览次数：10

标签：引导嵌入 AI 模型 DGLM 生成对齐扩散

随着大型语言模型(LLMs)的迅速普及,如何有效地引导它们生成安全、适合特定应用和目标受众的内容成为一个关键挑战。例如,我们可能希望语言模型在与幼儿园孩子互动时使用不同的语言,或在撰写喜剧小品、提供法律支持或总结新闻文章时采用不同的风格。

目前,最成功的LLM范式是训练一个可用于多种任务的大型自回归模型。然而,现有的引导生成方法各有优缺点:

微调方法虽然有效,但改变了模型权重,可能会降低LLM的性能。此外,如果新应用需要独特的属性组合(如幽默但不具攻击性),就需要微调和部署新的专用模型。
即插即用方法不改变模型权重,而是使用额外的轻量级分类器或启发式方法来影响生成过程。这些方法灵活性高,不需要微调或托管专用模型。但由于它们通常只改变最后一层的logits,容易产生解码错误,这些错误会在自回归生成过程中级联并降低输出质量。
扩散模型最初在图像生成领域取得了突破,它们通过迭代"去噪"高斯噪声样本来生成目标数据分布的样本。这种迭代生成过程自然允许通过简单的似然函数进行即插即用控制。然而,目前的文本扩散模型在困惑度和生成质量上仍然不如自回归模型。

为了解决这些挑战,研究者提出了一种新的框架:扩散引导语言建模(Diffusion Guided Language Modeling, DGLM)。DGLM旨在结合自回归生成的流畅性和连续扩散的灵活性,为可控文本生成提供一种更有效的方法。

DGLM方法详解

DGLM框架包含三个主要组件:扩散网络、轻量级提示生成器和预训练的自回归解码器。其工作流程如下:

给定一些文本前缀,使用扩散模型采样生成可能的延续的嵌入语义提案。
在采样过程中,可以选择性地执行即插即用控制以强制某些条件(如低毒性)。
采样语义嵌入后,提示生成器将嵌入处理成软提示。
软提示引导自回归解码器生成与提案对齐的文本。

图1: DGLM框架概览。给定一些前缀,我们首先用扩散模型生成语言延续的嵌入表示。在这个阶段,我们可以选择性地用轻量级分类器进行即插即用引导干预。我们将延续嵌入映射到软提示,以引导自回归解码器生成与生成的嵌入语义对齐的语言。

https://avoid.overfit.cn/post/e935645b2c5743458e78e333137a79b8

标签：引导,嵌入,AI,模型,DGLM,生成,对齐,扩散
From： https://www.cnblogs.com/deephub/p/18446560

wsl重装Ubuntu遇到的一些问题( WslRegisterDistribution failed with error: 0x800410
不知道什么原因，VSCode连接WSLUbuntu总是失败，遂决定重装Ubuntu。但是卸载原来的Ubuntu后，安装新的Ubuntu报错:WslRegisterDistributionfailedwitherror:0x80041002Error:0x80041002(null),查了比较多的帖子，使用了以下方法最终解决：1.关闭"适用于l......
工地烟火AI监控识别分析系统
工地烟火AI监控识别分析系统通过yolov7网络模型技术，工地烟火AI监控识别分析系统基于人工智能深度学习视频分析技术，实现对工地或者厂区现场监控区域内的烟火进行实时分析报警。工地烟火AI监控识别分析系统不依赖其他传感设备，直接对厂区及工地现场视频监控区域的画面的烟雾和火焰均......
2024/10/2 CSP-S daimayuan模拟赛复盘
2024/10/2CSP-Sdaimayuancontestlink(Day7)A.序列题面描述给你一个序列\(r_1,r_2,\dots,r_n\)，问有多少非负整数序列\(x_1,x_2,\dots,x_n\)满足：对于所有\(i\)，\(0\leqx_i\leqr_i\)。满足\(x_1|x_2|…|x_n=x_1+x_2+⋯+x_n\)，左边为二进制或。输出答案对......
【AIGC】AI时代的数据安全：使用ChatGPT时的自查要点
博客主页：[小ᶻZ࿆]本文专栏:AIGC|ChatGPT文章目录......
【HITCON-Training】Lab 14 - MagicHeap
学习于2024-10-0312:50:42星期四心得感想：分析ida一打开就看到很明显的提示（毕竟是教学关卡）：那么我们需要将magic修改为一个大于0x1305的数，并且该程序没有开PIE，那么magic地址就是固定的。Delete操作删的非常彻底，很明显这里没有任何可以利用的：Create部分看起也没有任何问题......
Taiko工艺能将硅片减到多薄？
知识星球里的学员问：可以介绍一下Taiko工艺的原理吗？以及能将硅片减薄的最小厚度？什么是Taiko工艺？Taiko工艺是一种晶圆减薄技术，该工艺保留晶圆边缘不被减薄，而仅将晶圆的中央区域减薄。这使得晶圆中央区域可以达到极薄的厚度，而晶圆的边缘保持原始厚度。为什么要用Taiko工艺？如上图所......
AI智慧工地视频分析系统
AI智慧工地视频分析系统通过视频智能分析技术，AI智慧工地视频分析系统对工地现场监控画面中物的不安全状态以及现场施工作业人员的不合规行为及穿戴进行全天候不间断实时分析，发现有人不合规行为及违规穿戴抽烟打电话等，不需人为干预，AI智慧工地视频分析系统立即自动抓拍存档告警。AI......
Xcode11上新创建项目build fail
在mac上新装Xcode11，新创建了一个工程，点击运行一直buildfail，并且没有显示报错。点击xcode左侧边栏最右边的ShowtheReportnavigator，显示报表导航器，如下图报错信息为ShowingRecentIssuesCouldn'tcreateworkspacearenafolder'/Users/hyt/Library/Developer/Xcode/Deriv......
微软推送Windows 11 2024更新：新增多项AI体验 NPU终于有了用武之地
10月3日消息，近日，微软开始向广大用户全面推送Windows112024更新。其实按照惯例应被成为Windows1124H2更新，但由于微软放弃了以往1年2次重大版本更新周期，整个2024年只更新了这一个大版本，因此被设定为“Windows112024更新”。2024更新包含了Windows11中许多小而实用的新增......
【HITCON-Training】Lab 12 - SecretGarden
学习于2024-10-0122:00:17星期二心得感想：这次真的把我整笑了，现在是10/2的晚上23点，我都不敢想象自己弄了多久（整整两天国庆的下午......

扩散引导语言建模(DGLM):一种可控且高效的AI对齐方法

DGLM方法详解

相关文章

赞助商

阅读排行