论文阅读记录1——Lmbff（更好的基于微调的语言模型）读后归纳

时间：2023-04-16 16:22:17浏览次数：58

方法：

基于GPT-3的强大功能：只要给出一个自然语言提示和一些任务演示，GPT-3就能够做出准确的预测，而无需更新其底层局域网的任何权重。

在一个更实际的场景中研究了少数镜头学习，在那里我们使用了更小的语言模型，其中的微调在计算上是有效的。我们提出了lm - bff(更好的语言模型的少量微调)，这是一套简单而互补的技术，用于在少量注释示例上微调语言模型。我们的方法包括:(1)基于提示的微调以及自动化提示生成的新管道;以及(2)动态和选择性地将演示整合到每个上下文的细化策略。最后，我们提出了一个系统的评估，用于分析一系列NLP任务的少数镜头性能，包括分类和回归。

1，采用提示自动构建方式来进行「基于模板的微调方法」。

2，动态选择样本示例，作为输入的上下文

原因：虽然GPT-3有着强大的功能，但是参数过于庞大。（1）不利于在实际场景中应用；（2）参数难以修改；（3）资源消耗庞大。因此提出了一个基于中等预训练模型微调权重的方式来克服以上的困难。

下面参考知乎的一篇文章写成https://zhuanlan.zhihu.com/p/341609647

重要内容：

自动模板的自动生成和选择。

（1）论文指出：在基于提示的微调方法中，不同的模板和标签词选择其实对最终结果影响很大，如上图所示：使用相同「标签词」，即使对「模板」进行较小改动（如删除标点）也会呈现不同结果；使用相同「模板」，不同的「标签词」效果不一样，例如cat/dog和dog/cat就不同了，而互换great和terrible指标则会大幅下降。

因此自动生成模板会使这一工作变得快速而廉价。但是如何自动生成模板，怎样选择模板，怎样评估模板的好坏就是一个难题。

（2）构建自动化提示的方法：

a.自动化构建「标签词」。

即固定模板、选择最佳的标签词映射关系M，使得在验证集的分类准确率最高。由于「标签词」搜索空间随着类别数目呈指数增加，LM-BFF采用一种简单的搜索策略：

1通过未经微调的预训练模型，对于训练集中的每一个类别，选择top-k的单词使得条件概率最大：

2 综合每个类别下的候选标签词，然后找出使得训练集正确率最大的top-n个分配方式

3 通过对dev集微调，从n个分配方式中选择最佳的一个标签词，构建标签映射关系M

b.自动化选择模板

T5基于多种无监督目标进行预训练，其中最有效的一个无监督目标就是：利用<X>或<Y>替换一个或多个连续span，然后生成对应输出。例如：在“Thank you <X> me to your party <Y> week ”，T5会在<X>生成“ for inviting ”、在<Y>生成“last ”。

很显然，T5这种方式很适合生成模板，不需要指定模板的token数目。具体，依然利用<X>或<Y>作为mask tokens，1种可能的输入方式为：

c.对样本的微调Fine-tuning with Demonstrations

在GPT-3中，是从训练集中随机抽取32个示例，以上下文的形式添加到每个输入中的；这种方式的缺陷在于：

样本示例的数量会受到模型最大输入长度的限制；

不同类型的大量随机示例混杂在一起，会产生很长的上下文，不利于模型学习。

LM-BFF采用2种简单的方式进行了改进：

对于每个输入，从每个类别中随机采样一个样本示例，最终将所有类别下的采样示例进行拼接输入；

对于每个输入，在每个类别中，通过与Sentence-BERT进行相似度计算、并从排序得分的top50%中随机选择一个样本示例

可改进点：

1，LM-BFF仍落后基于全量标注数据的标准微调方法，还可以加大数据量

2，LM-BFF自动构建提示的方法虽然有效，但扩展搜索空间在现实应用中仍是一个巨大挑战；

LM-BFF仅支持几种特定的任务：1）能自然转化为「空白填空」问题，如结构化预测的NER任务可能就不适合；2）句子输入不要太长；3）不要包含过多的类别；其中2）和3）可以在长距离语言模型中进行改善。

可用模型参考图：

1，提示学习模板

标签：Lmbff,BFF,示例,标签,模型,微调,归纳,读后,模板
From： https://www.cnblogs.com/songmao1999/p/17323474.html

总结与归纳之字符串
（大的不能在大的坑）前言总论+前置芝士正文字符串哈希KMP算法传统KMP算法Z函数fail树KMP自动机Trie与AC自动机普通Trie01Trie可持久化TrieAC自动机SA相关SA传统SAM广义SAM后缀平衡树ManacherPAM序列自动机最小表示法玄学：Lyndon分解总结......
总结与归纳之数学
（巨坑好吧）前言前置的知识正文同余问题大杂烩玄学：Miller-Rabin&Pollard-rho线性代数大杂烩组合数学大杂烩筛法反演问题大杂烩玄学：群论问题大杂烩多项式与生成函数大杂烩玄学：线性规划博弈论问题大杂烩微积分问题小杂烩？计算几何问题大杂烩......
<<梦断代码>>读后感(一)
今天发表《梦断代码》的第一篇读后感。这几天读了《梦断代码》的前四章，有很多不懂的也是必然的，读了很多遍还有好多地方不是很懂。发一下读的内容。作者迷恋于一个叫做Sumer的游戏，其可以让玩家打补丁，任何人都能窥探其内部运行机制。花点时间学习简单的Basic语言，改游戏就......
总结与归纳之图论
（再开一个大坑好吧）前言总论+前置概念正文树上问题大杂烩拓扑序短路问题大杂烩生成树问题大杂烩斯坦纳树分层图差分约束连通性问题大杂烩欧拉/哈密顿路问题大杂烩二分图图匹配问题大杂烩网络流问题大杂烩特殊图问题大杂烩......
总结与归纳之数据结构
（开一个大坑）前言总论正文基础数据结构栈队列链表数据哈希（这也基础？）并查集传统+基础变种并查集可持久化并查集单调栈/队列ST表树状数组线段树传统线段树李超线段树segbeats主席树动态开点与标记永久化线段树分裂与合并线段树分治平衡树传统平衡树可持久化......
敏捷测试高效实战-测试架构师成长记的读后感
序测试工作的最终目标是服务于产品的商业价值；产品质量必须是由测试人员和开发人员共同负责的；测试团队不仅要提升自身的效率，也要提升整个研发团队的交付效率；正如《Google软件测试之道》一书中提到的，测试团队属于工程生产力团队，以产品交付和效率提升为己任；自动化测试平台建立了......
音阶指型归纳
RELASI正方形,很不错的指型MISOL......
《软件方法》读后感
前言近日，苦于不知道该怎么提升自己了，在原来老大的建议下，决定去学习一些关于建模和软件设计领域的书籍，来解决解决自己“感觉不对，但是说不清楚为什么不对”以及“感觉这么搞就对了，但是不知道为什么这么去规划，这么去划分就对”第一本看的是潘加宇老师的《软件方法（上）业务建模和需求......
《人月神话》读后感——第三篇
——众所周知，一名孕妇需要36-42周才能够产下胎儿，那么如果有10名孕妇，产下胎儿的时间可以缩短到一个月以内。如果您真的着急，希望在2周之内要个孩子，那么我们只能够再添加一倍的人手。——写在最前。一般来说，本人读书之后，都会在一两个星期之内总结并且完成读书笔记，不过《人月神话》是......
归纳整理--第4篇--常用软件
随着软硬件设施的提高和网民网络生活的丰富，电脑上的软件越来越多。对于一个专业开发者来说，尤其如此。常用软件主要分2类。1.娱乐休闲类。普通网民使用的一些软件。即时通信：QQ，MSN浏览器：Firefox,搜狗，360音乐：酷我音乐盒，QQ音乐输入法：QQ拼音，搜狗拼音安全：q......

论文阅读记录1——Lmbff（更好的基于微调的语言模型）读后归纳

相关文章

赞助商

阅读排行