首页 > 其他分享 >论文阅读记录3——基于提示学习的小样本文本分类方法——计算机应用

论文阅读记录3——基于提示学习的小样本文本分类方法——计算机应用

时间:2023-04-19 14:37:25浏览次数:30  
标签:BERT 样本 映射 提示 标签 论文 学习 文本 模板

 

方法:

首先,利用预训练模型 BERT在标注样本上学习到最优的提示模板;然后,在每条样本中补充提示模板和空缺,将文本分类任务转化为完形填空任务;最后,通过预测空缺位置的

填充词,结合填充词与标签之间的映射关系得到最终的标签。

原因:

文本分类任务通常依赖足量的标注数据,针对低资源场景下的分类模型在小样本上的过拟合问题。

重要内容:

在模型训练阶段,本文采取 MLM的损失作为最终的目标。通过预测空缺部分是候选集里的哪个词之后,标签映射得到最终的标签。由于标注数据的不足,仅通过少量数据很难学习到整个模型的参数,而且易出现过拟合。因此,在模型训练阶段借助了固定模型原始权重,在 BERT的基础上添加残差模块,即本文中的提示模板部分。并且在训练过程中只优化残差模块的参数。本文将需要优化的模板部分参数重新构建一个嵌入层,为图中 E(p)。将其拼接到 BERT模型的嵌入层中,在训练过程中通过矩阵遮盖住原始模型的嵌入层 E(M),使得其回传过程中的梯度为 0,不参与反向传播的计算,从而实现在更新阶段只更新模板部分的参数。

1模板学习层

自动构建提示模板方法采用基于 P-tuning的思想,利用连续空间内的向量表示作为提示模板,将模板的构建转化为连续参数优化问题。即在标注样本集上学习到使得整个句子表示置信度最高的一组向量,作为模板提示。

图中所示的[u1]~[u4],代表 BERT词表中的[unused1]~[unused4]。该部分标记在 BERT预训练阶段未使用,通常用于扩充词表等。即本文通过未使用过的标记来初始化构成模板表示,之后通过标注数据计算出该模板在得到提示模板对应的向量后,将其拼接到 BERT的词嵌入层中,作为完形填空模型的输入

2 Bert-MLM层

采用 BERT-MLM层用于完成完形填空任务。预测句中空缺部分为候选词集合对应的概率,以及其填入文中的语义合理性。

3 标签映射层

在得到空缺部分的词之后,将结果输入到标签映射层。标签映射层的主要作用为定义 MLM任务中的候选词和标签之间的对应关系。

例如根据不同任务将[好,坏],[体育,军事…金融]等集合作为完形填空的候选词,构建[好→积极,坏→消极]的标签映射关系,因此文本分类任务可通过预测选取候选词集合中的词,之后通过映射关系来得到最终的标签

总结:

因为没有找到源代码,我不太清楚这个实验具体是怎么实现的,因为还是在初学。但是他很符合我对于提示学习的理解。提示学习我认为有三个要素:模板,标签,使用场景。怎样使提示学习更好,我还没有概念,但是至少这种方式是可行的,而且是能实现的。如果他在小数据集上表现优异,那么可不可以在大数据集上依旧也有良好地表现?

而且他给我阐述了提示学习的大趋势就是如何选择更好模板。使用Bert能够得到很好的模板,使用其他的呢 ?

标签:BERT,样本,映射,提示,标签,论文,学习,文本,模板
From: https://www.cnblogs.com/songmao1999/p/17333175.html

相关文章

  • css文本
    1、colorcolor:red;设置字体颜色2、text-aligntext-align:center;设置文本的水平对齐方式,可选项:center居中对齐,right向右对齐,left向左对齐,justify两端对齐3、文本修饰text-decoration:none;可选项:overline上划线,line-through删除线,underline下划线,none没有4、大小......
  • springboot项目 宿舍管理系统 (源码+数据库文件+1w字论文+ppt)
    来了就点个赞再走呗,即将毕业的兄弟有福了文章底部获取源码springboot项目宿舍管理系统(源码+数据库文件+1w字论文+ppt)技术框架:java+springboot+vue+mysql后端框架:SpringBoot、SpringMVC、MyBatisPlus前端界面:vue、BootStrap、jQuery、ajxs系统共分为三种用户系统主要功......
  • 伟大思想论文:Cantor–Bernstein-Schröder 定理及其证明简介
    Cantor–Bernstein-Schröder定理及其证明简介1定理简介Cantor–Bernstein-Schröder定理,也称作Schröder–Bernstein定理、Cantor–Bernstein定理,是集合论中的重要定理。它的内容十分简单:如果集合\(A\)到集合\(B\)存在单射,且集合\(B\)到集合\(A\)存在单射,则集合......
  • 第一学期写的三篇论文
    胡言乱语罢了。开了博客园之后想把它们传到上面来,先试试Pandoc的效果。author:马逸飞522031910765title:从自然数指数幂到三角函数摘要本文从较为自然的自然数指数幂出发,定义整数指数幂、有理数指数幂、实数指数幂、复数指数幂运算和指数函数,并探究它们的性质。最后......
  • 论文解读《Automatically discovering and learning new visual categories with rank
    论文信息论文标题:Automaticallydiscoveringandlearningnewvisualcategorieswithrankingstatistics论文作者:K.Han, Sylvestre-AlviseRebuffi, SébastienEhrhardt, A.Vedaldi, AndrewZisserman论文来源:ICLR2020论文地址:download 论文代码:download视屏讲解:clic......
  • 论文caption写法讨论
    本文来自一篇英文博客。总结了该博客提出的关于caption写法。博客链接在末尾给出。caption的组成部分一个caption通常由一下几个部分组成。declarativetitle:总结在figure中展示的数据的主要发现。通常的caption中不会明确表示数据的主要发现而是仅说明被讨论的变量。由读......
  • 批量爬取TXT文本
    importreimportos #导入模块importthreadingimportpymysql#连接数据框,创建表db=pymysql.connect(host='localhost',user='root',password='1234',database='旅游�......
  • 文本编辑器 实现ctrl+v粘贴图片并上传、word粘贴带图片
    ​ 当前功能基于PHP,其它语言流程大抵相同。大概流程:1.将docx文件上传到服务器中2.使用PHPoffice/PHPword实现将word转换为HTML3.将HTML代码返回并赋值到编辑器中 1编辑器配置修改1.1新增上传wordjson配置在ueditor\php\config.json中新增如下配置:     /*......
  • Linux-文本编辑vim
    vim使用流程vim默认机器是不安装的,需要手动安装这个工具命令yuminstallvim-y #通过yum软件管理工具进行安装当vim打开不存在的文件的时候,默认会创建文件语法1.vim文件名2.输入字母i,进入编辑模式,代表insert输入字母o,在光标下一行开始编辑3.写完代码......
  • 初探富文本之OT协同算法
    初探富文本之OT协同算法OT的英文全称是OperationalTransformation,是一种处理协同编辑的算法。当前OT算法用的比较多的地方就是富文本编辑器领域了,常用于作为实现文档协同的底层算法,支持多个用户同时编辑文档,不会因为用户并发修改导致冲突,而导致结果不一致甚至数据丢失的问题。描述......