【文本分类】《融合后验概率校准训练的文本分类算法》

时间：2023-01-17 11:34:41浏览次数：56

标签：概率后验校准模型分类文本

·阅读摘要：
本文主要提出后验概率校准、负例监督两个创新点，提升了实验精度。
·参考文献：
[1] 融合后验概率校准训练的文本分类算法

参考论文信息

论文名称：《融合后验概率校准训练的文本分类算法》

发布期刊：《计算机应用》

期刊信息：CSCD扩展

【文本分类】《融合后验概率校准训练的文本分类算法》_后验概率

[0] 摘要

目前文本分类存在一定问题：

1、随着模型的准确率越来越高，其预测结果的置信度就不再能匹配高准确率；

2、模型的分类器在为语义相似的文本分配不同标签的情况下性能下降。

论文提出 后验概率校准负例监督模型（PosCal-negative） 来解决以上问题。

【注】：后验概率校准为了解决第一个问题，负例监督为了解决第二个问题。

[1] 相关工作

后验概率校准要解决的问题

神经网络中预测结果的置信度就是分类类别的后验概率。

在某些情况下，随着神经网络分类性能的提高，模型盲目自信的问题也越来越严重。单方面的增加网络的深度和宽度均会使得模型的分类错误降低，但是同时模型准确率和置信度越加不匹配。

在大规模的二分类神经网络模型上进一步进行实验，因为模型足够复杂，大多数样本都以极接近于1或极接近于0的后验概率判定为正类，很少有样本的预测后验概率落入0.1到0.9区间内。

为了校准后验概率，提出了许多后处理方法，Zadrozny提出了 Histogram binning方法；Naeini提出了贝叶斯分位数方法（Bayesian Binning into Quantiles，BBQ）；Platt提出了 Platt scaling方法。

本文提出了PosCal，一个简单但有效的端到端后验概率校准模块，不同于后处理的校准方法，PosCal在训练过程中动态地对预测后验概率和经验后验概率之间的差异进行惩罚。

负例监督要解决的问题

在文本分类任务中，当分类标签分配的标准与语义相似性不一致时，由于语义相似性的过多影响，分类器往往容易出错。这是因为编码器将文本转换为表示文本语义的特征向量，语义相似的文本具有相近的特征向量表示，这时分类器可能区分不出相似文本间导致标签分配不同的细微差别。

[2] 模型

如下图：

【文本分类】《融合后验概率校准训练的文本分类算法》_分类_02

· 首先是嵌入层，论文用的是BERT。

$【文本分类】《融合后验概率校准训练的文本分类算法》_神经网络_03$ 。

$【文本分类】《融合后验概率校准训练的文本分类算法》_机器学习_04$ 。

$【文本分类】《融合后验概率校准训练的文本分类算法》_机器学习_05$ 。

$【文本分类】《融合后验概率校准训练的文本分类算法》_神经网络_06$ 。

标签：概率,后验,校准,模型,分类,文本
From： https://blog.51cto.com/u_15942590/6012016

【多标签文本分类】BERT for Sequence-to-Sequence Multi-Label Text Classification
·阅读摘要：本文在已有的SGM和BERT模型上改进，提出了SGM+BERT模型、混合模型。实验证明SGM+BERT模型收敛比BERT快很多，混合模型的效果最好。·参考文献： [1]BERTfor......
【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Class
·阅读摘要：本文在Transformer模型的基础上，提出改进方案，把Transformer里面的自注意力机制，改成CNN。·参考文献： [1]ACT:anAttentiveConvolutionalTransformer......
【多标签文本分类】层次多标签文本分类方法
·阅读摘要：本文是一篇中文综述，主要介绍了层次多标签分类的一些算法。·参考文献： [1]赵海燕，曹杰，陈庆奎，曹健．层次多标签文本分类方法[J/OL]．小型微型计算机系统.ht......
【论文写作分析】之四《基于ALBERT-TextCNN模型的多标签医疗文本分类方法》
论文名称：《基于ALBERT-TextCNN模型的多标签医疗文本分类方法》发布期刊：《山东大学学报(理学版)》期刊信息：CSCD 论文写作分析摘要：本文非常简单。网络模型是直......
【机器学习】线性分类——朴素贝叶斯分类器NBC（理论+图解+公式推导）
......
9.Selenium【元素的定位】部分链接文本定位
一、前言有时候我们可以使用链接文本进行定位，因为是文本，一般是说明性的文字，所以会存在文本太长的情况，其实我们也可以通过部分文本匹配元素。二、学习目标1.通过部分链接......
【BERT-多标签文本分类实战】之七——训练-评估-测试与运行主程序
[1]损失函数与评价指标多标签文本分类任务，用的损失函数是BCEWithLogitsLoss，不是交叉熵损失函数cross_entropy！！BCEWithLogitsLoss与cros......
【文本分类】《短文本分类的ResLCNN模型》
·阅读摘要：提出基于3层LSTM和CNN网络结构的ResLCNN深度学习模型。该模型使用了3层LSTM获取文本的长距离依赖，用CNN通过卷积获取句子局部特征，同时使用了残差模型，在第1层L......
【BERT-多标签文本分类实战】之三——多标签文本分类的方向与常用数据集介绍
【注】本篇将首先介绍多标签文本分类中几个小方向，然后介绍这几个小方向对应的常用数据集。最后介绍如何自己寻找和下载数据集。[1]多标签文本分类的若干小方向目前学......
【BERT-多标签文本分类实战】之四——数据集预处理
[1]数据集预处理的流程在拿到数据集之后，我们关心接下来操作的步骤： ·查看数据集的基本数据 ·分析数据集的标签构成 ·数据集拆分成训练集、验证集、测......

【文本分类】《融合后验概率校准训练的文本分类算法》

参考论文信息

[0] 摘要

[1] 相关工作

[2] 模型

相关文章

赞助商

阅读排行