首页 > 其他分享 >在半监督学习中,用于细粒度图像分类中精确增强的伪标记方法

在半监督学习中,用于细粒度图像分类中精确增强的伪标记方法

时间:2024-09-13 14:20:46浏览次数:3  
标签:PEPL 标记 标签 监督 图像 数据 细粒度

2024年9月5日提交的原论文《PEPL: Precision-Enhanced Pseudo-Labeling for Fine-Grained Image Classification in Semi-Supervised Learning》

GitHub - TianSuya/SemiFG: A Semi-supervised framework for fine grained classificationA Semi-supervised framework for fine grained classification - TianSuya/SemiFGicon-default.png?t=O83Ahttps://github.com/TianSuya/SemiFG(注:作者说代码已开源到github,截止2024.09.12暂未看到代码)

一. 研究背景

1. 研究问题:这篇文章要解决的问题是细粒度图像分类中的标注数据稀缺问题。细粒度图像分类涉及区分视觉上相似的类别,这在物种识别、产品分类和医学诊断等应用中起着重要作用。然而,由于获取高质量标注数据的成本高昂且耗时,细粒度图像分类仍然面临重大挑战。

2. 研究难点:该问题的研究难点包括:标注数据稀缺、细粒度特征的分辨难度大、标准数据增强和图像混合技术会破坏关键的细粒度特征。

3. 相关工作:现有的半监督学习方法,如伪标签和一致性正则化,已经在有限监督下提高了模型性能。然而,这些方法在细粒度图像分类中存在显著挑战。由于标准数据增强技术可能会破坏关键的细粒度特征,而图像区域混合可能会忽略对准确分类至关重要的细节。

二. 研究方法

这篇论文提出了精度增强伪标签(Precision-Enhanced Pseudo-Labeling, PEPL)方法,用于解决细粒度图像分类中的半监督学习问题。具体来说,

1. 初始伪标签生成:首先,PEPL方法借鉴了FreeMatch的概念,通过自适应选择置信度阈值来生成初始伪标签。这些阈值基于模型在未标记数据上的预测性能动态调整。具体公式如下:

其中,C表示类别总数,β是预设的超参数,μB表示当前未标注数据的批量大小,qb表示模型的预测输出,τt表示第t步的全局阈值。

2. 混合语义伪标签生成:其次,为了更好地利用未标记图像的潜力,PEPL方法提出了两阶段方法。在第一阶段,随机混合图像并估计混合图像中包含的语义信息。基于前一阶段生成的伪标签,为混合图像创建混合语义伪标签。具体公式如下:

其中,表示从输入a中移除的部分,表示混合到输入a中的部分,S(Ia)和 S(Ib)分别是输入a和b的归一化激活图。

3. 损失函数:最后,整个框架的损失函数分为监督损失Lsup和无监督损失 Lunsup,计算公式如下:

其中,pm表示输入xi在参数为θ时的预测输出,H(⋅)表示交叉熵损失函数,ya和 yb分别是两个语义伪标签,γ和λ分别表示监督和无监督损失的权重。

三. 实验设计

为了评估PEPL的有效性,作者在两个标准的细粒度分类数据集上进行了实验:CUB 200 2011和Stanford Cars。具体实验设置如下:

1.数据集:CUB 200 2011数据集包含11,788张图像,涵盖200个鸟类物种,其中5,994张用于训练,5,794张用于测试。Stanford Cars数据集包含16,185张汽车图像,涵盖196个车型,其中8,144张用于训练,8,041张用于测试。

2.实验环境:实验使用单个NVIDIA A800 80G GPU进行,预训练的ResNet50作为基础分类模型。整体训练设置为200个epoch,标记数据的批量大小为16,未标记数据的批量大小为112(µ = 7)。

3.超参数配置:初始学习率为0.01,每80个epoch减少0.1,达到0.0001后应用余弦退火调度器逐渐降低学习率至0,来训练最后40个迭代。伪标签生成的超参数β设为0.999以确保稳定的增长趋势。监督和无监督损失的权重(γ和λ)均设为1。

四. 结果与分析

1. 主要结果:与经典的半监督学习方法(如Pi-Model和PseudoLabel)以及最先进的方法(如FlexMatch和FreeMatch)相比,PEPL方法在不同标签比例下的分类准确率均表现优异。例如,在CUB 200 2011数据集上,使用20%的标签数据时,PEPL方法的准确率比全监督模型提高了13%。

2. 消融研究为了进一步验证PEPL引入的混合语义伪标签的有效性,作者将其与直接混合和生成伪标签的方法进行了比较。结果表明,添加语义混合后,性能额外提升了约4%到9%。

3. 案例研究通过与FreeMatch方法的对比,PEPL方法在30%标签数据下的分类效果与100%标签数据下的监督学习效果相当。这展示了PEPL方法在增强模型对细粒度特征感知方面的优势。

五. 总体结论

本文提出的PEPL方法有效解决了半监督学习方法在细粒度图像分类领域的挑战。通过利用类激活图生成高质量的伪标签,PEPL克服了标准数据增强和图像混合技术在保留关键细粒度特征方面的局限性。PEPL的简单性和有效性使其成为细粒度分类研究中宝贵的工具,能够显著提高半监督学习的性能,并激发进一步的创新研究。

六. 创新点

1. 提出了Precision-Enhanced Pseudo-Labeling (PEPL)方法:专门针对细粒度图像分类的半监督学习方法。

2. 利用CAMs生成高质量伪标签:通过两个关键阶段(初始伪标签生成和语义混合伪标签生成)逐步细化伪标签,提高伪标签的精度。

3. 解决标准数据增强和图像混合技术的局限性:通过关注语义级信息,有效保留了关键细粒度特征。

4. 在基准数据集上取得了显著的性能提升:在不同标签比例下,PEPL方法均优于现有的半监督策略,并在CUB 200 2011数据集上使用20%标注数据时,准确率比全监督模型提高了13%。

5. 代码开源:提供了详细的代码实现,方便其他研究者复现和使用。

七. 不足点

1. 语义混合伪标签的有效性验证:虽然引入了语义混合伪标签,但需要进一步验证其在不同数据集上的普适性和效果。

2. 下一步工作:未来研究可以进一步优化伪标签生成和混合策略,探索更多创新的半监督学习方法,以进一步提升细粒度图像分类的性能。

标签:PEPL,标记,标签,监督,图像,数据,细粒度
From: https://blog.csdn.net/boboly186/article/details/142175309

相关文章

  • Google Earth Engine——对Landsat8图像进行归约分析和应用函数导出数据等流程
    目录加载和过滤图像集合利用图像波段组合减少图像集合隔离图像计算NDVI编写函数在集合上映射函数构建最环保的像素组合绘制NDVI随时间变化的图表导出RGB图像整理你的代码加载和过滤图像集合搜索“Landsat8TOA”并将结果添加到导入部分。将集合重命名为......
  • Sulfo-Cy3-Mal;磺基-Cy3-马来酰亚胺; 标记服务:多肽、蛋白、抗体、小分子
         Sulfo-Cy3-Mal,也称为磺化Cy3马来酰亚胺,是一种水溶性荧光染料,其分子中含有马来酰亚胺(maleimide)官能团,这使得它能够与含有巯基(-SH)的生物分子通过亲和加成反应形成稳定的共价键。这种标记方法具有高度的选择性和特异性,常用于蛋白质、抗体、寡核苷酸等分子的标记。......
  • 基于深度学习的文本引导的图像编辑
    基于深度学习的文本引导的图像编辑(Text-GuidedImageEditing)是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理(NLP)的最新进展,使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的......
  • 【影像组学pyradiomics学习笔记】png图像提取组学特征
    1、提取单张png图像组学特征示例:importSimpleITKassitkimportnumpyasnpimportmatplotlib.pyplotaspltfromradiomicsimportfeatureextractorimportosimportcv2defload_image(image_path):image=cv2.imread(image_path,cv2.IMREAD_GRAYSCALE)#......
  • 基于SE-ResNet的图像十分类
    文章目录一、数据预处理1数据加载1.1标签在文件夹上的数据集加载1.2标签在文件名中的数据集加载1.3数据集划分训练集和验证集的方法1.4读取csv文件的数据集加载方法2数据处理2.1数据增广在线增广离线增广2.2数据扩充3自定义数据集加载3.1前言3.2数据预处理......
  • 图像处理-边缘检测算法的原理和实现
    概述边缘检测是图像处理中的一项重要任务,其原理是基于图像的梯度计算。梯度是函数的变化速率,图像中的边缘意味着像素灰度值的快速变化。常用的边缘检测算法有Sobel算子、Prewitt算子、Laplacian算子、Canny算子等。Sobel算子(滤波器)Sobel滤波器通过使用两个3x3卷积核(也称为掩......
  • 2576. 求出最多标记下标
    给你一个下标从0开始的整数数组nums。一开始,所有下标都没有被标记。你可以执行以下操作任意次:选择两个互不相同且未标记的下标i和j,满足2*nums[i]<=nums[j],标记下标i和j。请你执行上述操作任意次,返回nums中最多可以标记的下标数目。示例1:输入:nums=[3......
  • 【每日一题】LeetCode 2576.求出最多标记下标(贪心、数组、双指针、二分查找、排序)
    【每日一题】LeetCode2576.求出最多标记下标(贪心、数组、双指针、二分查找、排序)题目描述给定一个整数数组nums,数组下标从0开始。你需要执行以下操作,直到无法再执行为止:选择两个互不相同且未标记的下标i和j。满足条件2*nums[i]<=nums[j],则标记下标i和j。......
  • java+opencv4来获取图像中轮廓的最小外接矩形
     举例:获取以下图片中的火车的最小外接矩形完成钱确认opencv的环境配置完整。要想查找图片中的轮廓信息,首先要获取图片的二制图,因为二制图的查找效率更高,具体原因自行百度。为了提高转换二制图的效率可以现将图片转换为灰度图。示例代码如下://将彩色图像转换为灰度图像M......
  • 《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》Chapter 1课件2024
    每一轮备课都有新的感悟。禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》禹晶、肖创柏、廖庆敏《数字图像处理》资源二维码......