首页 > 其他分享 >Paper Reading: Multi-class imbalance problem: A multi-objective solution

Paper Reading: Multi-class imbalance problem: A multi-objective solution

时间:2024-09-01 16:16:37浏览次数:3  
标签:集成 Multi MMSEmargin multi 目标 分类器 所示 Reading 优化

目录
Paper Reading 是从个人角度进行的一些总结分享,受到个人关注点的侧重和实力所限,可能有理解不到位的地方。具体的细节还需要以原文的内容为准,博客中的图表若未另外说明则均来自原文。

论文概况 详细
标题 《Multi-class imbalance problem: A multi-objective solution》
作者 Yi-Xiao He, Dan-Xuan Liu, Shen-Huan Lyu, Chao Qian, Zhi-Hua Zhou
发表期刊 Information Sciences
发表年份 2024
期刊等级 中科院 SCI 期刊分区(2022年12月最新升级版)1区、CCF-B
论文代码 文中未公开

作者单位:

  1. National Key Laboratory for Novel Software Technology, Nanjing University, Nanjing, 210023, China
  2. School of Artificial Intelligence, Nanjing University, Nanjing, 210023, China
  3. Key Laboratory of Water Big Data Technology of Ministry of Water Resources, Hohai University, Nanjing, 211100, China
  4. College of Computer Science and Software Engineering, Hohai University, Nanjing, 211100, China

研究动机

类不平衡是分类任务中经常遇到的问题,其中多分类不平衡问题更为复杂。在二元分类中只需要权衡一个小类和一个大类,而在多类不平衡问题中,就需要考虑在不同小类和不同大类之间的权衡。因此针对多类不平衡问题设计一个再平衡策略更具挑战性,而且当涉及到模型评估时,很难用一个总体性能分数来描述一个多类分类器。
除了多类分类比二元分类更复杂之外,另一个挑战是类的相对重要性往往是未知的。如果能够为决策者提供模型的所有可能的最佳权衡性能,将极大地帮助决策者在开放环境中做出决策。例如下图所示的例子,左图中的情况决策者可能会选择红色所示的分类器。如果是右图所示的的情况,决策者可能会选择蓝色所示的分类器,因为它在所有类上都取得了令人满意的性能。因此当无法提前确定每个类别的重要性时,就需要在类别之间获得多样化的最优权衡以供决策者选择。

文章贡献

针对搜索 Pareto 前沿需要生成大量的解导致大量模型训练开销的问题,本文提出了多分类多目标选择集成 MMSE 框架。该框架在多目标建模中引入选择性集成,这样就不必重复训练整个模型,而是通过不同的基础学习器组合来获得不同的模型。训练单个学习器时使用了不同比例的欠采样数据集进行训练,提高了训练效率。同时由多个基学习器集成得到的模型可以覆盖更多的训练样本,避免了信息丢失的问题,在不同的类中具有更多样化的性能选择。当类的数量增加时,因为大多数生成的解是不可比较的,优化问题变得困难。本文进一步提出了一个基于边际的版本 MMSEmargin,它通过优化标签和实例边界来优化常见的性能度量,将目标数量减少到 3 个,同时仍然可以对常用的指标进行优化。

本文方法

问题定义

给定多分类预测器 f:Rd→R

标签:集成,Multi,MMSEmargin,multi,目标,分类器,所示,Reading,优化
From: https://www.cnblogs.com/linfangnan/p/18383226

相关文章

  • 载波监听多址接入碰撞检测 CSMA/CD(carrier sense multiple access collision detecti
    载波监听多址接入/碰撞检测CSMA/CD(carriersensemultipleaccess/collisiondetection)概念解析在总线局域网使用的协议多址接入MA:多个站连接在同一条线上,竞争使用总线。载波监听CS:每一个站在发送帧之前都要检测一下总线上是否有其他站点在发送帧(”先听后说“)......
  • CF1741F-Multi-ColoredSegments
    https://www.luogu.com.cn/problem/CF1741Fhttps://codeforces.com/contest/1741/problem/F参考:https://www.luogu.com.cn/article/bb54tb8m考虑用线段树维护每个点被几条线段覆盖,然后按照颜色分类,每次做其中一类,把同类颜色从线段树中去掉,然后先区间求和看有没有重叠,再左端点往......
  • [Paper Reading] ControlNet: Adding Conditional Control to Text-to-Image Diffusio
    ControlNet:AddingConditionalControltoText-to-ImageDiffusionModelslink时间:23.11机构:StandfordTL;DR提出ControlNet算法模型,用来给一个预训练好的text2image的diffusionmodel增加空间条件控制信息。作者尝试使用5w-1M的edges/depth/segmentation/pose等信息训练Co......
  • PyTorch深度学习实战(26)—— PyTorch与Multi-GPU
    当拥有多块GPU时,可以利用分布式计算(DistributedComputation)与并行计算(ParallelComputation)的方式加速网络的训练过程。在这里,分布式是指有多个GPU在多台服务器上,并行指一台服务器上的多个GPU。在工作环境中,使用这两种方式加速模型训练是非常重要的技能。本文将介绍PyTorch中......
  • KASAN 中kasan_multi_shot 的作用
    kasan_multi_shot是Linux内核配置选项之一,与KernelAddressSanitizer(KASAN)相关。KASAN是一种内核内存错误检测工具,能够检测内核代码中的各种内存错误,例如越界访问、使用未初始化的内存、双重释放等。默认情况下,KASAN在检测到内存错误后会触发内核panic并停止系统的......
  • 并行处理的魔法:PyTorch中torch.multiprocessing的多进程训练指南
    并行处理的魔法:PyTorch中torch.multiprocessing的多进程训练指南在深度学习领域,模型训练往往需要大量的计算资源和时间。PyTorch,作为当前最流行的深度学习框架之一,提供了torch.multiprocessing模块,使得开发者能够利用多核CPU进行多进程训练,从而显著加速训练过程。本文将深......
  • [Paper Reading] Transfusion: Predict the Next Token and Diffuse Images with One
    Transfusion:PredicttheNextTokenandDiffuseImageswithOneMulti-ModalModellink时间:24.08机构:Waymo&UniversityofSouthernCaliforniaTL;DR提出一种使用混合模态token来训练transformer,名为transfusion,是一种生成式AI模型。主要工作使用了2T的tokens结合语言......
  • [Paper Reading] One-Stage 3D Whole-Body Mesh Recovery with Component Aware Trans
    One-Stage3DWhole-BodyMeshRecoverywithComponentAwareTransformerlink时间:CVPR2023机构:粤港澳大湾区数字经济研究院(IDEA)&&清华大学深圳国际研究生院TL;DR使用一个纯Transformer结构模型(名为OSX)直接预测Body/Hand/Face的参数,避免了之前各模型分开预测后融合复......
  • 【ACMMM2024】Multi-Scale and Detail-Enhanced Segment Anything Model for Salient
    论文:https://arxiv.org/pdf/2408.04326代码:https://github.com/BellyBeauty/MDSAM论文的研究动机就是使用SAM来解决显著性检测(SOD)问题,主要有两个改进:提出了LightweightMulti-ScaleAdapter,LMSA来微调SAM提出了Multi-LevelFusionModule,MLFM和DetailEnhancementM......
  • Multipass虚拟机ssh登录(密码方式)
    Multipass虚拟机ssh登录(密码方式)[!NOTE]以Ubuntu24,04LTS为例准备工作为了演示新建一个示例虚拟机。multipasslaunch--namevm01-c4-m4G-d100G--networkbridged操作步骤进入虚拟机multipassshellvm01设置密码multipass默认会给所有实例生......