今日再度西瓜书,发现实战中用过的地方理解的最深入
今天想着重整理类别不平衡问题
基本策略:再缩放
欠采样,过采样与阈值移动
其中欠采样和过采样都不建议直接复制或删除,而是建议用不同的策略进行。
如过采样用GAN生成或者用差值生成,欠采样将多的例划分为若干集合,供不同学习器使用。从全局看不会丢失信息,从单个分类器看,多例被欠采样。
标签:采样,第三章,缩放,生成,分类器,吃瓜,第二次 From: https://www.cnblogs.com/agis/p/16792020.html
今日再度西瓜书,发现实战中用过的地方理解的最深入
今天想着重整理类别不平衡问题
基本策略:再缩放
欠采样,过采样与阈值移动
其中欠采样和过采样都不建议直接复制或删除,而是建议用不同的策略进行。
如过采样用GAN生成或者用差值生成,欠采样将多的例划分为若干集合,供不同学习器使用。从全局看不会丢失信息,从单个分类器看,多例被欠采样。
标签:采样,第三章,缩放,生成,分类器,吃瓜,第二次 From: https://www.cnblogs.com/agis/p/16792020.html