样本不平衡(Imbalanced Data),也尝尝成为类别不平衡,是指各个类别的样本数目相差悬殊的情况。
下面以多数类表示有很多样本的类别,少数类表示样本数目很少的类别。
样本不平衡的情况下,分类变得困难的原因是,少数类中样本数很少,提供的信息有限,模型很难从这些样本中学习到少数类的数据分布结构。(其实原因挺复杂的)
标签:样本数,样本,问题,少数类,类别,平衡,数目 From: https://www.cnblogs.com/picassooo/p/16711937.html
样本不平衡(Imbalanced Data),也尝尝成为类别不平衡,是指各个类别的样本数目相差悬殊的情况。
下面以多数类表示有很多样本的类别,少数类表示样本数目很少的类别。
样本不平衡的情况下,分类变得困难的原因是,少数类中样本数很少,提供的信息有限,模型很难从这些样本中学习到少数类的数据分布结构。(其实原因挺复杂的)
标签:样本数,样本,问题,少数类,类别,平衡,数目 From: https://www.cnblogs.com/picassooo/p/16711937.html