种随机样本的生成器,可以用来建立可控制大小和复杂性的人工数据集。
`种随机样本的生成器,可以用来建立可控制大小和复杂性的人工数据集。
make_blob() —— 聚类生成器
make_classification() —— 单标签分类生成器
make_multilabel_classification() —— 多标签生成器
make_regression() —— 回归生成器`
make_blob() —— 聚类生成器
make_classification() —— 单标签分类生成器
make_multilabel_classification() —— 多标签生成器
make_regression() —— 回归生成器
` n_samples=100, # 样本个数
n_features=20, # 特征个数
点击查看代码
n_samples=100, # 样本个数
n_features=20, # 特征个数
n_informative=2, # 有效特征个数
n_redundant=2, # 冗余特征个数(有效特征的随机组合)
n_repeated=0, # 重复特征个数(有效特征和冗余特征的随机组合)
n_classes=2, # 样本类别
n_clusters_per_class=2, # 蔟的个数
weights=None, # 每个类的权重 用于分配样本点
flip_y=0.01, # 随机交换样本的一段 y噪声值的比重
class_sep=1.0, # 类与类之间区分清楚