首页 > 其他分享 >make_classification函数

make_classification函数

时间:2024-03-01 21:59:43浏览次数:15  
标签:函数 classification 特征 make redundant informative scores

 

sklearn.datasets.make_classification

sklearn.datasets.make_classification(n_samples=100, n_features=20, *, n_informative=2, n_redundant=2, n_repeated=0, n_classes=2, n_clusters_per_class=2, weights=None, flip_y=0.01, class_sep=1.0, hypercube=True, shift=0.0, scale=1.0, shuffle=True, random_state=None)

  

生成一个随机的 n nn 类分类问题。

在不打乱的情况下,X按以下顺序水平堆叠特征:主要n_informative特征,然后n_redundant 是信息特征的线性组合,然后是n_repeated 重复,随机抽取信息和冗余特征的替换。其余特征充满随机噪声。因此,无需改组,所有有用的特征都包含在列中 。X[:, :n_informative + n_redundant + n_repeated]

from sklearn.datasets import make_classification

X, y = make_classification(n_samples=6, n_classes=2, n_features=5, n_informative=5,n_redundant=0,n_clusters_per_class=1)
display(X,y)

"""
n_samples=6 - 6行6个数据
n_classes=2 - 结果分为2类即二分类
n_features=5 - 5个特征
n_informative=5 - 5个全部有效的特征
n_redundant=0 - 冗余特征为0
n_clusters_per_class=1 - 每一个类别聚为一个簇

array([[ 1.10885456, -1.97464085,  2.14372944, -0.08241471, -2.60173628],
       [ 0.98456921, -4.67257395, -0.10161149,  0.52329866,  2.0178222 ],
       [-2.92441307, -2.20249011,  0.12827954,  1.90711152,  0.24340137],
       [ 0.14524134, -1.42685331,  1.92731161, -0.72915701,  1.3529692 ],
       [-0.09694719, -0.28604481, -2.62609999, -0.46131174,  0.72515074],
       [ 0.25540393, -2.64589841, -2.05721611,  0.53203936,  0.34273113]])
       
array([0, 1, 1, 0, 1, 0])
"""

  

同时参考这链接中的不平衡数据部分,以及代码部分的crossvalidate()

classifier = RandomForestClassifier() 

scores = cross_validate(
    classifier, X, y, cv=10, 
    scoring=['accuracy', 'precision', 'recall', 'f1']
)

scores = pd.DataFrame(scores)
scores.mean()

  

标签:函数,classification,特征,make,redundant,informative,scores
From: https://www.cnblogs.com/Li-JT/p/18048028

相关文章

  • C++ 从函数返回指针
    C++允许从函数返回指针,必须声明一个返回指针的函数:int*myFunction()C++不支持在函数外返回局部变量的地址,除非定义局部变量为static变量。1#include<iostream>2#include<ctime>3#include<cstdlib>4 5usingnamespacestd;6 7//要生成和返回随......
  • [ABC217F] Make Pair 题解
    [ABC217F]MakePair题解思路解析通过\(n\le200\)和“选出的两个学生离开队列,空出来的位置左右合拢”这两个细节可以想到能用区间dp做,\(f_{i,j}\)表示将\(i\toj\)这个区间全部选完的方案数,然后常规区间dp,加一个判断如果当前区间\([l,r]\)中\(l,r\)是朋友,就可......
  • Vue学习笔记31--自定义指令--函数式
    Vue学习笔记-自定义指令<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0"><title>自定义指令</title&......
  • 第八章 函数设计与应用
    第八章函数设计与应用一、函数定义和使用1、基本语法def函数铭([参数列表]):​ ""注释""​ 函数提2、递归函数函数在执行过程中又调用了函数自己回文:defisPalindrome(text): iflen(text)<=1: returnTrue iftext[0]!=text[-1] returnFalse returnisPali......
  • 关于pacemaker-集群-token-网络心跳检测时间的修改
    在笔者操作系统Redhat8.8中,pacemaker默认的token时间为3000毫秒,也可以理解成心跳检测时间这样根据默认的规则,consensus有时间如果没有特别指定的话,将是token*1.2,即3600毫秒[root@azdb01qq-5201351]#corosync-cmapctl|grep'totem.token\|consensus'runtime.config.tote......
  • Python函数每日一讲 - help函数的使用与实践
    引言今天周五,我们来看一个简单又熟悉的函数help(),help()函数就是Python中一个非常有用的工具,它能够帮助我们快速查找和理解Python中的各种函数、模块和对象的用法和功能。语句概览help()函数是Python内置函数之一,用于获取帮助信息。其语法格式如下:help([object])其中,object......
  • 傅里叶展开为什么要求函数有周期性
        傅里叶级数展开是针对有限区间,而不是周期。课本上写的周期其实是方便运算而已,有限区间上面的表示方法可以由简单的三角函数基函数表示。因为级数展开是在一个有限的时间段内对函数进行分解,然后用一系列正弦和余弦函数的线性组合来表示这个有限区间函数(或者说有限区间上面......
  • 掌握字符与字符串:C语言中的神奇函数解析(三)
    ✨✨欢迎大家来到贝蒂大讲堂✨✨......
  • 高 j 轨道上价核子波函数密度分布
    高\(j\)轨道即高\(l\)轨道,\(j\)是\(l\)与\(s\)的耦合:\[\vec{j}=\vec{l}\otimes\vec{s}.\]可以先不考虑自旋,定性了解氢原子波函数的几率分布。1.氢原子波函数氢原子波函数为\[\psi(n,l,m)=R_{nl}(r)Y_{lm}(\theta,\phi),\]其密度为\[|\psi|^2=|R_{nl}......
  • 农村高中生源转型期提升学生二次函数建模能力的课堂探究
      在新课程下,培养学生的数学核心素养是高中数学课堂教学的根本任务。其中的建模思想是数学核心素养培养的一个基本指标,是学生正确认识数学知识内在本质与原理的重要思维工具。通过在数学课堂教学中有效地应用建模思想,主要的应用意义体现在如下几个方面:其一,通过在数学课堂中融入......