首页 > 其他分享 >SK都是干什么的

SK都是干什么的

时间:2023-11-24 13:24:51浏览次数:32  
标签:labels 干什么 聚类 SK score 计算 pred true

参考文档:非常全面的Sklearn介绍 (qq.com)

scikit-learn: machine learning in Python — scikit-learn 1.3.2 documentation

分类(Classification): 实现了多种监督学习分类算法,例如支持向量机(SVM)、决策树、随机森林等。

  

from sklearn.svm import SVC
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
 

  

# 创建XXX分类器
rf_classifier = RandomForestClassifier(n_estimators=100, random_state=42)
# 训练模型
rf_classifier.fit(X_train, Y_train)
# 在测试集上进行预测
y_pred = rf_classifier.predict(x_test)

  

回归(Regression): 提供了多种监督学习回归算法,例如线性回归、岭回归、Lasso回归等。

聚类(Clustering): 包括了一系列无监督学习的聚类算法,如K均值聚类、层次聚类等。

降维(Dimensionality Reduction): 提供了降维算法,例如主成分分析(PCA)、奇异值分解(SVD)等。

模型选择(Model Selection): 包含了用于模型评估、参数调优和交叉验证的工具。

预处理(Preprocessing): 提供了数据预处理的工具,如标准化、归一化、缺失值填充等。

特征工程(Feature Engineering): 包括了一些用于特征选择和特征变换的工具。

集成方法(Ensemble Methods): 支持集成学习方法,如随机森林、梯度提升等。

 

计算指标(metrics):

 

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

分类指标:

  1. 准确性(Accuracy):

    • accuracy_score(y_true, y_pred): 计算分类准确性。
  2. 精确度(Precision):

    • precision_score(y_true, y_pred): 计算正类别的精确度。
  3. 召回率(Recall):

    • recall_score(y_true, y_pred): 计算正类别的召回率。
  4. F1分数(F1 Score):

    • f1_score(y_true, y_pred): 结合精确度和召回率的指标。
  5. 混淆矩阵(Confusion Matrix):

    • confusion_matrix(y_true, y_pred): 计算混淆矩阵。
  6. 分类报告(Classification Report):

    • classification_report(y_true, y_pred): 显示包括精确度、召回率、F1分数等在内的多个分类指标。
  7. ROC曲线和AUC值:

    • roc_curve(y_true, y_score): 计算ROC曲线的值。
    • roc_auc_score(y_true, y_score): 计算AUC值。
  8. Log Loss(对数损失):

    • log_loss(y_true, y_prob): 适用于概率输出的多分类对数损失。

回归指标:

  1. 均方误差(Mean Squared Error,MSE):

    • mean_squared_error(y_true, y_pred): 计算均方误差。
  2. 平均绝对误差(Mean Absolute Error,MAE):

    • mean_absolute_error(y_true, y_pred): 计算平均绝对误差。
  3. R²分数(R-squared Score):

    • r2_score(y_true, y_pred): 计算R²分数。

聚类指标:

  1. 轮廓系数(Silhouette Coefficient):

    • silhouette_score(X, labels): 计算聚类的轮廓系数。
  2. 调整兰德指数(Adjusted Rand Index):

    • adjusted_rand_score(labels_true, labels_pred): 计算调整兰德指数。
  3. 标准化互信息(Normalized Mutual Information):

    • normalized_mutual_info_score(labels_true, labels_pred): 计算标准化互信息

  

 

标签:labels,干什么,聚类,SK,score,计算,pred,true
From: https://www.cnblogs.com/mxleader/p/17853516.html

相关文章

  • Skeleton Screen/加载占位图流光闪动效果收集
    SkeletonScreenLoading,又叫SkeletonScreen/加载占位图,就是显示dom骨架,加上流光加载效果。骨架流光的原理,就是渐变色(linear-gradient多个颜色)+背景拉伸(background-size:400%100%)+背景移动(background-position)1.CSS实现SkeletonScreen(骨架屏)li{backgrou......
  • 聪明办法学python(task3and4)
    (直接跳到相应部分查看即可)Python基础输入---print()直接使用print()函数,在括号中加入字符串(可以用双引号也可以用单引号,不能混用)print()也可接受多个字符串,用逗号隔开,遇到逗号输出一个空格输出---input()输出使用input()函数![屏幕截图2023-11-13192454](C:\Users\AS......
  • husky 源码浅析
    前言我们在上一篇中讲了自定义GitHook,那么前端同学有没有对husky的工作原理产生好奇呢,为什么husky可以让git执行他指定目录下的hooks目录呢?我们这一篇文章就带大家通过源码分析一下husky的工作原理,同时基于husky源码我们拓展讲一下如何使用Node.js编写cli......
  • Python TASK02 :数据类型操作
    #数据类型操作####常用内置类型BUILTINTYPES1.整数Integer(int)2.浮点数Float3.布尔值Boolean(bool)4.类型Type(是的,“类型”也是种类型!)严格的来说,Type是一种类的对象,Python是一门“面向对象友好”的语言 so:print(type(2))--><class'int'>......
  • python-task3:Data Types and Operators
    常见数据类型整数Integer(int)浮点数Float(python中默认为双精度浮点型)布尔值Boolean(bool)类型Type(“类型”也是种类型)其他数据类型字符串String(str)、列表List、元组Tuple、集合Set、字典Dictionary(dict,或者可以叫它映射map)、复数ComplexNumber(complex)、函数Func......
  • python-task4:Variables and Functions
    变量Variables以字母或下划线(_)开头(不可以以数字开头)以字母、数字、下划线组成大小写敏感(A与a不一样)需要避免使用保留字命名,以下代码可查询保留字importkeywordkeyword.kwlist对于变量,旧的值会覆盖新的值,而且python支持多变量赋值a=b=c=2print(f"a={a},b={b},c={c}"......
  • 您可以尝试添加 --skip-broken 选项来解决该问题 ** 发现 2 个已存在的 RPM 数据库问
    ##提示如下**Found2pre-existingrpmdbproblem(s),‘yumcheck’outputfollows:2:postfix-2.10.1-7.el7.x86_64hasmissingrequiresoflibmysqlclient.so.18()(64bit)2:postfix-2.10.1-7.el7.x86_64hasmissingrequiresoflibmysqlclient.so.18(libmysqlclient_18)......
  • Flask-debug模式
    不开debug模式的问题修改源代码需要重启程序才会生效程序出错没有错误的详细信息,不利于排查分析开启debug模式 终端执行:pythonapp.py  ......
  • web图片上传 【flask+vue2】
    直接上传代码demofromflaskimportFlask,request,jsonifyimportosfromflask_corsimportCORS#导入CORS模块#文件存储的目录UPLOAD_FOLDER='uploads'ALLOWED_EXTENSIONS={'png','jpg','jpeg','gif'}app=Flask(_......
  • SketchUp2020-2023官方中文语言包安装问题修复
    在2020以后的版本里,官方出的中文语言包如果不是在安装SketchUp本体而是本体安装完毕后单独安装的,那么这个语言包安装后的文件路径和注册表会默认是2020的版本,也就是说SketchUp官方对于中文社区的态度就是反正很多人都是用盗版,随便糊弄一下就可以了.因此,这个中文语言包......