• 2025-01-06数学建模入门——描述性统计分析
     摘要:本篇博客主要讲解了数学建模入门的描述性统计分析,包括基本统计量的计算、数据的分布形态、数据可视化和相关性分析。往期回顾:数学建模入门——建模流程-CSDN博客数学建模入门——数据预处理(全)-CSDN博客一、基本统计量基本统计量是描述性统计分析的重要组成部分
  • 2025-01-03Python多分类Logistic回归详解与实践
    在机器学习中,Logistic回归是一种基本但非常有效的分类算法。它不仅可以用于二分类问题,还可以扩展应用于多分类问题。本文将详细介绍如何使用Python实现一个多分类的Logistic回归模型,并给出详细的代码示例。一、Logistic回归简介Logistic回归是一种线性模型,用于二分类问题。它通
  • 2025-01-0210.12
    实验一:数据准备与模型评估一、实验目的熟悉Python的基本操作,掌握对数据集的读写实现、对模型性能的评估实现的能力;加深对训练集、测试集、N折交叉验证、模型评估标准的理解。 二、实验内容(1)利用pandas库从本地读取iris数据集;(2)从scikit-learn库中直接加载iris
  • 2024-12-31机器学习 实验二
    fromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_split,cross_validatefromsklearn.linear_modelimportLogisticRegressionfromsklearn.metricsimportmake_scorer,accuracy_score,precision_score,recall_score,f1_scor
  • 2024-12-31机器学习 实验一
    #导入必要的库importpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimportcross_val_score,KFold,cross_val_predictfromsklearn.linear_modelimportLogisticRegressionfromsklearn.metricsimportclassification_report#(
  • 2024-12-31机器学习 实验五
    #导入必要的库fromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_split,cross_val_scorefromsklearn.neural_networkimportMLPClassifierfromsklearn.metricsimportaccuracy_score,precision_score,recall_score,f1_scorei
  • 2024-12-31机器学习 实验四
    importnumpyasnpfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_split,cross_val_score,KFoldfromsklearn.treeimportDecisionTreeClassifierfromsklearn.metricsimportaccuracy_score,precision_score,recall_scor
  • 2024-12-31机器学习 实验七
    #导入必要的库fromsklearnimportdatasetsfromsklearn.model_selectionimporttrain_test_splitfromsklearn.clusterimportKMeansfromsklearn.metricsimportsilhouette_score,accuracy_score,adjusted_rand_scoreimportnumpyasnp#(1)加载数据集并划分数据
  • 2024-12-27机器学习实战:以鸢尾花数据集分类问题为例
    在当今数据驱动的时代,机器学习已成为解决复杂问题的重要工具。本文将通过一个具体的分类问题——鸢尾花数据集(IrisDataset)的分类,展示如何在实际项目中应用机器学习。我们将使用Python编程语言,并借助流行的机器学习库scikit-learn来实现这一目标。文章将详细介绍数据预处理、模型
  • 2024-12-24物联网数据处理-iris数据集(鸢尾花)
    物联网数据处理-iris数据集(鸢尾花)大作业题目读入iris.txt里的鸢尾花数据,不考虑标签信息(标签是用来监督学习用的,这里是无监督),利用PCA(减少噪声,利于可视化)将数据从4维降成2维之后,进行以下操作:利用不同的方式构建邻接矩阵(高斯核,k-临近等)(将数据转成关系图,可以告诉我们那
  • 2024-12-24物联网数据处理-iris数据集(鸢尾花)
    物联网数据处理-iris数据集(鸢尾花)大作业题目读入iris.txt里的鸢尾花数据,不考虑标签信息(标签是用来监督学习用的,这里是无监督),利用PCA(减少噪声,利于可视化)将数据从4维降成2维之后,进行以下操作:利用不同的方式构建邻接矩阵(高斯核,k-临近等)(将数据转成关系图,可以告诉我们那
  • 2024-12-22数据挖掘之认识数据
    在数据挖掘过程中,数据的认识是非常重要的一步,它为后续的数据分析、建模、特征选择等工作奠定基础。以鸢尾花数据集(IrisDataset)数据集之鸢尾花数据集(IrisDataset)-CSDN博客为例,下面将介绍如何从数据下载到可视化展示进行深入认识。1.数据下载鸢尾花数据集是一个经典的机器学
  • 2024-12-21机器学习实验六:朴素贝叶斯算法实现与测试
    实验六:朴素贝叶斯算法实现与测试一、实验目的深入理解朴素贝叶斯的算法原理,能够使用Python语言实现朴素贝叶斯的训练与测试,并且使用五折交叉验证算法进行模型训练与评估。  二、实验内容(1)从scikit-learn库中加载iris数据集,使用留出法留出1/3的样本作为测试集(注
  • 2024-12-21机器学习实验七:K 均值聚类算法实现与测试
    实验七:K均值聚类算法实现与测试一、实验目的深入理解K均值聚类算法的算法原理,进而理解无监督学习的意义,能够使用Python语言实现K均值聚类算法的训练与测试,并且使用五折交叉验证算法进行模型训练与评估。 二、实验内容(1)从scikit-learn库中加载iris数据集,使用留出法
  • 2024-12-21机器学习实验一:数据准备与模型评估
    实验一:数据准备与模型评估一、实验目的 熟悉Python的基本操作,掌握对数据集的读写实现、对模型性能的评估实现的能力;加深对训练集、测试集、N折交叉验证、模型评估标准的理解。 二、实验内容(1)利用pandas库从本地读取iris数据集;(2)从scikit-learn库中直接加载ir
  • 2024-12-1720241227
    实验一:数据准备与模型评估 一、实验目的熟悉Python的基本操作,掌握对数据集的读写实现、对模型性能的评估实现的能力;加深对训练集、测试集、N折交叉验证、模型评估标准的理解。 二、实验内容(1)利用pandas库从本地读取iris数据集;(2)从scikit-learn库中直接加载iris
  • 2024-12-1712.7 每日总结(随机森林算法实现与测试)
    今天学习机器学习算法  一、实验目的深入理解随机森林的算法原理,进而理解集成学习的意义,能够使用Python语言实现随机森林算法的训练与测试,并且使用五折交叉验证算法进行模型训练与评估。二、实验内容(1)从scikit-learn库中加载iris数据集,使用留出法留出1/3的样本
  • 2024-12-1212.12实验八:随机森林算法实现与测试
    实验八:随机森林算法实现与测试一、实验目的深入理解随机森林的算法原理,进而理解集成学习的意义,能够使用Python语言实现随机森林算法的训练与测试,并且使用五折交叉验证算法进行模型训练与评估。 二、实验内容(1)从scikit-learn库中加载iris数据集,使用留出法留出1/3的样
  • 2024-12-1212.11实验七:K 均值聚类算法实现与测试
      一、实验目的深入理解K均值聚类算法的算法原理,进而理解无监督学习的意义,能够使用Python语言实现K均值聚类算法的训练与测试,并且使用五折交叉验证算法进行模型训练与评估。 二、实验内容 (1)从scikit-learn库中加载iris数据集,使用留出法留出1/3的样本作为测
  • 2024-12-1212.9实验五:BP 神经网络算法实现与测试
    实验五:BP神经网络算法实现与测试 一、实验目的深入理解BP神经网络的算法原理,能够使用Python语言实现BP神经网络的训练与测试,并且使用五折交叉验证算法进行模型训练与评估。 二、实验内容(1)从scikit-learn库中加载iris数据集,使用留出法留出1/3的样本作为测试集
  • 2024-12-11机器学习:实验一:数据准备与模型评估
    实验一:数据准备与模型评估 一、实验目的熟悉Python的基本操作,掌握对数据集的读写实现、对模型性能的评估实现的能力;加深对训练集、测试集、N折交叉验证、模型评估标准的理解。二、实验内容(1)利用pandas库从本地读取iris数据集;(2)从scikit-learn库中直接加载iris
  • 2024-12-022024.11.28(周四)
    importpandasaspdimportnumpyasnpfromsklearn.datasetsimportload_irisfromsklearn.ensembleimportRandomForestClassifierfromsklearn.metricsimportprecision_score,recall_score,f1_score,accuracy_scorefromsklearn.model_selectionimporttrain
  • 2024-12-022024.11.27(周三)
    importpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimportcross_val_score,cross_validate,StratifiedKFoldfromsklearn.ensembleimportRandomForestClassifierfromsklearn.metricsimportprecision_score,recall_score,
  • 2024-12-0211.28实验一:数据准备与模型评估
    实验一:数据准备与模型评估一、实验目的熟悉Python的基本操作,掌握对数据集的读写实现、对模型性能的评估实现的能力;加深对训练集、测试集、N折交叉验证、模型评估标准的理解。 二、实验内容(1)利用pandas库从本地读取iris数据集;(2)从scikit-learn库中直接加载iris数
  • 2024-11-29数据预处理方法—特征选择、特征缩放、特征构造
    特征选择1.1原理特征选择是选择对模型训练最重要的特征,减少数据维度,去除冗余或不相关特征,提高模型性能的性能和训练速度,减少过拟合。1.2核心公式 可以使用基于树模型的特征重要性度量,如在随机森林中计算特征的重要性:其中,Ii,j是第j棵树中特征Xi的重要性度量。假设使