• 2024-09-16day9
    缺失值处理importnumpyasnpimportmatplotlib.pyplotaspltimportpandasaspdfrommatplotlib.font_managerimportFontPropertiesfromsklearnimportdatasetsfont=FontProperties(fname='/Library/Fonts/Heiti.ttf')fromioimportStringIOiris_da
  • 2024-09-15使用knn算法对iris数据集进行分类
    程序功能使用scikit-learn库中的鸢尾花数据集(Irisdataset),并基于KNN(K-NearestNeighbors,K近邻)算法进行分类,最后评估模型的准确率。代码fromsklearnimportdatasets#加载鸢尾花数据集iris=datasets.load_iris()#查看数据集中的特征和目标print(iris.data[
  • 2024-09-13【机器学习实战】用sklearn玩转随机森林,分类准确率提升秘籍!
    在机器学习的世界里,随机森林算法以其出色的分类和回归能力而闻名。我们将深入sklearn库中的随机森林,探索如何通过实战提升模型的分类准确率。一随机森林算法简介随机森林是一种集成学习方法,通过构建多个决策树并综合它们的预测结果来提高预测准确性。每个决策树都是在训
  • 2024-09-09关于交叉验证的一些介绍
    在这篇文章中,我将介绍“交叉验证”这一评估泛化性能的统计学方法,它比起单次划分训练集与测试集的方法更稳定与全面。首先我会简单介绍它的概念,然后是分层k折交叉验证和其他策略,最后是一些代码实现。一、概念交叉验证(k-foldcross-validation),是指将数据集进行多次划分,分为几
  • 2024-09-03Python中,使用`sklearn.preprocessing`模块中的`StandardScaler`或`MinMaxScaler`可以对数据进行标准化或归一化处理 数据预处理
    在Python中,使用`sklearn.preprocessing`模块中的`StandardScaler`或`MinMaxScaler`可以对数据进行标准化或归一化处理。以下是如何对一个列表(list)中的数据进行标准化的示例:第一结合numpy###使用StandardScaler进行标准化(Z-scorenormalization)`StandardScaler`将数据转换为均值
  • 2024-08-31【机器学习】sklearn核心分类算法比较
    sklearn核心分类算法比较sklearn分类问题的核心算法及其关联核心分类算法其他分类算法算法之间的关联示例代码运行结果sklearn分类问题的核心算法及其关联在scikit-learn中,分类问题是机器学习中最常见的任务之一。scikit-learn提供了多种分类算
  • 2024-08-27特征选择
    参考:https://blog.csdn.net/Datawhale/article/details/120582526https://zhuanlan.zhihu.com/p/74198735特征选择目录特征选择一般流程三大类方法过滤法1.单变量2.多变量2.1连续型vs连续型(1)Pearson相关系数(2)斯皮尔曼相关系数2.2连续型vs类别型(1)方差分析(2)肯德
  • 2024-08-22机器学习-KNN 算法
    一.K-近邻(KNN)K-近邻(K-NearestNeighbors,简称KNN)是一种基于实例的学习算法,主要用于分类和回归问题。KNN的工作原理直观且简单,它基于相似性进行预测,也就是说给定一个新的数据点,KNN算法会查找距离最近的K个数据点,然后通过这些邻居来确定新数据点的类别(在分类任务中)或
  • 2024-08-21机器学习线性回归算法——原理+python详细代码解析(sklearn)
    线性回归算法作为经典的机器学习算法之一,拥有极为广泛的应用范围,深受业界人士的青睐。该算法主要用于研究分析响应变量如何受到特征变量的线性影响。其通过构建回归方程,借助各特征变量对响应变量进行拟合,并且能够利用回归方程进行预测。鉴于线性回归算法较为基础、简单,所以比较
  • 2024-08-081.13 - 动手学聚类算法
    1.基于距离的k-means聚类,需要人工提供聚簇数量K1.1通过肘方法确定最佳聚簇数量 importnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansfromsklearn.preprocessingimportStandardScalerfromsklearn.datasetsimportmake_blobs,lo
  • 2024-08-05机器学习-线性回顾
    线性回归线性回归1.简介2.线性回归问题求解3.欠拟合与过拟合线性回归1.简介"""简介: 定义: 利用回归方程对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式 公式: 见下图 分类: 一元线性回归: 目标值与一个因变量有关
  • 2024-08-04【数学建模导论】Task04 机器学习
    前言Problem-BasedLearning.以解决问题为导向进行学习,培养工具思维本章会接触到大量的算法,一方面要理解算法的基本原理,另一方面又要能针对实际问题进行灵活应用。w(゚Д゚)w要长脑子了!我们完全可以把机器学习算法视作工具去使用。机器学习本身就是统计模型的延伸使用
  • 2024-08-01刀具磨损预测工器具磨损预测-RIME-CNN-SVM霜冰算法优化-完整代码数据
    直接看项目演示:刀具磨损预测工器具磨损预测-RIME-CNN-SVM霜冰算法优化_哔哩哔哩_bilibili效果演示:代码: importnumpyasnpimporttorchimporttorch.nnasnnimporttorch.nn.functionalasFimporttorch.optimasoptimfromtorch.utils.dataimportDataLoad
  • 2024-07-31数据分割的艺术:揭秘Sklearn中的分割技巧
    数据分割的艺术:揭秘Sklearn中的分割技巧在机器学习领域,数据分割是至关重要的一步,它帮助我们评估模型的泛化能力,避免过拟合,并确保模型在真实世界中的表现。Scikit-learn(简称sklearn),作为Python中最受欢迎的机器学习库之一,提供了多种数据分割方法。本文将深入探讨sklearn中的
  • 2024-07-31多输入多输出预测:在Scikit-Learn中打造灵活的机器学习模型
    多输入多输出预测:在Scikit-Learn中打造灵活的机器学习模型在机器学习领域,Scikit-learn(简称sklearn)是一个功能强大且广泛使用的Python库。它提供了众多简单而有效的工具,用于数据挖掘和数据分析。然而,sklearn大多数内置的模型仅支持单输入单输出(SISO)的预测。当面对多输入多输
  • 2024-07-31数据探索的聚宝盆:sklearn中分层特征聚类技术全解析
    数据探索的聚宝盆:sklearn中分层特征聚类技术全解析在机器学习领域,聚类是一种无监督学习方法,用于将数据集中的样本划分为若干个组或“簇”,使得同一组内的样本相似度高,而不同组间的样本相似度低。当数据集中包含分层特征时,即特征本身具有某种层次结构,传统的聚类算法可能无法
  • 2024-07-31细流汇海:在sklearn中实现增量特征聚类标签分配
    细流汇海:在sklearn中实现增量特征聚类标签分配在机器学习领域,聚类是一种无监督学习方法,用于将数据点分组成多个簇,使得同一簇内的数据点相似度高,而不同簇内的数据点相似度低。scikit-learn(简称sklearn)提供了多种聚类算法,但大多数算法都是批量处理的,对于动态数据或在线学习场
  • 2024-07-31热力图 以分类为例
    逻辑回归可以分为线性与非线性,也可以根据类的个数分为二分类与多分类问题,使用时需要灵活应用,能够构造损失函数并求梯度,同时能够用算法实现并进行训练预测。事实上,观察后会发现,在逻辑回归中,我们发现是多个输入(即p个指标),最终输出一个结果(0或1),处理过程是输入乘上权重w加偏置b,再对结
  • 2024-07-30细流归海:在sklearn中实现增量特征归一化
    细流归海:在sklearn中实现增量特征归一化在机器学习中,特征归一化是提升模型性能的关键步骤之一,它确保了不同量级的特征对模型训练的影响是均衡的。scikit-learn(简称sklearn)提供了多种工具来实现特征归一化,但对于动态数据或在线学习场景,我们需要使用增量归一化方法。本文将详
  • 2024-07-28whystea4
    importpandasaspdfromsklearn.model_selectionimporttrain_test_splitfromsklearn.linear_modelimportLogisticRegression,Ridgefromsklearn.svmimportSVCfromsklearn.treeimportDecisionTreeClassifierfromsklearn.neighborsimportKNeighborsClassifi
  • 2024-07-28whystea3
    importpandasaspdfromsklearn.model_selectionimporttrain_test_splitfromsklearn.linear_modelimportLogisticRegression,Ridgefromsklearn.svmimportSVCfromsklearn.treeimportDecisionTreeClassifierfromsklearn.neighborsimportKNeighborsClassifi
  • 2024-07-28sklearn应用朴素贝叶斯算法
    假设一个学校有45%的男生和55%的女生,学校规定不能穿奇装异服,男生的裤子只能穿长筒裤,而女生可以穿裙子或者长筒裤,已知该学校穿长筒裤的女生和穿裙子的女生数量相等,所有男生都必须穿长筒裤,请问如果你从远处看到一个穿裤子的学生,那么这个学生是女生的概率是多少?看完上述问题,
  • 2024-07-24机器学习基础
    目录机器学习开发流程一、特征工程1.数据获取以鸢尾花为例2.特征抽取字典特征提取文本特征提取普通文本特征提取jieba分词TF-IDF重要程度3.特征编码4.特征预处理归一化标准化5.特征降维二、分类算法KNN算法knn算法实现模型选择与调优案例:facebook签到位置朴素贝叶斯决策树三、回
  • 2024-07-19线性回归:解锁数据预测的金钥匙
    线性回归:解锁数据预测的金钥匙在机器学习领域中,线性回归是一种基础且强大的预测模型,它通过拟合数据点来预测连续值的输出。本文将深入探讨如何在Python的sklearn库中使用线性回归进行预测,并通过实际代码示例,展示如何应用这一技术。线性回归简介线性回归是一种监督学习算
  • 2024-07-19sklearn中的增量学习:特征提取的艺术
    sklearn中的增量学习:特征提取的艺术在机器学习领域,特征提取是构建有效模型的关键步骤。然而,并非所有数据集都适合一次性加载到内存中进行处理,尤其是在处理大规模数据集时。Scikit-learn(sklearn)提供了一些支持增量学习的模型,允许用户逐步地从数据中学习并提取特征。本文将详