使用scikit-learn中的KNN包实现对鸢尾花数据集的预测

时间：2025-01-23 19:29:05浏览次数：3

引言

K最近邻（KNN）算法是一种简单且直观的分类算法。它通过计算数据点之间的距离来对新样本进行分类。鸢尾花数据集是一个经典的机器学习数据集，包含了三种不同类型的鸢尾花，每种类型由四个特征（花萼长度、花萼宽度、花瓣长度和花瓣宽度）描述。本文将使用scikit-learn中的KNN算法对该数据集进行分类预测。

KNN算法概述

KNN算法的核心思想是：对于一个未知类别的样本，通过计算该样本与已知样本的距离，选择距离最近的K个样本进行投票，最终将该样本分类为票数最多的类别。

KNN的优缺点：

优点：
- 简单易懂，易于实现。
- 对于小型数据集效果较好。
缺点：
- 计算复杂度高，特别是数据量大时。
- 对数据的尺度敏感，可能需要进行标准化处理。

代码展示

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

#加载鸢尾花数据集
iris = datasets.load_iris()
#提取出特征数据
iris_X=iris.data
#目标标签
iris_y=iris.target

#会打乱数据
#test_size测试比例，train_test_split把训练数据和测试数据分开
X_train,X_test,y_train,y_test=train_test_split(iris_X,iris_y,test_size=0.3)

#训练模型
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train,y_train)

#预测值
print(knn.predict(X_test))

#真实值
print(y_test)

运行结果

总结

KNN算法是一种简单且有效的分类方法，尤其适用于小型数据集。在鸢尾花数据集上，KNN算法能够准确地对样本进行分类，并且选择合适的K值能够显著提升模型性能。

标签：KNN,iris,scikit,train,test,鸢尾花,数据
From： https://blog.csdn.net/qq_65009672/article/details/145328332

[Machine Learning] 使用经典分类模型k最近邻（kNN）实现鸢尾花分类
一、内容实现概述本文主要讲述使用scikit-learn库内置的kNN模型，实现鸢尾花分类。具体实现过程如下：1.导入所需库：预先导入scikit-learn库2.导入数据：调用sklearn库内置的加载数据的方法load_iris()，导入鸢尾花数据3.数据预处理：对鸢尾花数据进行预处理，获得特征数据与目标数据4......
[Machine Learning] 使用经典分类模型k-最近邻（kNN）实现手写数字识别
一、内容实现概述本文主要讲述使用scikit-learn库内置的kNN模型，实现手写数字识别预测房价实现过程如下：导入所需库：预先导入pandas、matplotlib以及scikit-learn库导入数据：使用pandas库的文件解析方法read_csv()，读取房价文件数据数据预处理：对房价数据进行预处理，获得特征数据与......
模式识别课程设计报告-Iris鸢尾花样本集多种分类算法实现
课程实验报告，从前人的总结分享中学习借鉴了很多，上传记录，或许能帮到有需要的人。任务一：（1）从sklean中导入iris数据集（2）从CSV文件中导入iris数据集任务二：（1）利用sklearn中的model_selection.train_split()函数将样本集划分为训练集和测试集（2）定义一个函数plot_points（），该函数的功能......
Python实现鸢尾花数据集可视化分析（超详细教程）
目录一、下载数据集二、本文总代码三、连续变量可视化3.1散点图3.1.1定义3.1.2代码3.1.3代码解析3.1.4结果展示3.22D曲线图3.2.1定义3.2.2代码3.2.3代码解析3.2.4结果展示3.3分组直方图3.3.1定义3.3.2代码3.3.3代码解析3.3.4结果展示3.4......
Python机器学习算法KNN、MLP、NB、LR助力油气钻井大数据提速参数优选及模型构建研究
全文链接：https://tecdat.cn/?p=38601原文出处：拓端数据部落公众号分析师：HuayanMu随着机器学习和大数据分析技术的发展，帮助客户进行油气行业数字化转型势在必行，钻井提速参数优选呈现由经验驱动、逻辑驱动向数据驱动转变的趋势。机械钻速最大化、机械比能最小化是钻井过程中常考......
python电影推荐系统数据分析大数据毕业设计可视化大屏爬虫集成学习 Stacking模型
博主介绍：✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久，选择我们就是选择放心、选择安心毕业✌>......
Flask电影推荐系统数据分析可视化大屏大数据毕业设计爬虫集成学习 Stacking模型
博主介绍：✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久，选择我们就是选择放心、选择安心毕业✌>......
yolov5单目测距与相机标定流程和c++单目测距RKNN部署
相机模型、相机标定及基于YOLOv5的单目测距实现1.前言注意此方法不需要预先知道物体尺寸，不需要参照物体！！！！在摄像头成像的过程中，物体反射的光线通过摄像头的凸透镜聚焦到成像器件上，形成一张二维图像。这一过程将三维世界中的物体转换为二维图像，导致深度信息丢失，因此单目摄......
Pyhton知识分享-利用KNN算法实现手写数字识别
利用KNN算法实现手写数字识别MNIST手写数字识别是计算机视觉领域中"helloworld"级别的数据集1999年发布，成为分类算法基准测试的基础随着新的机器学习技术的出现，MNIST仍然是研究人员和学习者的可靠资源。本次案例中，我们的目标是从数万个手写图像的数据集中正确识别数......
【机器学习超详细版】用K-近邻算法精准分类鸢尾花并实现数据可视化，全网最完整详细
使用K-近邻算法（KNN）进行鸢尾花数据集分类及可视化分析在本篇博客中，我们将深入探讨如何使用K-近邻算法（K-NearestNeighbors,KNN）对经典的鸢尾花数据集（IrisDataset）进行分类，并通过多种可视化手段来理解数据和模型的表现。通过这些步骤，你将不仅能够实现一个高效的分类模型，......

使用scikit-learn中的KNN包实现对鸢尾花数据集的预测

引言

KNN算法概述

KNN的优缺点：

代码展示

运行结果

总结

相关文章

赞助商

阅读排行