首页 > 编程语言 >Python 机器学习 K-近邻算法 鸢尾花种类预测

Python 机器学习 K-近邻算法 鸢尾花种类预测

时间:2024-02-03 23:22:05浏览次数:33  
标签:KNN Python 近邻 样本 算法 test 鸢尾花

 

K-近邻算法(K-Nearest Neighbors, KNN)是一种简单而强大的机器学习算法,适用于分类和回归任务。可以使用scikit-learn库的KNN算法来预测鸢尾花(Iris)的种类。鸢尾花数据集是机器学习领域中常用的一个数据集,包含了150个鸢尾花样本,每个样本有四个特征:萼片长度、萼片宽度、花瓣长度和花瓣宽度,以及样本的种类(Setosa、Versicolour、Virginica)。

参考文档:Python 机器学习 K-近邻算法 鸢尾花种类预测-CJavaPy

1、鸢尾花数据集

鸢尾花数据集是机器学习中常用的经典数据集之一,由英国统计学家 R. A. Fisher 于 1936 年收集整理。该数据集包含 150 个样本,每个样本对应一种鸢尾花。并包含 4 个特征:

  • 花萼长度
  • 花萼宽度
  • 花瓣长度
  • 花瓣宽度

根据这 4 个特征,可以将鸢尾花分为 3 类:

  • 山鸢尾 (Iris setosa)
  • 变色鸢尾 (Iris versicolor)
  • 维吉尼亚鸢尾 (Iris virginica)

2、K-近邻算法 (KNN) 种类预测

K-近邻算法 (KNN) 是一种简单有效的机器学习算法,常用于分类和回归任务。KNN 算法通过计算数据点与训练数据集中所有数据点的距离,来确定数据点的类别或预测值。在种类预测任务中,KNN 算法可以用于预测数据点所属的类别。对于测试数据集中的每个样本,计算其与训练数据集中的所有样本的距离。常用的距离度量方法包括欧几里得距离、曼哈顿距离、闵可夫斯基距离等。根据距离计算的结果,找到与测试样本距离最近的 K 个样本。根据 K 近邻的类别,预测测试样本的类别。通常情况下,采用多数投票的方式进行预测,即 K 近邻中出现最多的类别就是测试样本的预测类别。

参考文档:Python 机器学习 K-近邻算法 常用距离度量方法

3、预测和评估

使用 Python 机器学习库 scikit-learn 中的 K-近邻算法 (KNN) 来预测鸢尾花的种类,并进行模型评估。使用鸢尾花(Iris)数据集,应用K-近邻(KNN)算法,同时比较了三种不同的距离度量方法:欧几里得距离(Euclidean)、曼哈顿距离(Manhattan)和切比雪夫距离(Chebyshev)。代码如下,

1)显示报告

# 导入所需的库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

# 加载鸢尾花数据集
iris = load_iris()
X = iris.data
y = iris.target

# 划分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# KNN模型使用不同的距离度量
distance_metrics = ['euclidean', 'manhattan', 'chebyshev']
for metric in distance_metrics:
    # 创建KNN分类器
    knn = KNeighborsClassifier(n_neighbors=3, metric=metric)

    # 在训练集上训练模型
    knn.fit(X_train, y_train)

    # 使用模型对测试集进行预测
    y_pred = knn.predict(X_test)

    # 计算并打印模型准确率
    accuracy = accuracy_score(y_test, y_pred)
    print(f'Accuracy: {accuracy:.2f}')

    # 显示混淆矩阵
    conf_matrix = confusion_matrix(y_test, y_pred)
    print('Confusion Matrix:')
    print(conf_matrix)

    # 显示分类报告
    class_report = classification_report(y_test, y_pred)
    print('Classification Report:')
    print(class_report)

2)显示图表

示例代码:Python 机器学习 K-近邻算法 鸢尾花种类预测-CJavaPy

标签:KNN,Python,近邻,样本,算法,test,鸢尾花
From: https://www.cnblogs.com/tinyblog/p/18005403

相关文章

  • BeautifulSoup爬虫库应用——Python 页面解析
    爬虫技术作为信息搜集的重要手段,在大数据时代发挥着至关重要的作用。通过网络爬虫,可以高效地从各种在线源头获取大规模、多样化的数据,为大数据分析和应用提供了必要的原始材料。首先,爬虫使得大数据的采集更为全面和及时。网络上存在着庞大的信息资源,包括社交媒体、新闻网站、电子......
  • 工作安排-od-python
    工作安排小明每周上班都会拿到自己的工作清单,工作清单内包含n项工作,每项工作都有对应的耗时时长(单位h)和报酬,工作的总报酬为所有已完成工作的报酬之和。那么请你帮小明安排一下工作,保证小明在指定的工作时间内工作收入最大化。输入描述输入的第一行为两个正整数T,n。T代表工作......
  • Python随机波动模型Stochastic volatility,SV随机变分推断SVI分析标普500指数股票价格
    全文链接:https://tecdat.cn/?p=33809原文出处:拓端数据部落公众号随机波动模型(Stochasticvolatilitymodels)经常被客户用来对股票价格随时间的变动性进行建模。波动性(volatility)是随时间的对数收益的标准差。与假设波动性恒定不变不同,随机波动模型具有隐变量参数,可以在每个时刻......
  • 狼羊过河-od-python
    羊、狼、农夫都在岸边,当羊的数量小于狼的数量时,狼会攻击羊,农夫则会损失羊。农夫有一艘容量固定的船,能够承载固定数量的动物。要求求出不损失羊情况下将全部羊和狼运到对岸需要的最小次数。只计算农夫去对岸的次数,回程时农夫不会运送羊和狼。备注:农夫在或农夫离开后羊的数量大......
  • (python)代码学习||2024.2.3||题目是codewars上的【Validate Sudoku with size `NxN`
    题目的要求是写一个Sudoku类,类中要有一个实例函数判断传给对象的二维数组是否符合数独规则题目链接:https://www.codewars.com/kata/540afbe2dc9f615d5e000425/python下面是写完题后看到的别人的解决方法fromitertoolsimportchainclassSudoku(object):def__init__......
  • 设计一个学生管理系统(Python类的使用案例)
    设计一个学生管理系统设计学生类(Student)属性:姓名(name)、学号(student_id)、年龄(age)、成绩(grades) 设计学生管理系统类(StudentManagementSystem)属性:学生列表(students)  classStudent:def__init__(self,name,id,age,grades):self.name=namesel......
  • Python数据结构与算法06——树与树算法
    二叉树classNode(object):def__init__(self,val,lchild=None,rchild=None):self.val=valself.lchild=lchildself.rchild=rchildclassTree(object):def__init__(self):self.root=Nonedefadd(self,item):no......
  • 求最大数字-od-python
    求最大数字题目给定一个由纯数字组成以字符串表示的数值,现要求字符串中的每个数字最多只能出现2次,超过的需要进行删除;删除某个重复的数字后,其它数字相对位置保持不变。如34533,数字3重复超过2次,需要删除其中一个3,删除第一个3后获得最大数值4533请返回经过删除操作......
  • 【Python基础】日志工具介绍及使用
    日志的主要功能日志不是软件功能的必需品,但是对于软件开发和维护具有至关重要的作用,其主要的作用在于:问题追踪和调试:当程序出现错误或异常行为时,日志可以提供关于何时以及在哪里发生问题的详细信息,对于识别、隔离和修复错误很有帮助。审计和合规性:提供详细的操作记录,用于证......
  • Python小白入门指南:从零开始掌握Python编程
    你是否曾想过用代码操控电脑、制作自动化任务,或者探索数据的奥秘?今天,我要带你进入Python的世界,为你揭开编程的神秘面纱。不论你是编程零基础,还是想学习一门新技能,这篇文章都将是你学习Python的得力助手。一、Python是什么?为什么要学Python?Python是一种高级、动态类型的编程语言,它的......