首页 > 编程语言 >对红酒数据集,分别采用决策树算法和随机森林算法进行分类。

对红酒数据集,分别采用决策树算法和随机森林算法进行分类。

时间:2024-06-21 20:31:30浏览次数:28  
标签:train clf 算法 score 红酒 test import 决策树 wine

1.导入所需要的包

from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split

2.导入数据,并且对随机森林和决策数进行对比 

x_train,x_test,y_train,y_test=train_test_split(wine.data,wine.target,test_size=0.3)
clf=DecisionTreeClassifier(random_state=0)
rfc=RandomForestClassifier(random_state=0)
clf=clf.fit(x_train,y_train)
rfc=rfc.fit(x_train,y_train)
score_c=clf.score(x_test,y_test)
score_r=rfc.score(x_test,y_test)
print(score_c,score_r)

运行结果:

0.8703703703703703            0.9259259259259259

3.数据可视化 

from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_wine
from sklearn.model_selection import cross_val_score
import matplotlib.pyplot as plt
%matplotlib inline
wine=load_wine()
rfc=RandomForestClassifier(n_estimators=25)
rfc_s=cross_val_score(rfc,wine.data,wine.target,cv=10)
clf=DecisionTreeClassifier()
clf_s=cross_val_score(clf,wine.data,wine.target,cv=10)
plt.plot(range(1,11),rfc_s,label='RandomForest')
plt.plot(range(1,11),clf_s,label='DecisionTree')
plt.legend()
plt.show()

运行结果: 

 

 

 

 

标签:train,clf,算法,score,红酒,test,import,决策树,wine
From: https://blog.csdn.net/weixin_49816293/article/details/139868708

相关文章

  • 基于EKF算法估计电动汽车蓄电池的SOC
    电动汽车(EV)作为未来汽车的一大发展方向,其动力源——动力锂电池组的荷电状态(SOC)估计显得尤为重要。SOC直接反应了电池组剩余容量的多少,是预测EV行驶里程、使用和维护电池组的重要依据。然而,由于电动汽车电池组在使用过程中的高度非线性特性,准确估计SOC面临巨大挑战。扩展Kalman......
  • JavaScript算法之龟兔赛跑
    简介:龟兔赛跑算法,又称弗洛伊德循环检测算法,是一种在链表中非常常用的算法。它基于运动学和直觉的基本定律。本文旨在向您简要介绍该算法,并帮助您了解这个看似神奇的算法。假设高速公路上有两辆车。其中一辆的速度为x,另一辆的速度为2x。它们唯一能相遇的条件是它们都在循环......
  • K-means聚类是一种非常流行的聚类算法
    K-means聚类是一种非常流行的聚类算法,它的目标是将n个样本划分到k个簇中,使得每个样本属于与其最近的均值(即簇中心)对应的簇,从而使得簇内的方差最小化。K-means聚类算法简单、易于实现,并且在许多应用中都非常有效。K-means算法的基本步骤:选择初始中心:随机选择k个样本点作为初始......
  • 游戏中的寻路算法以及动态避障算法
    参考:即时战略游戏中实用的寻路算法都有哪些,比较如何?-知乎(zhihu.com) 寻路算法1.深度/广度优先搜索比较简单,略过  2.Dijkstra最短路径算法图文详解Dijkstra最短路径算法(freecodecamp.org) 3.A*寻路算法比较常见,略过  4.流场 FlowField该算法可以解决R......
  • A*算法实现最优路径规划
     用A*算法实现最优路径规划,绿色五角星为起点,红色四角星为终点,黑色方块为障碍物,如下图所示。简要介绍问题的估价函数、算法步骤、搜索路径、代码实现和代码运行结果。importmathfromrandomimportrandintimportpygamefromenumimportEnum#定义全局变量:地图中节点......
  • 神经网络与模式识别课程报告-卷积神经网络(CNN)算法的应用
     =======================================================================================完整的神经网络与模式识别课程报告文档下载:https://wenku.baidu.com/view/393fbc7853e2524de518964bcf84b9d528ea2c92?aggId=393fbc7853e2524de518964bcf84b9d528ea2c92&fr=catalogM......
  • 头歌机器学习实训答案 第1关:集成学习常用算法详解
    任务描述本关任务:学习集成学习的基本概念以及常用算法并编程熟悉sklearn。相关知识为了完成本关任务,你需要掌握:1.个体与集成的概念,2.常用的集成学习算法。个体和集成集成学习(ensemblelearning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-class......
  • 深度学习各算法的优缺点和适用场景!!纯干货,建议收藏。(下篇)
    ............纯   干  货........上篇地址:深度学习各算法的优缺点和适用场景!!纯干货,建议收藏。(上篇)-CSDN博客目录废话不说,直接上干货自编码器1、标准自编码器(VanillaAutoencoder)2、稀疏自编码器(SparseAutoencoder)3、去噪自编码器(Denoisin......
  • 深度学习各算法的优缺点和适用场景!!纯干货,建议收藏。(上篇)
     ........纯  干  货..........下篇地址:深度学习各算法的优缺点和适用场景!!纯干货,建议收藏。(下篇)-CSDN博客​目录前馈神经网络1、梯度下降(GradientDescent)2、随机梯度下降(StochasticGradientDescent,SGD)3、小批量梯度下降(Mini-batchGradi......
  • Python梯度提升决策树的方法示例
    梯度提升决策树(GradientBoostingDecisionTree,简称GBDT)是一种基于集成学习的算法,它通过构建多个决策树模型,并将它们组合在一起来实现更好的预测性能。GBDT的核心思想是在每轮迭代中,根据当前模型的残差(真实值与预测值之差)来训练一个新的决策树,然后将这个新树添加到模型中,以不断减......