首页 > 其他分享 >使用随机森林模型在digits数据集上执行分类任务

使用随机森林模型在digits数据集上执行分类任务

时间:2024-09-17 22:52:39浏览次数:3  
标签:digits 模型 分类 train 随机 test import 集上

程序功能

使用随机森林模型对digits数据集进行手写数字分类任务。具体步骤如下:
加载数据:从digits数据集中获取手写数字图片的特征和对应的标签。
划分数据:将数据集分为训练集和测试集,测试集占30%。
训练模型:使用随机森林算法训练分类模型。
进行预测:使用训练好的模型对测试集进行预测。
评估模型:输出模型的分类准确率和详细的分类报告,评估模型的分类效果。
在这里插入图片描述

代码

# 导入所需的库
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report

# 加载digits数据集
digits = load_digits()
X = digits.data  # 特征
y = digits.target  # 标签

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 创建随机森林分类器
clf = RandomForestClassifier(n_estimators=100, random_state=42)

# 训练模型
clf.fit(X_train, y_train)

# 预测测试集
y_pred = clf.predict(X_test)

# 评估模型
accuracy = accuracy_score(y_test, y_pred)
print(f"准确率: {accuracy:.2f}")

# 打印分类报告
print("分类报告:")
print(classification_report(y_test, y_pred, target_names=digits.target_names.astype(str)))

标签:digits,模型,分类,train,随机,test,import,集上
From: https://blog.csdn.net/C7211BA/article/details/142307631

相关文章

  • 科普向-计算机如何生成随机数?(第一期)
    一、背景我们在日常生活中会遇到许许多多的随机事件,最典型的例子就是抛硬币或者骰子。在生活中,我们想要得到一个随机结果的方式很简单,直接拿一枚硬币或者一个骰子就可得到一个比较随机的结果。对于这里为什么要用“比较”这个词是因为如果能知道事物的一切信息的话,“随机”也......
  • 科普向-计算机如何生成随机数?(第二期)
    一、引言在上期中,我们介绍了LCG和逆变换法,了解了区间上的均匀分布,多点分布以及一些简单分布函数的生成。本期我们将把情况推向更为一般的情况,讲介绍正态分布的生成,以及舍选法生成一般概率分布函数的分布。二、正态分布对于正态分布  的概率密度和分布函数:直接计算上述......
  • 织梦dedecms文章页面怎么随机推荐文章
    要在织梦CMS的文章页面上实现随机推荐文章的功能,可以使用织梦提供的 {dede:arc} 标签来实现。下面是一个简单的示例,展示如何在织梦CMS的文章页面上随机推荐文章。步骤1:编辑模板文件登录织梦CMS后台。导航到“模板”->“模板列表”,找到你想要编辑的文章详情页模板文件,通常这......
  • c程序安全防护之-地址空间随机化
    GCC地址空间随机化是一种安全措施,旨在增加攻击者利用缓冲区溢出攻击的难度。这通常通过对堆、栈和其他内存区域进行随机化来实现。在GCC中,可以使用-fstack-protector-strong、-random-base和-Wl,-z,relro,-z,now等编译选项来实现。-fstack-protector-strong:为每个函数启用......
  • 踩坑日志3:每一个epoch都会重新随机采样,固定batch容易使模型陷入局部解
    前几天师弟在机器学习领域看到了一个对样本选择的方法,目的是从特征的角度均匀选择样本。如下图所示,首先初始化将样本的特征进行加和并归一化,迭代取出样本(取值最大的那个样本,再令样本的值乘以1-样本的值更新所有样本)。这般便可以从理论上均匀的取到不同分布的样本,于是猜想如果这样......
  • 使用mlp算法对Digits数据集进行分类
    程序功能这个程序使用多层感知机(MLP)对Digits数据集进行分类。程序将数据集分为训练集和测试集,创建并训练一个具有两个隐藏层的MLP模型。训练完成后,模型对测试数据进行预测,并通过准确率、分类报告和混淆矩阵评估模型的效果。这些评估指标帮助了解模型在手写数字分类任务......
  • 【IPV6从入门到起飞】5-2 IPV6+Home Assistant(ESP32+MQTT+DHT11+BH1750)传感器采集上
    IPV6+HomeAssistant[ESP32+MQTT+DHT11+BH1750]传感器采集上传监测1背景2实现效果3HomeAssistant配置3-1MQTT配置3-2yaml配置3-3加载配置4ESP32搭建4-1开发环境4-2工程代码5实现效果1背景在上一小节【IPV6从入门到起飞】5-1IPV6+HomeAssistant(搭建......
  • 随机生成加减法题目函数
    importrandomfromdocximportDocument#创建一个新文档doc=Document()doc.add_heading('100以内连续加减法训练题',level=1)#随机生成加减法题目函数defgenerate_question():num1=random.randint(1,100)num2=random.randint(1,100)num3=r......
  • 随机数生成工具,且偏差值累计和等于0【工程内业】
    随机数生成工具1、需求:工程内页,尤其是盖板钢筋、桩基钢筋的主筋间距,偏差值累加最好要解决0,这样才能保证资料的准确性。2、实现:暂时以VB和MFC实现,添加导出excel功能。3、界面截图:4、验证:4、下载地址:......
  • 【机器学习实战】用sklearn玩转随机森林,分类准确率提升秘籍!
    在机器学习的世界里,随机森林算法以其出色的分类和回归能力而闻名。我们将深入sklearn库中的随机森林,探索如何通过实战提升模型的分类准确率。一随机森林算法简介随机森林是一种集成学习方法,通过构建多个决策树并综合它们的预测结果来提高预测准确性。每个决策树都是在训......