首页 > 其他分享 >随机森林

随机森林

时间:2023-05-27 13:56:13浏览次数:35  
标签:val data train 随机 test csv RH 森林

训练集给出如下数据:

 测试集提供其中的部分列:

 

要求预测以下列的数据:

['Tdewpoint', 'Visibility', 'Windspeed', 'RH_out', 'Press_mm_hg', 'RH_9', 'T_out', 'RH_4']

 

使用随机森林进行预测:

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

# 读入训练数据和测试数据
train_data = pd.read_csv('train_dataset.csv')
test_data = pd.read_csv('test_dataset.csv')
li=train_data.columns.to_list()[2::]
goal=['Tdewpoint', 'Visibility', 'Windspeed', 'RH_out', 'Press_mm_hg', 'RH_9', 'T_out', 'RH_4']
feature=list(set(li)-set(goal))

# 分离特征变量和目标变量
X = train_data[feature]
y = train_data[goal]

# 划分训练集和验证集
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42)

# 构建随机森林模型
rf = RandomForestRegressor(n_estimators=100, random_state=42)

# 训练模型
rf.fit(X_train, y_train)

# 预测验证集的结果
y_pred_val = rf.predict(X_val)

# 计算验证集的均方误差
mse = mean_squared_error(y_val, y_pred_val)
print("Validation set MSE: {:.2f}".format(mse))

# 预测测试集的结果
y_pred_test = rf.predict(test_data)

# 保存预测结果到CSV文件
pd.DataFrame(y_pred_test).to_csv('test_result.csv', index=False)

 

标签:val,data,train,随机,test,csv,RH,森林
From: https://www.cnblogs.com/datielaoyu/p/17436639.html

相关文章

  • m随机网络,无标度网络,小世界网络以及NS小世界网络在网络攻击中的性能仿真
    1.算法仿真效果matlab2022a仿真结果如下:       2.算法涉及理论知识概要        1.随机网络(randomnetwork)          2.无标度网络(scale-freenetwork)          3.小世界network          4.NS小世界network......
  • bpmn随机
    1.圆形表示事件,第一个元件表示开始事件,最后一个元件表示结束事件2.圆角矩形表示一个任务(task/activity),带箭头的实现表示顺序流(sequenceFlow)。3.在BPMN中,使用菱形表示网关(gateway),用来控制流程中的流向。4.泳道(swimlane)和执行者(performer),泳道用来指明任务的执行者5.Activi......
  • 【Widnows】Hyper-V随机端口绑定导致冲突解决方案
    ✨WindowsTCP动态端口范围在Windows操作系统中,TCP动态端口范围是指用于临时分配给应用程序的端口号范围。当应用程序需要与其他计算机建立TCP连接时,操作系统会自动分配一个未使用的动态端口号给该应用程序使用。在Windows中,默认的TCP动态端口范围是从49152到65535......
  • P8989 [北大集训 2021] 随机游走
    Link给一张\(n\)个点的有向图,初始对于\(\foralli\in[1,n-1]\),在\(i\)与\(i+1\)之间有一条有向边在其中再加入\(m\)条有向边,允许重边和自环,最大化从\(1\)到\(n\)的期望步数我们可以注意到几条简单的性质为了尽可能最大化期望步数,所有边都会往\(1\)连不可能......
  • shell脚本批量推公钥及修改随机密码
    提示:请提前定义ip.txt中的地址池成功的会输出在newpass.txt中失败的会输出在failip.txxt中#!/bin/bashrpm-qexpect&>/dev/nullif[$?-ne0];thenyum-yinstallexpect&>/dev/nullfi#判断公钥是否存在if[!-f~/.ssh/id_rsa];thenssh-keygen-P""-......
  • C语言--文件随机读写
    文件随机读取fseek(文件指针,偏移量,int文件指针当前位置); //SEEK_SET文件起始位置 //SEEK_END文件结束位置ftell(文件指针); //返回文件指针相对起始位置的偏移量rewind(文件指针); //让文件指针回到起始位置文件结束判定perror("随意");//补充//功能同strerro......
  • Java如何生成随机数?要不要了解一下!
    前言我们在学习Java基础时就知道可以生成随机数,可以为我们枯燥的学习增加那么一丢丢的乐趣。本文就来介绍Java随机数。一、Random类介绍在Java中使用Random工具类来生成随机数,该类在java.util包下,在JDK1.0版本就存在了。Random单词本身就是随机、随意、任意的意思......
  • Golang - 获取指定区间范围内随机数
    1.go语言未提供获取指定区间范围内的随机数方法,只有一个参数获取(0,n)的随机数。2.可根据此方法获取指定区间随机数,先随机0到(m-n),再用加 n的方式解决例:[5,10],先生成[0,5],再加5packagemainimport("fmt""math/rand""time")funcmain(){//......
  • 流程控制、循环语句和随机数
    一、流程控制语句流程判断1if[condition];then command commandfi[条件]&&command流程判断2if[condition];then command1else command2fi[条件]&&command1||command2流程判断3if[condition1];then command1结束elif[condition2];......
  • m基于马尔科夫随机场和Gardner环的WSN网络时间同步matlab仿真
    1.算法仿真效果matlab2022a仿真结果如下:RBS算法的累积误差在50us大于80%;ERBS算法的累积误差在25us大于80%;本文所提出的MRF-MAP-GardnerERBS算法的累积误差在10us大于80%。因此,在降低同步误差方面,MRF-MAP-GardnerERBS算法性能优于RBS算法和ERBS算法。RBS算法的同步误......