缺失值处理基础语法

时间：2023-03-28 17:03:10浏览次数：41

标签：subset 处理语法 df train test import model 缺失

1、Imputer

from sklearn.preprocessing import Imputer

from sklearn.model_selection import train_test_split

import pandas as pd

fileName = '***/abc.xlsx'

df = pd.read_excel(fileName)

imp = Imputer(missing_values='NaN', strategy='most_frequent', axis=0) -- most_frequent, median, mean

imp.fit(df)

df = imp.transform(df)

X = df.iloc[:,:-1]

y = df.iloc[:,-1]

x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)

forest = RandomForestClassifier()

forest.fit(x_train, y_train)

print('accuracy on the training subset:{:.3f}'.format(forest.score(x_train, y_train)))

print('accuracy on the training subset:{:.3f}'.format(forest.score(x_test, y_test)))

2、xgboost

from xgboost as xg

from sklearn.model_selection import train_test_split

import pandas as pd

fileName = '***/abc.xlsx'

df = pd.read_excel(fileName)

X = df.iloc[:,:-1]

y = df.iloc[:,-1]

x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)

model = xg.XGBClassifier(missing=None)

model.fit(x_train, y_train)

print('accuracy on the training subset:{:.3f}'.format(model.score(x_train, y_train)))

print('accuracy on the training subset:{:.3f}'.format(model.score(x_test, y_test)))

3、catboost

from catboost as cb

from sklearn.model_selection import train_test_split

import pandas as pd

fileName = '***/abc.xlsx'

df = pd.read_excel(fileName)

X = df.iloc[:,:-1]

y = df.iloc[:,-1]

x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)

rf = cb.CatBoostClassifier()

rf.fit(x_train, y_train)

print('accuracy on the training subset:{:.3f}'.format(rf.score(x_train, y_train)))

print('accuracy on the training subset:{:.3f}'.format(rf.score(x_test, y_test)))

标签：subset,处理,语法,df,train,test,import,model,缺失
From： https://www.cnblogs.com/liyiyu/p/17265859.html

使用Map和循环，优化对象扩展语法操作
在pnpm的一次提交中，优化了针对对象扩展语法的操作...{}。通过如下代码：constallDeps={...projectSnapshot.devDependencies,...projectSnapshot.dependencies......
C#快捷编译并发布的批处理脚本
发布批处理发布批处理::生成新的版本setyear=%date:~2,2%setmonth=%date:~5,2%setday=%date:~8,2%setVERSION=%year%%month%%day%setNEWVERSION=1.0.0.%VERS......
Android Fragment使用(四) Toolbar使用及Fragment中的Toolbar处理
Toolbar作为ActionBar使用介绍本文介绍了在Android中将Toolbar作为ActionBar使用的方法.并且介绍了在Fragment和嵌套Fragment中使用Toolbar作为ActionBar使用时需要注意的......
资源处理
图片压缩1.Caesium50mb官网github搬运......
Mysql基本语法学习
数据库/模式创建createdatabase/schema<数据库/模式名>使用use<数据库/模式名>删除dropdatabase/schema<数据库/模式名>查询所有showdatabase查询当前数据库sel......
bat/cmd批处理程序设计教程
序言这是一篇技术教程，我真心诚意会用很简单的文字表达清楚自己的意思，只要你识字就能看懂，就能学到知识。我写这篇教程的目的，是让每一个看过这些文字的朋友记住一句话：如......
mysql笔记1 基本语法（待完结）
语法样式总的来说挺像c++的，无论是分号结尾，不强制的缩进还是/**/的注释。不过要注意它并不区分大小写，这很重要语句分类分为四种，定义的、增删改的、查询的、和管权限的。......
vscode中emmet语法让行内标签自动换行
在VSCode中在使用emmet插件生成注入a*5或span*5，生成多个行内标签时，不会自动换行，对块标签则会自动换行，例如：div*5，如何解决行内元素自动换行呢？解决方法如下：1、打开“文件”......
支付回调MQ消息的幂等处理及MD5字符串es中的使用及支付宝预授权完成
支付回调MQ消息的幂等处理及MD5字符串es中的使用及支付宝预授权完成1.幂等的处理，根据对象的转json转md5作为key,退款的处理控制发送端？业务上比较难控制。支付异步通知，......
go基础语法规则
前言：go语言基础语法记录正文：1、package package中必须包含一个main的package，并且只能有一个，不然无法编译2、使用import导入包，使用goland会自动导入3、每行的结尾......

缺失值处理基础语法

相关文章

赞助商

阅读排行