首页 > 其他分享 >缺失值处理基础语法

缺失值处理基础语法

时间:2023-03-28 17:03:10浏览次数:36  
标签:subset 处理 语法 df train test import model 缺失

1、Imputer

from sklearn.preprocessing import Imputer

from sklearn.model_selection import train_test_split

import pandas as pd

fileName = '***/abc.xlsx'

df = pd.read_excel(fileName)

imp = Imputer(missing_values='NaN', strategy='most_frequent', axis=0)  -- most_frequent, median, mean

imp.fit(df)

df = imp.transform(df)

X = df.iloc[:,:-1]

y = df.iloc[:,-1]

x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)

forest = RandomForestClassifier()

forest.fit(x_train, y_train)

print('accuracy on the training subset:{:.3f}'.format(forest.score(x_train, y_train)))

print('accuracy on the training subset:{:.3f}'.format(forest.score(x_test, y_test)))

 

2、xgboost

from xgboost as xg

from sklearn.model_selection import train_test_split

import pandas as pd

fileName = '***/abc.xlsx'

df = pd.read_excel(fileName)

X = df.iloc[:,:-1]

y = df.iloc[:,-1]

x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)

model = xg.XGBClassifier(missing=None)

model.fit(x_train, y_train)

print('accuracy on the training subset:{:.3f}'.format(model.score(x_train, y_train)))

print('accuracy on the training subset:{:.3f}'.format(model.score(x_test, y_test)))

 

3、catboost

from catboost as cb

from sklearn.model_selection import train_test_split

import pandas as pd

fileName = '***/abc.xlsx'

df = pd.read_excel(fileName)

X = df.iloc[:,:-1]

y = df.iloc[:,-1]

x_train, x_test, y_train, y_test = train_test_split(X, y, random_state=0)

rf = cb.CatBoostClassifier()

rf.fit(x_train, y_train)

print('accuracy on the training subset:{:.3f}'.format(rf.score(x_train, y_train)))

print('accuracy on the training subset:{:.3f}'.format(rf.score(x_test, y_test)))

 

标签:subset,处理,语法,df,train,test,import,model,缺失
From: https://www.cnblogs.com/liyiyu/p/17265859.html

相关文章

  • 使用Map和循环,优化对象扩展语法操作
    在pnpm的一次提交中,优化了针对对象扩展语法的操作...{}。通过如下代码:constallDeps={...projectSnapshot.devDependencies,...projectSnapshot.dependencies......
  • C#快捷编译并发布的批处理脚本
    发布批处理发布批处理::生成新的版本setyear=%date:~2,2%setmonth=%date:~5,2%setday=%date:~8,2%setVERSION=%year%%month%%day%setNEWVERSION=1.0.0.%VERS......
  • Android Fragment使用(四) Toolbar使用及Fragment中的Toolbar处理
    Toolbar作为ActionBar使用介绍本文介绍了在Android中将Toolbar作为ActionBar使用的方法.并且介绍了在Fragment和嵌套Fragment中使用Toolbar作为ActionBar使用时需要注意的......
  • 资源处理
    图片压缩1.Caesium50mb官网github搬运......
  • Mysql基本语法学习
    数据库/模式创建createdatabase/schema<数据库/模式名>使用use<数据库/模式名>删除dropdatabase/schema<数据库/模式名>查询所有showdatabase查询当前数据库sel......
  • bat/cmd批处理程序设计教程
    序言这是一篇技术教程,我真心诚意会用很简单的文字表达清楚自己的意思,只要你识字就能看懂,就能学到知识。我写这篇教程的目的,是让每一个看过这些文字的朋友记住一句话:如......
  • mysql笔记1 基本语法(待完结)
    语法样式总的来说挺像c++的,无论是分号结尾,不强制的缩进还是/**/的注释。不过要注意它并不区分大小写,这很重要语句分类分为四种,定义的、增删改的、查询的、和管权限的。......
  • vscode中emmet语法让行内标签自动换行
    在VSCode中在使用emmet插件生成注入a*5或span*5,生成多个行内标签时,不会自动换行,对块标签则会自动换行,例如:div*5,如何解决行内元素自动换行呢?解决方法如下:1、打开“文件”......
  • 支付回调MQ消息的幂等处理及MD5字符串es中的使用及支付宝预授权完成
    支付回调MQ消息的幂等处理及MD5字符串es中的使用及支付宝预授权完成1.幂等的处理,根据对象的转json转md5作为key,退款的处理控制发送端?业务上比较难控制。支付异步通知,......
  • go基础语法规则
    前言:go语言基础语法记录正文:1、package package中必须包含一个main的package,并且只能有一个,不然无法编译2、使用import导入包,使用goland会自动导入3、每行的结尾......