直接用决策树跑baseline

时间：2022-12-09 11:45:47浏览次数：43

标签：index sklearn baseline df clf test import 直接决策树

准确率是0.67，下一篇博客将去掉偏差大的特征。 import matplotlib.pyplot as plt import numpy as np import pandas as pd import seaborn as sns df = pd.read_csv('train.csv') df1=pd.read_csv('test.csv') df=df.drop(['ID'],axis=1) df=df.to_numpy() feature=df[:,:-1] label=df[:,-1] from sklearn.model_selection import train_test_split tfeature,ttest,tlabel,testlabel=train_test_split(feature,label,test_size=0.2) from sklearn import tree from sklearn.metrics import accuracy_score from sklearn.model_selection import KFold kf=KFold(n_splits=5,shuffle=False) from sklearn import svm from sklearn.model_selection import cross_val_score for k in range(10): sum=0 sum1=0 i=0 for train_index,test_index in kf.split(df): i=i+1 tfeature=df[train_index,:-1] label=df[train_index,-1] clf=tree.DecisionTreeClassifier(criterion='gini',random_state=0,max_depth=k+1) clf.fit(tfeature,tlabel) l=clf.predict(tfeature) ttest=df[test_index,:-1] testlabel=df[test_index,-1] l1=clf.predict(ttest) pr=accuracy_score(tlabel, l) pr1=accuracy_score(testlabel, l1) sum=sum+pr sum1=sum1+pr clf1=tree.DecisionTreeClassifier(criterion='gini',random_state=0,max_depth=k+1) scores = cross_val_score(clf, df[:,:-1], df[:,-1], cv=5) print(k,sum/i,sum1/i,scores.mean()) clf=tree.DecisionTreeClassifier(criterion='gini',random_state=0,max_depth=11) clf.fit(df[:,:-1],df[:,-1]) df1=df1.drop(['ID'],axis=1) df1=df1.to_numpy() y=clf.predict(df1[:,:]) out=pd.DataFrame(y) out.columns = ['CLASS'] w=[] for k in range(out.shape[0]): w.append(k+210) out['ID']=np.reshape(w,(-1,1)) out[['ID','CLASS']].to_csv('out.csv',index=False)

标签：index,sklearn,baseline,df,clf,test,import,直接,决策树
From： https://www.cnblogs.com/hahaah/p/16968504.html

海量睡前小故事，宝妈们注意了，可以直接下载喜马拉雅音频
有孩子的朋友们都有个苦恼，孩子睡前一定要听小故事才能入睡，这可是让宝妈们很头疼。很多妈妈们都买了喜马拉雅的会员，给孩子直接播放音频小故事，但是发现放着放着孩子睡着了，自己......
机器学习--决策树分类算法及应用
1.决策树分类算法原理1.1概述决策树（decisiontree）——是一种被广泛使用的分类算法。相比贝叶斯算法，决策树的优势在于构造过程不需要任何领域知识或参数设置在实际应用中，对......
爬取的数据存入csv文件-用excel直接打开乱码解决方法
如图所示：解决方法：用记事本打开另存为,编码格式为ansicsv部分源码......
数据分享|R语言用主成分PCA、逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
全文链接：http://tecdat.cn/?p=22262最近我们被客户要求撰写关于心脏病数据的研究报告，包括一些图形和统计输出。在讨论分类时，我们经常分析二维数据（一个自变量，一个因变量）......
CWnd直接派生的窗口下使用CToolBar笔记
问题按msdn上的教程在CWnd派生的窗口的OnCreate下创建CToolBar，工具栏不显示。Createatoolbarresource.ConstructtheCToolBarobject.CalltheCreate(orCreateEx)fu......
详解决策树-决策树的优缺点 & 分类树在合成数集上的表现【菜菜的sklearn课堂笔记】
视频作者：[菜菜TsaiTsai]链接：[【技术干货】菜菜的机器学习sklearn【全85集】Python进阶_哔哩哔哩_bilibili]决策树的优缺点决策树优点易于理解和解释，因为树木可以画出......
IBM SPSS Modeler分类决策树C5.0模型分析空气污染物数据
全文链接：http://tecdat.cn/?p=30752原文出处：拓端数据部落公众号如何通过方法有效的分析海量数据，并从其中找到有利的资讯已经成为一种趋势。而决策树算法是目前在进行数据......
把userId:12323 直接拿到12323
JSONObjectjsonObject1=JSONObject.parseObject(mqttMessage);MessageVomessageVo= JSONObject.toJavaObject(jsonObject1,MessageVo.class); 把redis拿到的......
音频下载神器！直接下载转换懒人听书mp3声音，免解密自动提取音频
有没有那么一款工具，可以直接下载mp3声音？之前找了很多方法，但是不是有这样的问题就是有那样的问题，而且很多对电脑小白不是很友好，根本看不懂。不过下面这个音频下载工......
决策树实现
importmatplotlib.pyplotaspltimportnumpyasnpimportpandasaspdimporttorchimporttorch.fftasfftdf=pd.read_csv('train.csv')df=df.drop(['ID'],ax......

直接用决策树跑baseline

相关文章

赞助商

阅读排行