首页 > 其他分享 >塞了一堆特征模型的准确率并没提高多少

塞了一堆特征模型的准确率并没提高多少

时间:2022-12-05 12:44:48浏览次数:49  
标签:一堆 df reshape 模型 准确率 np diff array axis

import matplotlib.pyplot as plt import numpy as np import pandas as pd import torch import torch.fft as fft from sklearn import tree df = pd.read_csv('train.csv') df=df.drop(['ID'],axis=1) nmp=df.to_numpy() feature=nmp[:,:-1] df=pd.DataFrame(feature) sk=np.reshape(np.array(df.skew(axis=1)),(-1,1)) Q25=np.reshape(np.array(df.quantile(q=0.25,axis=1)),(-1,1)) Q75=np.reshape(np.array(df.quantile(q=0.75,axis=1)),(-1,1)) dmax=np.reshape(np.array(df.diff(1).max(axis=1)),(-1,1)) dmin=np.reshape(np.array(df.diff(1).min(axis=1)),(-1,1)) range_diff1=dmax-dmin dvar=np.reshape(np.array(df.diff(1).var(axis=1)),(-1,1)) dstd=np.reshape(np.array(df.diff(1).std(axis=1)),(-1,1)) dmean=np.reshape(np.array(df.diff(1).mean(axis=1)),(-1,1)) dmedia=np.reshape(np.array(df.diff(1).median(axis=1)),(-1,1)) dsk=np.reshape(np.array(df.diff(1).skew(axis=1)),(-1,1)) dQ25=np.reshape(np.array(df.diff(1).quantile(q=0.25,axis=1)),(-1,1)) dQ75=np.reshape(np.array(df.diff(1).quantile(q=0.75,axis=1)),(-1,1)) dk=np.reshape(np.array(df.diff(1).kurtosis(axis=1)),(-1,1))

feature=nmp[:,:-1] label=nmp[:,-1]#(210,240) min=np.reshape(nmp[:,:-1].min(-1),(-1,1)) max=np.reshape(nmp[:,:-1].max(-1),(-1,1)) ra=min-max var=np.reshape(np.var(nmp[:,:-1],axis=1),(-1,1)) std=np.reshape(np.std(nmp[:,:-1],axis=1),(-1,1)) mean=np.reshape(np.mean(nmp[:,:-1],axis=1),(-1,1)) media=np.reshape(np.median(nmp[:,:-1],axis=1),(-1,1))
feature1=torch.fft.fft(torch.Tensor(feature)) feature1=torch.abs(feature1)/240*2 feature1=feature1.detach().numpy() df=pd.DataFrame(feature1)
sk3=np.reshape(np.array(df.skew(axis=1)),(-1,1)) Q253=np.reshape(np.array(df.quantile(q=0.25,axis=1)),(-1,1)) Q753=np.reshape(np.array(df.quantile(q=0.75,axis=1)),(-1,1)) dmax3=np.reshape(np.array(df.diff(1).max(axis=1)),(-1,1)) dmin3=np.reshape(np.array(df.diff(1).min(axis=1)),(-1,1)) range_diff3=dmax-dmin dvar3=np.reshape(np.array(df.diff(1).var(axis=1)),(-1,1)) dstd3=np.reshape(np.array(df.diff(1).std(axis=1)),(-1,1)) dmean3=np.reshape(np.array(df.diff(1).mean(axis=1)),(-1,1)) dmedia3=np.reshape(np.array(df.diff(1).median(axis=1)),(-1,1)) dsk3=np.reshape(np.array(df.diff(1).skew(axis=1)),(-1,1)) dQ253=np.reshape(np.array(df.diff(1).quantile(q=0.25,axis=1)),(-1,1)) dQ753=np.reshape(np.array(df.diff(1).quantile(q=0.75,axis=1)),(-1,1)) dk3=np.reshape(np.array(df.diff(1).kurtosis(axis=1)),(-1,1))





min1=np.reshape(feature1.min(-1),(-1,1)) max1=np.reshape(feature1.max(-1),(-1,1)) var1=np.reshape(np.var(feature1,axis=1),(-1,1)) std1=np.reshape(np.std(feature1,axis=1),(-1,1)) mean1=np.reshape(np.mean(feature1,axis=1),(-1,1)) media1=np.reshape(np.median(feature1,axis=1),(-1,1))
import scipy kur=np.reshape(scipy.stats.kurtosis(feature,axis=1),(-1,1)) ne=np.concatenate((sk3,Q253,Q753,dmax3,dmin3,dk3,range_diff3,dvar3,dstd3,dmean3,dsk3,dQ253,dQ753,dmedia3,dk,dsk,dQ25,dQ75,dmean,dmedia,dvar,dstd,range_diff1,dmax,dmin,Q25,Q75,sk,kur,feature,ra,min,max,var,std,mean,media,feature1,min1,max1,var1,std1,mean1,media1),axis=1)
from sklearn.model_selection import cross_val_score from sklearn import svm import matplotlib.pyplot as plt from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import GradientBoostingClassifier for i in range(300):     for j in range (20):     #clf = tree.DecisionTreeClassifier(criterion='gini',random_state=0,max_depth=i)         #clf=RandomForestClassifier(criterion='gini',n_estimators=10*i+1,max_depth=j+1)         clf=GradientBoostingClassifier(criterion='mse',n_estimators=5*i+1,max_depth=j+1)         scores = cross_val_score(clf,feature,label,cv=10)         print(i,j,scores.mean())         if scores.mean()>=0.9:             print('123')

标签:一堆,df,reshape,模型,准确率,np,diff,array,axis
From: https://www.cnblogs.com/hahaah/p/16951974.html

相关文章

  • 向数据集加了一堆均值并没有提高多少
    准确率为0.8。感觉乱塞特征并没有多大提升。importmatplotlib.pyplotaspltimportnumpyasnpimportpandasaspdimporttorchimporttorch.fftasfftfromskl......
  • wandb安装注册及解决训练模型报API错误
    1.什么是wandb?wandb是Weight&Bias的缩写,一句话,它是一个参数可视化平台。wandb强大的兼容性,它能够和Jupyter、TensorFlow、Pytorch、Keras、Scikit、fast.ai、LightGBM......
  • proto-buf模型格式测试一例
    本文是在这篇博客的基础上开发一个简单的数据模型,在模型上进行序列化和反序列化操作,并检验数据的正确性。1.编写数据格式描述文件需要注意的是,为了增加难度,我定义了具有嵌套......
  • (转)软件测试中的V模型
       V模型中的过程从左到右,描述了基本的开发过程和测试行为。V模型的价值在于它非常明确地标明了测试过程中存在的不同级别,并且清楚地描述了这些测试阶段和开发过程期间......
  • CSS-盒子模型-内容,边框,内边距,外边距,(合并,塌陷情况)
    CSS-盒子模型-内容,边框,内边距,外边距,(合并,塌陷情况)目标:能够认识盒子模型的组成,****能够掌握盒子模型边框、内边距、外边距的****设置方法学习路径:1.盒子模型的介绍......
  • URL 中的中文变成了一堆百分号,怎么转换成字符?
    今天遇到了一个如何通过正则表达式匹配URL中的字符时因为中文被浏览器转换成了百分号而不能被正确识别的问题。如下这种URL:https://www.cnblogs.com/Enziandom/tag/Web......
  • “屎”上最大:基于粪便微生物组的疾病诊断模型
    前言人类的肠道中存在着大量的微生物,这些微生物在消化、代谢甚至疾病预防方面都发挥着重要作用,而肠道微生物群一旦失衡,就有可能导致一些疾病的发生。研究表明健康人的肠道......
  • 盒模型
    盒模型主要分为IE盒模型和W3C标准盒模型l W3C标准盒模型(可通过设置box-sizing为content-box)l 属性width,height只包含content,不包含border和paddingl Width=内容的......
  • Golang 协程调度器原理及GPM模型
    目录进程和线程内核级线程用户级线程协程协程与线程的关系N:11:1M:Ngoroutine旧版本goroutine调度器调度器的实现Goroutine调度器的GMP模型设计思想GPM结构组成GPM运行模型......
  • 前端开发:3、CSS之边框、盒子模型、浮动、溢出、定位、重叠、display
    前端开发之CSS目录前端开发之CSS一、CSS之边框二、display属性三、盒子模型四、CSS之浮动float属性clear属性清除浮动五、CSS之溢出Overflow六、CSS之定位position属......