乱塞会导致模型准确率下降。
看到他的做法我就清楚了应该找一些反应物体情况的数值。
max_X=data.x.max()
min_X=data.x.min()
range_X=max_X-min_X
var_X=data.x.var()
std_X=data.x.std()
mean_X=data.x.mean()
median_X=data.x.median()
kurtosis_X=data.x.kurtosis()
skewness_X =data.x.skew()
Q25_X=data.x.quantile(q=0.25)
Q75_X=data.x.quantile(q=0.75)
#聚合特征
#差分值
max_diff1_x=data.x.diff(1).max()
min_diff1_x=data.x.diff(1).min()
range_diff1_x=max_diff1_x-min_diff1_x
var_diff1_x=data.x.diff(1).var()
std_diff1_x=data.x.diff(1).std()
mean_diff1_x=data.x.diff(1).mean()
median_diff1_x=data.x.diff(1).median()
kurtosis_diff1_x=data.x.diff(1).kurtosis()
skewness_diff1_x =data.x.diff(1).skew()
Q25_diff1_X=data.x.diff(1).quantile(q=0.25)
Q75_diff1_X=data.x.diff(1).quantile(q=0.75)
-----------------------------------
©著作权归作者所有:来自51CTO博客作者代码界的小白的原创作品,请联系作者获取转载授权,否则将追究法律责任
记首次CCF数据算法竞赛的心得与收获(排名top1、top2%、top8%),CCF明年再会!
https://blog.51cto.com/u_15501693/4971698