财政收入影响因素分析及预测

时间：2023-03-04 23:58:28浏览次数：36

标签：2014 因素预测 train 财政收入 import new data reg

一、数据预处理
Lasso回归方法以缩小特征集为思想，是一种收缩估计方法。Lasso方法可以将特征的系数进行压缩并使某些回归系数变为0，可以广泛地应用于模型改进和选择。通过选择惩罚函数，借用lasso思想和方法实现特征选择地目的。
使用lasso回归方法进行关键属性选取：
import numpy as np
import pandas as pd
from sklearn.linear_model import Lasso
inputfile = 'D:/a/data.csv'
data = pd.read_csv(inputfile)
lasso = Lasso(1000)
lasso.fit(data.iloc[:,0:14],data['y'])
print('相关系数为：',np.round(lasso.coef_,5))
print('相关系数非零个数为：',np.sum(lasso.coef_!=0))
mask = lasso.coef_!=0
print('相关系数是否为零：',mask)
outputfile = 'D:/a/new_reg_data.csv'
new_reg_data = data.iloc[:, mask]
new_reg_data.to_csv(outputfile)
print('输出数据的维度为：',new_reg_data.shape)

得到各个属性的系数。可以看出利用Lasso回归方法识别影响财政收入的关键影响因素是社会从业人员、社会消费品零售总额、城镇居民人均可支配收入、城镇居民人均消费性支出、全社会固定资产投资额、地区生产总值、第一产业产值和居民消费水平。

二、模型构建——灰色预测算法
灰色预测是一种对含有不确定因素的系统进行预测的方法。在建立灰色预测模型之前，需先对原始时间序列进行数据处理，经过数据处理后的时间序列即称为生成列。
构建财政收入预测模型如下
依据Lasso回归选取的关键变量构建灰色预测模型，并预测2014年和2015年的财政收入
import sys
sys.path.append('D:/a')
import numpy as np
import pandas as pd
from GM11 import GM11
inputfile1 = 'D:/a/new_reg_data.csv'
inputfile2 = 'D:/a/data.csv'
new_reg_data = pd.read_csv(inputfile1)
data = pd.read_csv(inputfile2)
new_reg_data.index = range(1994,2014)
new_reg_data.loc[2014] = None
new_reg_data.loc[2015] = None
cols = ['x1','x4','x5','x6','x7','x8','y']
for i in cols:
f = GM11(new_reg_data.loc[range(1994,2014),i].values)[0]
new_reg_data.loc[2014,i] = f(len(new_reg_data)-1)
new_reg_data.loc[2015,i] = f(len(new_reg_data))
new_reg_data[i] = new_reg_data[i].round(2)
outputfile = 'D:/a/new_reg_data_GM11.xls'
y = list(data['y'].values)
y.extend([np.nan,np.nan])
new_reg_data['y'] = y
new_reg_data.to_excel(outputfile)
print('预测结果为：\n',new_reg_data.loc[2014:2015,:])

得到结果如下：

依据灰色预测的结果构建支持向量回归预测模型，并预测2014年和2015年的财政收入
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.svm import LinearSVR

inputfile = 'D:/a/new_reg_data_GM11.xls'
data = pd.read_excel(inputfile)
data.index = range(1993,2015)
feature = ['x1','x3','x4','x5','x6','x7','x8','x13','y']
data_train = data.loc[range(1994,2014)].copy()
data_mean = data_train.mean()
data_std = data_train.std()
data_train = (data_train - data_mean)/data_std
x_train = data_train[feature].values
y_train = data_train['y'].values

linearsvr = LinearSVR()
linearsvr.fit(x_train,y_train)
x = ((data[feature] - data_mean[feature])/data_std[feature]).values

data[u'y_pred'] = linearsvr.predict(x) * data_std['y']+data_mean['y']
outputfile = 'D:/a/new_reg_data_GM11_revenue.xls'
data.to_excel(outputfile)

print('真实值与预测值分别为：\n',data[['y','y_pred']])
fig = data[['y','y_pred']].plot(subplots = True,style=['b-o','r-*'])
plt.show()

结果分析：
得到预测结果如下：

标签：2014,因素,预测,train,财政收入,import,new,data,reg
From： https://www.cnblogs.com/chendongcheng/p/17179506.html

第六章--财政收入影响因素分析及预测
1.数据分析 importmatplotlib.pyplotaspltimportnumpyasnpimportpandasaspdinputfile='./data.csv'data=pd.read_csv(inputfile)describe=data.d......
m基于隐马尔科夫模型(HMM)的手机用户行为预测(MMUB)算法matlab仿真
1.算法描述隐马尔可夫模型（HiddenMarkovModel，HMM）是一种统计模型，广泛应用在语音识别，词性自动标注，音字转换，概率文法等各个自然语言处理等应用领域。经过长期发展，尤其是在语......
Java应用【Ⅻ】使用Java实现机器学习算法：聚类、分类、预测
一、引言1、机器学习算法概述机器学习是一种人工智能技术，旨在通过使用数据和统计分析来让计算机系统自动改进性能。机器学习算法可分为三大类：聚类、分类和预测。聚类算法用......
论文推荐：ScoreGrad，基于能量模型的时间序列预测
能量模型（Energy-basedmodel）是一种以自监督方式执行的生成式模型，近年来受到了很多关注。本文将介绍ScoreGrad：基于连续能量生成模型的多变量概率时间序列预测。如果你对时间......
m通过matlab实现遥测信道主要影响因素分析
1.算法描述遥测技术是指被测对象的状态参数进行超远距离测量，并将测量的数据通过特殊的通信方式发送给地面接收站的一种技术。整个遥测发送接收系统称为遥测......
XGBoost和LightGBM时间序列预测对比
GBoost和LightGBM都是目前非常流行的基于决策树的机器学习模型，它们都有着高效的性能表现，但是在某些情况下，它们也有着不同的特点。XGBoost和LightGBM简单对比训练速度Li......
【Kaggle】Telco Customer Churn 电信用户流失预测案例 ----数据预处理
任务目标：对于电信运营商来说，用户流失有很多偶然因素，不过通过对用户属性和行为的数字化描述，我们或许也能够在这些数据中，挖掘导致用户流失的“蛛丝马迹”，并且更重要的一......
Python数据分析之财政收入影响因素分析及预测模型
01-summary.py 1#-*-coding:utf-8-*-23#代码6-145importnumpyasnp6importpandasaspd78inputfile='../data/data.csv'#输......
R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长|附代码数据
原文链接：http://tecdat.cn/?p=12292最近我们被客户要求撰写关于HAR-RV的研究报告，包括一些图形和统计输出。我们复制了Ghysels（2013）中提供的示例。我们进行了MIDAS回归分析......
python用线性回归预测时间序列股票价格|附代码数据
原文参考：http://tecdat.cn/?p=4516最近我们被客户要求撰写关于线性回归预测股票价格的研究报告，包括一些图形和统计输出。线性回归在整个财务中广泛应用于众多应用程序中......

财政收入影响因素分析及预测

相关文章

赞助商

阅读排行