首页 > 其他分享 >我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型

时间:2023-04-25 10:34:15浏览次数:28  
标签:能源消耗 变量 模型 回归方程 多元 线性 回归


我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型


⭕ AdamCY888


文章目录

  • 我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型
  • 一、引言
  • 二、回归模型简介
  • (一)多元线性回归模型原理
  • (二)建模步骤
  • 三、实证分析
  • (一)构建指标及获取数据
  • (二)符号说明
  • (三)多元线性回归模型的建立与求解
  • (四)岭回归模型建模
  • 四、讨论
  • 附录


一、引言

  能源是现代经济建设活动必须要素,通过对能源消耗回归建模,具有能探究能源消耗的影响因素、预测未来能源消耗情况、制订能源供给计划等重要作用。本文通过多元线性回归模型对我国能源消耗影响因素进行分析、对比逐步回归法和岭回归法降低多重共线性、检验,最后得出结论,提出建议,以此为制订能源相关计划提供参考。

二、回归模型简介

(一)多元线性回归模型原理

  多元线性回归模型通常用来研究一个应变量依赖多个自变量的变化关系,如果二者的以来关系可以用线性形式来刻画,则可以建立多元线性模型来进行分析。
  多元线性回归模型通常用来描述变量与之间的随机线性关系,即:

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_建模


  式中,x1,x2…xk,是非随机的自变量;y是随机的因变量;u是回归系数是随机误差项。

  如果对y,x进行了n次观测,则得到n组观测值,其满足:

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_数据分析_02


  用矩阵表示为:

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_建模_03


  此时,模型可写为:

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_数据分析_04

(二)建模步骤

  (1)根据数据建立回归模型
  (2)对模型进行显著性检验
  (3) 对模型进行回归诊断

三、实证分析

(一)构建指标及获取数据

  能源的利用遍布在经济生活的方方面面,参考大量文献,本文主要从GDP、民用汽车拥有量、发电量、化学纤维产量、大中型拖拉机产量、农用化肥(折纯)产量、粮食产量共7个维度开展对能源消费总量的研究。
  在选择样本数据时,基于数据可得性和适用性,通过中经网统计数据库获取我国2000年-2019年间我国能源消费总量及相关指标数据(见附录1)

(二)符号说明

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_数据分析_05

(三)多元线性回归模型的建立与求解

  设定回归模型,利用最小二乘估计,我们假设模型为:

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_建模_06


  通过回归拟合得到:

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_数据分析_07

t = (-0.61) (-1.34) (-0.30) (6.30) (-0.20) (-3.14) (3.93) (0.24)

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_岭回归_08


  t检验不显著,同时可决系数非常高,观测相关系数情况如表二: 表2 变量间皮尔逊系数

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_建模_09


  据t值不显著可决系数高,相关系数值高,认为各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性

  利用逐步回归法,逐一测试一元、二元、三元等回归,优中选优,进而获得最优结果

  一元回归: 表3 一元回归参数情况

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_岭回归_10


  故:我们选取x3,以x3为基础,顺次加入其他变量逐步回归,进行二元回归。 表4 二元回归参数情况

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_数据分析_11


   我们选取x6在x3,x6的基础上加入其他元素 表5 三元回归参数情况

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_多元线性回归_12


  同理,选x5。 表6 四元回归参数情况

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_岭回归_13


  则最后回归模型为:

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_岭回归_14

t = (-3.895) (8.202) (-2.257) (-5.771) (15.861)

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_多元线性回归_15


  其表明当其他变量不变时,在一定的范围内,每平均增加1单位的发电量,减少6.035单位的能源消费,每平均增加1单位的化学纤维产量,则增加20.673单位的能源消费,每平均增加1单位的农用化肥产量,则减少789.957单位的能源消费,每增加1单位的粮食产量,则增加37.654单位的能源消费。

(四)岭回归模型建模

  在spss中建立脚本输入命令:Include “Ridge regression.sps”. ridgereg enter=X3 X4 X5 X6 /dep = Y /inc=0.01.得到如下表结果

表7 R-SQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF K

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_数据分析_16


我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_多元线性回归_17

图1 Ridge trace

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_多元线性回归_18

图2 R-square vs.k

  取偏倚系数C=0.3,进行详细岭回归估计,输入命令: ridgereg enter=x3 x4 x5 x6 /dep = y /k=0.3.点击运行,运行结果如下:

表8 岭回归之过程值1

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_岭回归_19

表9 ANOVA table

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_岭回归_20

表10 Variables in the Equation

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_建模_21


  据上图表来看,检验t值不显著,说明岭回归在此处拟合效果并不理想。逐步回归对比岭回归,则显得更加理想。

四、讨论

  逐步回归主要思路是在考虑的全部自变量中按其对的作用大小, 显著程度大小或者说贡献大小, 由大到小地逐个引入回归方程, 而对那些对作用不显著的变量可能始终不被引人回归方程。另外, 己被引人回归方程的变量在引入新变量后也可能失去重要性, 而需要从回归方程中剔除出去。引人一个变量或者从回归方程中剔除一个变量都称为逐步回归的一步, 每一步都要进行检验, 以保证在引人新变量前回归方程中只含有对影响显著的变量, 而不显著的变量已被剔除。
  对于岭回归,这种回归的假设与最小平方回归相同,不同点在于最小平方回归的时候,我们假设数据的误差服从高斯分布使用的是极大似然估计,在岭回归的时候,由于添加了偏差因子即先验信息,使用的是极大后验估计来得到最终参数的。它缩小了系数的值,但没有达到零,这表明没有特征选择功能。

附录

附表1 2000-2019年我国能源消费总量及相关指标数据

我国能源消耗的影响模型分析—基于多元线性回归与岭回归模型_多元线性回归_22


标签:能源消耗,变量,模型,回归方程,多元,线性,回归
From: https://blog.51cto.com/guog/6223549

相关文章

  • 大语言模型中的token解释
    在大型语言模型中,"token"通常指的是一个离散的文本单元,它可以是单词、标点符号、数字或其他语言元素,这些元素被用作训练和生成文本的基本单位。在NLP中,通常使用tokenization技术将文本分割成token序列。具体来说,tokenization是将一个连续的文本字符串分割成一个个离散的单词......
  • Python用机器学习算法进行因果推断与增量、增益模型Uplift Modeling智能营销模型|附代
    原文链接:http://tecdat.cn/?p=27058最近我们被客户要求撰写关于因果推断与增量的研究报告,包括一些图形和统计输出。使用ML进行提升建模和因果推理Python包提供了一套使用基于最近研究的机器学习算法的提升建模和因果推理方法。允许用户根据实验或观察数据估计条件平均处理效......
  • 贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据
    原文链接:http://tecdat.cn/?p=22702最近我们被客户要求撰写关于贝叶斯分位数回归的研究报告,包括一些图形和统计输出。贝叶斯回归分位数在最近的文献中受到广泛关注,本文实现了贝叶斯系数估计和回归分位数(RQ)中的变量选择,带有lasso和自适应lasso惩罚的贝叶斯摘要还包括总结结果、......
  • 模型轻量化-网络剪枝专栏(一)网络剪枝概述
    前言 近年来,深度神经网络在许多计算机视觉和自然语言处理任务中取得了很大的成功。然而,这些网络通常具有非常高的计算和存储成本,限制了它们在嵌入式设备和移动设备上的部署。为了解决这个问题,网络剪枝技术被广泛应用于深度神经网络中,以减少其计算和存储需求,成为模型压缩领域流行......
  • [交易策略]单均线模型回测
    文华财经过滤模型代码:MA20:MA(C,20);C>MA20,BK;C<MA20,SP;AUTOFILTER;......
  • Django 静态文件 request对象方法 pycharm和Django连接MySQL Django模型层初步了解 基
    目录静态文件一、概念静态文件:不经常变化的文件,主要针对html文件所使用到的各种资源。例如:css文件、js文件、img文件、第三方框架文件ps:Django针对静态文件资源需要单独在根目录创建一个static目录统一存放,该目录下的文件类型还有很多,例如:utils目录,plugins目录,li......
  • 2-2线性回归实现
    线性回归实现%matplotlibinlineimportrandomfrommxnetimportautograd,np,npxfromd2limportmxnetasd2l生成数据集根据带有噪声的线性模型构造一个人造数据集。任务是使用这个有限样本的数据集来恢复这个模型的参数。##使用线性模型参数w=[2,-3.4]T,b=4.2和噪......
  • OpenAI的离线音频转文本模型 Whisper 的.NET封装项目
    whisper介绍OpenAI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种语言的自动语音辨识。Whisper系统所提供的自动语音辨识(AutomaticSpeechRecognition,ASR)模型是被训练来运行语音辨识与翻译任务的,它们能将各种语言的语音变成文......
  • 双亲委派模型
    在Java中,双亲委派模型是一种类加载机制。当一个类需要被加载时,首先会委托父类加载器去查找是否已经加载过该类。如果父类加载器能够找到并加载该类,则直接返回该类的Class对象;否则,就将该请求“下放”给子类加载器去处理。这个过程会一直向下递归,直到顶层的启动类加载器。如果该类......
  • 说说对盒子模型的了解和实际开发中需要注意的点
    盒子模型定义由内容content+内边距padding+边框border+外边距margin构成,盒子的宽高由content+padding+border决定,但是不同的盒子模型的计算依据不一样,分为:标准盒模型(w3c)和怪异盒模型(IE)标准盒模型宽高包含content+padding+border怪异盒模型......