首页 > 其他分享 >R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析

R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析

时间:2024-03-08 23:44:20浏览次数:18  
标签:GDP 回归 最小 OLS 位数 模型 二乘

全文链接:http://tecdat.cn/?p=32372

原文出处:拓端数据部落公众号

对于影响北京市GDP 因素分析常用的方法是最小二乘回归。【1】但最小二乘有自身的缺陷,该方法要求较高,例如许多观测数据很难满足全部假设条件。相比普通最小二乘法只能描述协变量对因变量条件均值变化的影响,分位数回归能精确地描述协变量对于因变量的变化范围和分布形状的影响。【2】随着计算机技术的不断突破,分位数回归软件包现已是主流统计软件R、SAS等中的座上客了,分位数回归也就自然而然地成为经济、医学、教育等领域的常用分析工具。【3】

客户主要研究是先利用分位数回归研究收敛性,然后和最小二乘做个比较。

研究意义

作为一种精确地描述自变量对于因变量的变化范围以及条件分布影响的统计方法,分位数回归的概念最早由Koenker和Basset(t1978)【4】提出。借助Laplace(1818)提出的最小绝对残差估计思想,他们针对最小二乘回归的某些缺陷,创建了线性分位数回归理论。Bassett(1986)【5】、Powell(1986)【6】和Chernozhuko(2002)【7】等人在此基础上进行了深入的研究,陆续解决了分位数回归的线性假设检验、异方差的稳健性检验、估计量的一致性和线性规划解法等应用方面的难题,使其成为了近几十年来发展较快、应用广泛的回归模型方法。分位数回归可以提供不同分位点处的估计结果,因此可以对因变量的整个分配情况作出更为清楚的阐释。【8】不同分位数下的参数估计量往往也不同,这就表明同样的影响因素对处在不同水平的研究对象的作用大小是不同的。特别是在研究对象的分布呈现异质性,如不对称,截断性等特征时,这一方法往往能够提供更为详尽的信息,具有明显的优势。【9】

文献综述

分位数回归是对以古典条件均值模型为基础的最小二乘法的延伸,它用几个分位函数来估计整体模型。分位数回归更能精确地描述自变量X对于因变量Y的变化范围以及条件分布形状的影响。分位数回归能够捕捉分布的尾部特征,当自变量对不同部分的因变量的分布产生不同的影响时。【10】

对于分位数回归模型,则可采取线性规划法(LP)估计其最小加权绝对偏差,从而得到解释变量的回归系数,可表示如下:

image.png

求解得:

image.png

研究的基本内容,拟解决的主要问题

研究的主要内容:

1.   对北京市1995~2014年的GDP、投资、消费等增长率进行统计;

2.   建立分位数回归模型;

3.   讨论模型的稳健性、处理数据异质性、各种收敛性;

4.   针对不同的收敛性进行分析和比较;

5.   通过与最小二乘法的对比研究其优势。

研究步骤

1.      搜集北京市近二十年经济增长等数据;

2.      学习并了解分位数回归分析问题的研究背景及应用;

3.      建立分位数回归模型;

4.      利用模型与统计软件进行计算,观察其特性;

5.      与最小二乘法进行比较,得出结论。

查看数据

image.png

读取数据

   
head(data)

image.png

σ收敛的检验

image.png

从变异系数的变化趋势来看,在06年以后,波动趋势变小,因此参数逐渐收敛。

β-收敛的分位数回归分析

   
ggplot(dat, aes(x,y)) + geom_point() + geom_smooth(method="lm")

image.png

建立分位数回归模型

   
qr1 <- rq

image.png

image.png

image.png

image.png

image.png

   
qr1$coefficients

image.png

与ols回归线段作比较

   
summary(OLS)

image.png

OLS(普通二乘回归)

image.png

上图是普通二乘回归的拟合图,从结果来看大部分点被回归预测的置信区间所覆盖。然后有少量点在置信区间之外。

分位数回归拟合直线

image.png

分位数回归图

从分位数回归的结果来看,所有数据均被分位数回归模型的预测区间所覆盖。因此模型比普通二乘更好。

1111.png

上面的图为分位数回归的回归系数变化趋势图,从结果来看居民消费水平的相关影响逐渐变化且从负相关变为正相关,说明有正向的影响, 社会投资从正相关逐渐变成负相关,说明有负向的影响,进出口总额从负相关逐渐变成正相关,说明有正向的影响。

参考文献

[1]刘丽华,刘尧. 基于回归分析的人均GDP 影响因素研究[J] .经济研究导刊. 2013 ( 7) .

[2]沈冰. 基于面板数据的分位数回归分析——浙江省GDP的影响因素[J]. 财经纵览_财政金融 (2015年10期).

[3]李育安. 分位数回归及应用简介[J]. 统计与信息论坛 第21卷第3期 (006年5月).

[4]Koenker, Bassett. Regression Quantiles[J]. Econometrica, 1978, (46).

[5]Bassett , Koenker. Strong Consistency of Regression Quantiles and   Related Empirical Processes[J]. Econometric Theory , 1986, (2).

[6]Powell , James L. Censored Regression Quantiles[J].Journal of Econo-metrics, 1986, (32).

[7]Hong H , Chernozhukov V. Three-Step Censored Quantile Regression and Extramarital Affairs[J ] . Journal of the American Statistical Asso-ciation, 2002, (97).

[8]李群峰.  基于分位数回归的面板数据模型估计方法[J]. 统计与决策. 2011(17)

[9]黄蓓、范悍彪,宋峰. 中国地区经济增长收敛性分位数回归分析[J]. 安徽财经大学

[10]姜成飞. 分位数回归方法综述[J]. 科技信息(2013年25期)


21stcenturyco-hero_standard_1536x1536.jpg

最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

标签:GDP,回归,最小,OLS,位数,模型,二乘
From: https://www.cnblogs.com/tecdat/p/18062088

相关文章

  • P2746 [USACO5.3] 校园网Network of Schools
    原题链接题解把奶牛看成点,赠送列表关系看成有向边,这样这道题就成了对强连通分量缩点,然后找出这个新图中入度为零的点有几个,出度为零的点有几个code#include<bits/stdc++.h>usingnamespacestd;vector<int>G[105];intlen=0,cnt=0;intbelong[105]={0};intin[105]={0},......
  • Vue调试神器vue-devtools配置 / 解决提示 Download the Vue Devtools extension for a
    访问Vue页面,控制台提示:    ......
  • 机器学习基础-线性回归,逻辑回归,SVM
    回归给定数据,回归就是用一个方程尽可能地拟合数据点的分布;线性回归假设数据中\(y\)与\(x\)呈线性关系;给定,线性回归就是要找一条线/面,并且让这条直线尽可能地拟合数据点的分布;二元线性回归:$\hat{y}=ax_1+bx_2+c$去拟合数据解法:最小二乘;$loss=\sum{(y_i-\hat{y_i}......
  • Eviews回归分析股权集中度、股权制衡度与公司绩效关系:中小板上市公司数据
    全文链接:http://tecdat.cn/?p=32345原文出处:拓端数据部落公众号本文深入分析了国内外关于股权结构与公司绩效的影响因素;帮助客户运用回归分析法,以ROE作为公司绩效的度量指标,考察中小企业板上市公司股权集中度、股权制衡度对公司绩效的影响因素。为了进行实证研究,选取了部分深......
  • Rust 开发的高性能 Python 包管理工具,可替换 pip、pip-tools 和 virtualenv
    最近,我在Python潮流周刊中分享了一个超级火爆的项目,这还不到一个月,它在Github上已经拿下了8Kstar的亮眼成绩,可见其受欢迎程度极高!国内还未见有更多消息,我趁着周末把一篇官方博客翻译出来了,分享给大家。作者:@charliermarsh译者:豌豆花下猫@Python猫英文:uv:Pythonpackag......
  • R语言逻辑回归、GAM、LDA、KNN、PCA主成分分类分析预测房价及交叉验证
    全文链接:https://tecdat.cn/?p=35263原文出处:拓端数据部落公众号本研究旨在帮助客户利用房价数据集进行数据分析,该数据集包含82个变量和2930个数据点。研究目标是通过分类算法将房价分为两个类别。在数据预处理阶段,排除了Order、PID和SalesPrice等变量,对数据进行整合和转换以适......
  • 计算降水和ENSO指数的相关系数或者回归系数,并做显著性检验
    '''Description:计算降水和ENSO指数的相关系数或者回归系数,并做显著性检验-----------------------------------------Time:2024/02/1910:42:04Author:ForxdVersion:1.0'''#%%importxarrayasxrimportnumpyasnpi......
  • 基于CNN-GRU-Attention的时间序列回归预测matlab仿真
    1.算法运行效果图预览 2.算法运行软件版本matlab2022a 3.算法理论概述        CNN-GRU-Attention模型结合了卷积神经网络(CNN)、门控循环单元(GRU)和注意力机制(Attention)来进行时间序列数据的回归预测。CNN用于提取时间序列的局部特征,GRU用于捕获时间序列的长期......
  • Python贝叶斯回归分析住房负担能力数据集|附代码数据
    原文链接:http://tecdat.cn/?p=11664最近我们被客户要求撰写关于贝叶斯回归的研究报告,包括一些图形和统计输出。我想研究如何使用pymc3在贝叶斯框架内进行线性回归。根据从数据中学到的知识进行推断 贝叶斯规则是什么? 本质上,我们必须将已经知道的知识与世界上的事实相结合。......
  • Python用RNN循环神经网络:LSTM长期记忆、GRU门循环单元、回归和ARIMA对COVID
    原文链接:http://tecdat.cn/?p=27042原文出处:拓端数据部落公众号 该数据根据世界各国提供的新病例数据提供。  获取时间序列数据  df=pd.read_csv("C://global.csv")探索数据此表中的数据以累积的形式呈现,为了找出每天的新病例,我们需要减去这些值 ......