首页 > 其他分享 >计量经济学笔记-2一般回归分析和模型设定

计量经济学笔记-2一般回归分析和模型设定

时间:2023-05-25 21:14:24浏览次数:45  
标签:设定 函数 epsilon 回归 笔记 计量经济学 条件 var MSE

2.一般回归分析和模型设定

问题1:

  • 辨别相关性是不是因果关系
    • 统计关系:预测关系
    • 经济关系:因果关系

问题2:

  • 一般归回分析和线性回归模型

问题3:

  • 线性回归模型的系数coefficients的经济意义

回归分析是研究变量Y和变量X之间关系的常用工具。

  • 用于考察X对Y的影响
  • 用X的信息预测Y

2.1.条件概率分布

联合分布函数很适合用来描述变量Y和变量X之间关系。联合分布函数有几个很好的性质:

  1. 如果\((Y,X')'\)是连续随机向量,X的边际概率密度函数是:$$f_X(x)=\int_{-\infty}^{\infty}f_{XY}(x,y)dy$$
  2. 再给定\(X=x\),Y的条件概率密度函数是:$$f_{Y|X}(y|x)=\frac{f_{XY}(x,y)}{f_X(x)}$$其中:\(f_X(x) \gt 0\)

如果给定了X,那么我们使用几个关键工具来分析这个关系:

  1. 条件均值(一阶矩): \(E(Y|x) \equiv E(Y|X=x)\)
  2. 条件方差(二阶矩): \(var(Y|x) \equiv var(Y|X=x)=E(Y^2|x)-[E(Y|x)]^2\)
  3. 条件偏度conditional skewness(三阶矩): \(S(Y|x)\equiv\frac{E(Y-E(Y|x)^3)|x]}{var(Y|x)^{3/2}}\)
  4. 条件峰度conditional kurtosis(四阶矩): \(K(Y|x)\equiv\frac{E(Y-E(Y|x)^4)|x]}{var(Y|x)^{2}}\)
  5. 条件\(\alpha\)-分位数conditonal α-quantile \(Q(x,α)\),有\(P[Y \le Q(X,\alpha)|X=x]=\alpha \in (0,1)\)

2.2.条件均值与回归分析

定义2.1 回归函数 Regression Function

条件均值\(E(Y|X)\)称为Y对X的回归函数。

可以得到如下几个性质:

  • 定理 2.1 \(E[E(Y|X)]=E(Y)\)
  • 定理 2.2 重复期望法则 \(E[G(X,Y)]=E\{E[G(X,Y)|X]\}\)
    • \(G(X<Y)\)给定的可测函数
    • 假设\(E[G(X<Y)]\)存在

回到最初的问题——如何用X来预测Y?

  • 上帝模式:\(G(X)=Y\)
  • 但是我们不是上帝,只能假设一个他们之间的函数,比如\(g(X)\)。

那么,如何判断\(g(X)\)接近\(Y\)的程度呢?

定义2.2 均方误 Mean Squared Error(MSE)

假设用函数\(g(X)\)来预测\(Y\),均方误就是:\(MSE(g)=E[Y-g(X)]^2\)

当一个函数的\(MSE\)越小,说明这个函数预测\(Y\)的能力越好。

那什么函数的\(MSE\)最小呢?

  • 定理 2.3 MSE最优解是条件均值\(E(Y|X)\),即:$$E(Y|X)=arg \min_{g \in \Bbb F }MSE(g)$$
    • 其中,\(\Bbb F\)是所有可测的和平方可积的函数的集合 #todo

还可用平均绝对误差Mean Absolute Error(MAE)作为衡量准则,最优解是条件中位数

如何将这些特性用于预测Y呢?

定义 2.3 回归等式 Regression Identity

给定条件均值\(E(Y|X)\),总有$$Y=E(Y|X)+\epsilon$$其中:\(\epsilon\)称为回归扰动项 regression disturbance,满足\(E(\epsilon|X)=0\)

其中:

  • \(\epsilon\):称为噪声,代表随机变量\(Y\)中没有被条件均值\(E(Y|X)\)解释的部分
  • \(E(Y|X)\):称为信号,可以根据它用X来预测Y
  • 另外,还有一个性质是:\(E[\epsilon h(X)]=0\)
    • 意思是:不能用任何形式的函数\(h(X)\)来预测\(\epsilon\)的条件均值,无论线性还是非线性函数。
  • 如果\(var(\epsilon|X)=\sigma^2 \gt 0\),称\(\epsilon\)为条件同方差 conditional homoskedasticity
  • 如果\(var(\epsilon|X) \ne\sigma^2 \gt 0\),称\(\epsilon\)为条件异方差 conditional heteroskedasticity

上一篇:1前言&导论

标签:设定,函数,epsilon,回归,笔记,计量经济学,条件,var,MSE
From: https://www.cnblogs.com/watalo/p/17432930.html

相关文章

  • 计量经济学笔记-1前言&导论
    前言Textbook:《高级计量经济学》洪永淼著高等教育出版社ISBN:9787040324242Address:MOOC-高级计量经济学Plan:32学时章节学时deadline计量经济学导论2学时2023/05/23一般回归分析和模型设定3学时经典线性回归模型4学时独立同分布随机样本的线性......
  • 《程序员修炼之道--从小工到专家》阅读笔记03
    本次阅读的是第四章和第五章,下面是阅读笔记和心得体会。第四章:注重实践本章主要强调的是从理论到实践的转变,推崇实践、实验和原型设计等方式来使软件开发更加高效和成功。作者说,软件开发是一项具有实验性质的工作,我们需要反复实验,检查和验证我们的判断和设计是否符合预期。同时,还......
  • 构建之法阅读笔记07
    第十章典型用户和场景10.1典型用户和典型场景①怎样定义典型用户?我们首先要定义用户的角色。正如戏剧中有正面和反面的角色,软件系统中也有受欢迎的和不受欢迎的典型用户。受欢迎的典型用户——指那些按设计者的期望使用系统的用户,如“网站的购物者”不受欢迎的典型用户—......
  • lucas定理 学习笔记
    lucas定理学习笔记目录lucas定理学习笔记介绍combination题目描述输入格式输出格式样例输入样例1输出样例2分析code扩展lucas介绍lucas定理用于解决形如\(C_n^m\modp(p\inprime)\)的问题。设\(n,m\)用\(p\)进制来表示为:\((n_an_{a-1}\cdotsn_0)_p,(m_am_{a-......
  • PMP 学习笔记(三)
    项目范围:为交付具有规定特性与功能的产品、服务或成果而必须完成的工作。项目范围有时也包括产品范围 预测型项目在每次迭代中,都会重复开展三个过程:收集需求、定义范围、创建WBS。 敏捷型项目中每次迭代中,都会重复开张两个过程:确认范围、控制范围。 对于需求不断变化、风险大或不......
  • 第一周 python基本语法 笔记
    写在前面的话:由于已经学习了c和c++,所以主要记录了与c/c++不同的地方一:基础知识1:严格缩进,单引号与双引号功能相同2:字符串的序号  字符串的序号可以用两种方式表示  -5-4-3-2-1  我喜欢编程  0  1 2 3 43:使用[]获取字符串的一个或多个字符   索引......
  • 笔记
    判断素数:#include<iostream>#include<math.h>usingnamespacestd;boolsu(intn){ inti=2; if(n==1) returnfalse; for(i=2;i<=sqrt(n);i++){ if(n%i==0) break; } if(i>sqrt(n)) returntrue;else returnfalse;}埃氏筛:boolisnp[M......
  • 〈数据库设计入门经典〉之第一章笔记
        现在,来写一下我看了前三章的体验吧!GO! 第一章数据库建模的过去与现在    呼呼,这一章基本都是在讲一些概念性的东西,所以,应该也没什么感想可写,那就再摘一点“苹果”来分享好了,Ready?GO!数据库:数据库是信息的集合——较为相关的信息和组织良好的信息。数据库由在安......
  • 《数据库设计入门经典》之第二章笔记
        上一次我摘了些第一章的内容,整理成了笔记,不知道对大家有没有点帮助啊,呵呵...第一章主要是讲了些概念上的东西,让大家对基本的概念有点理解,没有摘完全,只是选了我觉得有概括性的语句。现在,来写写第二章的笔记吧,Ready??GO!     第二章 工作场所中的数据库建模   ......
  • 《数据库设计入门经典》之第三章笔记
        上一次写了一点第二章的笔记,强调了在做数据库模型的设计时要注意“人”的作用,这一次,来说点正题。第三章的主题目是:数据库建模构件块,看过了以后觉得有些还是在讲数据库的概念性东西,不过,就算是学过了也还是要看一遍,我们总是容易高估自己的记忆,其实很多时候,一些很基础的东西你......