拓端tecdat|R语言代码编写关于回归系数的解释

时间：2022-11-28 10:03:54浏览次数：42

标签：1224 Qu 3rd tecdat 拓端 female ses 回归系数

R语言关于回归系数的解释

除非我们打算提出因果主张，否则我们应该像描述虚拟变量那样解释连续变量的回归系数。

一条有用建议是，以预测的方式解释回归系数。要了解它们的含义，让我们考虑一个示例。

预测学生表现

hsb <- read.csv("datasets/hsb_comb_full.csv")
names(hsb)
[1] "schoolid" "minority" "female"   "ses"      "mathach"  "size"     "sector"   
[8] "pracad"   "disclim"  "himinty"  "MEANSES"  "N_BREAK"  "sesdev"   "myschool"

# Let's go with the first school, and the first 5 student-level variables
hsb <- hsb[hsb$schoolid == hsb$schoolid[1], 1:5]
summary(hsb)
schoolid       minority           female            ses             mathach      
Min.   :1224   Min.   :0.00000   Min.   :0.0000   Min.   :-1.6580   Min.   :-2.832  
1st Qu.:1224   1st Qu.:0.00000   1st Qu.:0.0000   1st Qu.:-0.8830   1st Qu.: 3.450  
Median :1224   Median :0.00000   Median :1.0000   Median :-0.4680   Median : 8.296  
Mean   :1224   Mean   :0.08511   Mean   :0.5957   Mean   :-0.4344   Mean   : 9.715  
3rd Qu.:1224   3rd Qu.:0.00000   3rd Qu.:1.0000   3rd Qu.:-0.0330   3rd Qu.:16.370  
Max.   :1224   Max.   :1.00000   Max.   :1.0000   Max.   : 0.9720   Max.   :23.584  

# Mathach, ses and female seem to have some variability
# Let's predict math achievement using female (dummy), ses (continuous)
lm(mathach ~ female + ses, hsb)

Call:
lm(formula = mathach ~ female + ses, data = hsb)

Coefficients:
(Intercept)       female          ses  
     12.092       -2.062        2.643

现在，解释其系数的典型方法female是：

在保持SES不变的情况下，男性和女性在数学成绩上平均相差2.06点，其中男性表现更好。

但是要澄清语言，我们可以说：

对于拥有相同SES的学生，我们期望男性和女性之间的数学成绩相差2.06点，而男性的成绩更好。

问题出现在对的解释上ses，通常是：

保持性别不变，SES的提高与数学成绩提高2.64有关。

我们通常声称这是一个相关陈述，没有因果关系。但是，它具有因果关系。这暗示着，在一个人中，如果我们可以将他们的SES提高1点，我们可以期望数学成绩提高2.64点。

盖尔曼和希尔的措辞解释如下：

对于相同性别的学生，我们期望在SES中有分数差异的学生之间的数学成绩有2.64分的差异。

这就是所谓的回归系数的预测解释。它没有因果关系，并传达出我们正在对不同个体之间的差异进行预测或描述。

如果您有任何疑问，请在下面发表评论。

标签：1224,Qu,3rd,tecdat,拓端,female,ses,回归系数
From： https://blog.51cto.com/u_14293657/5890584

拓端tecdat|R语言编程指导中的Theil-Sen回归分析
R语言中的Theil-Sen回归分析 Theil-Sen估计器是一种在社会科学中不常用的简单线性回归估计器。三个步骤：在数据中所有点之间绘制一条线计算......
拓端tecdat|R语言代码编写对二分连续变量进行逻辑回归数据分析
R语言对二分连续变量进行逻辑回归数据分析教育或医学的标准情况是我们有一项连续的措施，但随后我们对那些具有临床/实践意义的措施有了切入点。一......
拓端tecdat|R语言代码编写逻辑回归预测分析付费用户
R语言逻辑回归预测分析付费用户对于某企业新用户，会利用大数据来分析该用户的信息来确定是否为付费用户，弄清楚用户属性，从而针对性的进行营销，提高运......
拓端tecdat|SAS代码编写中用单因素ANOVA研究不同疗法对焦虑症的有效性
SAS中用单因素ANOVA研究不同疗法对焦虑症的有效性本教程将介绍如何使用SAS进行单因素方差分析。我们使用的数据可以在这里下载。我们想研究不同疗......
拓端tecdat|R语言编程指导用线性模型进行臭氧预测：加权泊松回归，普通最小二乘，加权负二
R语言用线性模型进行臭氧预测：加权泊松回归，普通最小二乘，加权负二项式模型，多重插补缺失值在这篇文章中，我将从一个基本的线性模型开始，然后从那里......
拓端tecdat|R语言代码编写使用多重聚合预测算法（MAPA）进行时间序列分析
R语言中使用多重聚合预测算法（MAPA）进行时间序列分析这是一个简短的演示，可以使用该代码进行操作。使用MAPA生成预测。>mapasimple(admissions)......
拓端tecdat|R语言用线性回归模型预测空气质量臭氧数据
R语言用线性回归模型预测空气质量臭氧数据尽管线性模型是最简单的机器学习技术之一，但它们仍然是进行预测的强大工具。这尤其是由于线性模型特别容......
拓端tecdat|R语言中的多类别问题的绩效衡量：F1-score 和广义AUC
R语言中的多类别问题的绩效衡量：F1-score和广义AUC 对于分类问题，通常根据与分类器关联的混淆矩阵来定义分类器性能。根据混淆矩阵，可以计算灵敏度......
拓端tecdat|R语言编程指导中的Stan概率编程MCMC采样的贝叶斯模型
R语言中的Stan概率编程MCMC采样的贝叶斯模型概率编程使我们能够实现统计模型，而不必担心技术细节。这对于基于MCMC采样的贝叶斯模型特别有用。 s......
拓端数据tecdat|Python代写LDA主题模型算法应用
在这篇文章中，我将介绍用于LatentDirichletAllocation（LDA）的ldaPython包的安装和基本用法。我不会在这篇文章中介绍该方法的理论基础。然而，这个模型的主要参考，Bleietal2......

拓端tecdat|R语言代码编写关于回归系数的解释

预测学生表现

如果您有任何疑问，请在下面发表评论。

相关文章

赞助商

阅读排行