我们使用R库mgcv,用广义加性模型(GAMs)对环境数据进行建模。mgcv是一个伟大的库,具有丰富的功能,但我们经常发现,默认的诊断图并不令人振奋。特别是偏残差图,功能很强,但不漂亮,残差几乎看不见。我们需要根据这些代码来制作自己的偏回归平滑图。
1) 基本的数据设置
我们正在使用这里讨论的数据集。我们使用的是国家发病率和死亡率空气污染研究(NMMAPS)的数据。我们将数据限制在1997-2000年。
data[date>as.Date("1996-12-31"),]
2) 简单的GAM模型--温度对臭氧
在这个例子中,我们保持模型的简单性--使用高斯数据,单一预测因子。我们对温度与臭氧进行建模,我们将输出默认的偏残差图。
- # 模型 - 温度对臭氧的影响
- plot(gam)
这个图可以改进?
3) 重新制作偏残差图
偏残差图(Partial Residual Plot)是多元回归中常用的诊断工具,特别是评估模型中在一个或另一个解释变量中是否包含非线性项。在多元回归y=β0+β1x1+…+βpxp+ε中,若欲反映其中变量Xj与因变量y之间的关系并用图形显示,其方法之一是用偏残差图。
在这里,我们加入平滑项、置信区间和偏残差。
1.
2. #我们可以在多边形的顶部添加线条
3. qplot(temp, fit, type="n")+poly(c(temp, rev(temp)),
4. c(low95,rev(up95))# 对于置信度的灰色多边形
5.
6.
在最后一步,我们要加入偏残差本身。偏残差是平滑项的估计值+整个模型的残差。
1.
2. #添加偏残差。
3.
4. points(temp,partial.resids)
5.
6.
为便于参考,这里是完整模型的摘要。
模型 - 温度对臭氧的影响
标签:臭氧,GAMs,加性,temp,模型,残差,tecdat,数据,我们 From: https://blog.51cto.com/u_14293657/5828927