首页 > 其他分享 >数据代码分享|R语言回归分析:体脂数据、公交绿色出行与全球变暖2案例

数据代码分享|R语言回归分析:体脂数据、公交绿色出行与全球变暖2案例

时间:2023-05-23 23:36:04浏览次数:61  
标签:公交 ## 变暖 回归 data datanew 体脂 数据

全文链接:http://tecdat.cn/?p=32520

原文出处:拓端数据部落公众号

通常在现实应用中,我们需要去理解一个变量是如何被一些其他变量所决定的。

回答这样的问题,需要我们去建立一个模型。一个模型就是一个公式之中,一个因变量(dependent variable)(需要预测的值)会随着一个或多个数值型的自变量(independent variable)(预测变量)而改变的。我们能够构建的最简单的模型之一就是线性模型,我们可以假设因变量和自变量间是线性的关系。回归分方法可用于预测数值型数据以及量化预测结果与其预测变量之间关系的大小及强度。本文将介绍如何将回归方法应用到你自己的数据中,主要介绍学习内容:

用线性回归方法来拟合数据方程的基本统计原则和它们如何描述数据元素之间的关系。

如何使用R准备数据进行回归分析,定义一个线性方程并估计回归模型。

案例1:体脂数据回归分析


data=read.table("bodyfat.txt",header=F)


给变量名赋值

 
colnames(data)=c("Density determined from underwater weighing","Percent body fat from Siri's (1956) equation","Age","Weight","

数据相关图

image.png

回归分析

image.png

由于P<0.05,于是在α=0.05水平下,本例的回归系数有统计学意义,体重和体脂存在回归关系。

数据拟合图

image.png

image.png

置信区间

image.png

残差分析

par(mfrow=c(2,2))  
plot(lmmod)

image.png

逐步回归

stepmod=step(lmmod,direction="both",trace=T);

image.png

由于P<0.05,于是在α=0.05水平下,本例的回归系数有统计学意义,体重、年龄、胸围和体脂存在回归关系。

案例2:公交绿色出行与全球变暖回归分析

image.png

查看数据

head(data)

image.png

查看数据结构

image.png

查看数据概况

image.png

删除缺失数据

data[ data== "<NA>"]=NA  
datanew=na.omit(data)

相关分析

corrgram(datanew[,c("支持程度.1-7","污染严重"  ,"区域主因" ,"公交出行" , "

1111.png

使用cor函数来查看不同变量之间的相关系数

##查看支持程度和不同变量之间的相关系数  
cormat[1,]

## 支持程度.1-7     污染严重     区域主因     公交出行     全球变暖  
##  1.000000000  0.057896120  0.007793092  0.195963899  0.118643706  
##     工业变暖     尾气变暖     公交了解     公交满意     个人影响  
##  0.038408531  0.265162650 -0.028947130  0.061299236  0.561345590  
##     有效治堵     有效减排     通勤方式     收费区域     收费时段  
##  0.647623352  0.582528538 -0.067935998 -0.025646569 -0.086475704  
##     收入用途  
##  0.064924787

cor.test(datanew$`支持程度.1-7`,datanew$公交出行)

##  
##  Pearson's product-moment correlation  
##  
## data:  datanew$`支持程度.1-7` and datanew$公交出行  
## t = 5.5525, df = 772, p-value = 3.875e-08  
## alternative hypothesis: true correlation is not equal to 0  
## 95 percent confidence interval:  
##  0.1272518 0.2628041  
## sample estimates:  
##       cor  
## 0.1959639

cor.test(datanew$`支持程度.1-7`,datanew$全球变暖)

##  
##  Pearson's product-moment correlation  
##  
## data:  datanew$`支持程度.1-7` and datanew$全球变暖  
## t = 3.32, df = 772, p-value = 0.0009426  
## alternative hypothesis: true correlation is not equal to 0  
## 95 percent confidence interval:  
##  0.04858049 0.18754507  
## sample estimates:  
##       cor  
## 0.1186437

建立多元线性=======================因变量为支持程度.1-7

##获得训练集  
   
  
train <- sample(1:nrow(datanew), nrow(datanew)*0.8)  
datanew.train <- datanew[train, ]

进行多元线性模型并进行分析 -----P值<0.1的和F-K列

image.png

由于P<0.05,于是在α=0.05水平下,本例的回归系数有统计学意义,污染严重、有效减排、收费时段、个人影响和有效治堵和支持程度存在回归关系。

回归结果

image.png

置信区间与预测区间:

置信区间是给定自变量值后,由回归方程得到的的预测值(实际上是的平均值)的置信区间;预测区间是实际值的置信区间,在这里称为预测区间。

image.png

残差分析:

残差分析可以对回归模型的假设条件即随机误差项是否独立同分布进行检验,同时还可以找出离群点。命令语句为plot(lm.1),显示结果如下

plot(lmmod)

image.png


Measuring-your-strategys-5050-1536x1536.jpg

最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

标签:公交,##,变暖,回归,data,datanew,体脂,数据
From: https://www.cnblogs.com/tecdat/p/17426757.html

相关文章

  • R语言有极值(EVT)依赖结构的马尔可夫链(MC)对洪水极值分析|附代码数据
    阅读全文:http://tecdat.cn/?p=17375最近我们被客户要求撰写关于马尔可夫链的研究报告,包括一些图形和统计输出。为了帮助客户使用POT模型,本指南包含有关使用此模型的实用示例。本文快速介绍了极值理论(EVT)、一些基本示例,最后则通过案例对河流的极值进行了具体的统计分析 EVT的介......
  • R语言SIR模型网络结构扩散过程模拟SIR模型(Susceptible Infected Recovered )代码实例|
    全文链接:http://tecdat.cn/?p=14593最近我们被客户要求撰写关于SIR模型的研究报告,包括一些图形和统计输出。与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。这里介绍一个使用R模拟网络扩散的例子基本的算法非常简单:生成一个网络:g(V,E)。随机选择一个或几......
  • R语言如何做马尔可夫转换模型markov switching model|附代码数据
    全文链接:http://tecdat.cn/?p=6962最近我们被客户要求撰写关于马尔可夫转换模型的研究报告,包括一些图形和统计输出。假设有时间序列数据,如下所示。经验表明,目标变量y似乎与解释变量x有关。然而,乍一看,y在水平中间波动,所以它似乎并不总是有稳定的关系(背后有多个状态)上面的样本......
  • 在酒店房间中的数据库索引
    如果你经常去酒店,你会看到一块类似下面的标牌,指引你到达房间。这能够帮助你方便快速地找到房间,特别是当酒店拥有许多房间时。以一个有9层的酒店为例。你的房间号是917。第一步是找到你的房间在哪一层,通常第一个数字表示楼层。这意味着你的房间在第9层。你直接就找到了自己所在的......
  • MySQL数据基础知识整理—4
        今天我们了解下MySQL数据库中的索引和最基础的事务是什么吧。注意:本次的索引会作为主要讲解部分,事务会分两部分讲解;希望大家在看本文章前先看完我之前的MySQL数据基础知识整理。索引    索引:是一种用于快速查找数据库中特定数据的数据结构。它类似于书籍的目录,可......
  • 基于springboot+vue数码论坛系统设计与实现、论坛管理系统,附源码+数据库+lw文档+PPT
    1、项目介绍考虑到实际生活中在数码论坛方面的需要以及对该系统认真的分析,将系统权限按管理员和用户这两类涉及用户划分。(1)系统功能需求登录系统后,主要模块包括首页、数码板块、数码评价、数码论坛、畅聊板块、新闻资讯、个人中心、后台管理等功能。系统功能用例图如图3-1所示......
  • Graphpad Prism9.5.1 数据处理绘图软件详细安装教程 (含Win/Mac版)
    GraphPadPrismGraphPadPrism是一款非常专业强大的科研医学生物数据处理绘图软件,它可以将科学图形、综合曲线拟合(非线性回归)、可理解的统计数据、数据组织结合在一起,除了最基本的数据统计分析外,还能自动生成统计图。  安装教程下面就简单的介绍一下Win版的安装教程详细图文教程......
  • 网络数据库用户管理
    一概述    用户管理是网络数据库管理系统的常用要求之一,连接到数据库的每一个用户必须是系统的合法用户。用户是要使用网络数据库的管理系统,必须要拥有相应的权限,创建用户并授予权限权限是DBA的常用任务之一。下面以Oracle数据库为例,阐述网络数据库的用户管理。二:配置身份......
  • 不同数据库的格式化日期函数
    不同数据库的格式化日期MySql1、获取当前时间selectnow()2、日期格式化#年-月-日时:分:秒SELECTDATE_FORMAT(now(),'%Y-%m-%d%H:%i:%s')具体格式参考下面:格式描述%a缩写星期名(Sun..Sat)%b缩写月名(Jan..Dec)%c月,数值(0..12)%D带有英文......
  • 数据库之连接之外连接
    1、leftjoin是SQL语言中的查询类型,即连接查询。它的全称是左外连接(leftouterjoin),是外连接中的一种。2、Oracle中有三类OUTERJOIN--分别是LEFT,RIGHT和FULL。一个LEFTOUTERJOIN包含“左”表中的所有记录,即使它与在此连接中指定的“右”表并不存在任何匹配。3、RIGHTOUTE......