首页 > 编程语言 >Python统计实战:一题搞定一元线性回归的回归系数、显著性及预测值计算

Python统计实战:一题搞定一元线性回归的回归系数、显著性及预测值计算

时间:2024-06-21 19:32:03浏览次数:19  
标签:显著性 航班 Python 准点 df 投诉 import 回归系数

为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能,从而更快地掌握解决问题所需的能力。

(以下练习题来源于《统计学—基于Python》。联系获取完整数据和Python源代码文件。)


练习题

随机抽取10家航空公司,对其最近一年的航班准点率和顾客投诉次数进行调查,所得数据如下。

(1)用航班准点率作为自变量,顾客投诉次数作为因变量,求出估计的回归方程,并解释回归系数的意义。

(2)检验回归系数的显著性(α=0.05).

(3)如果航班准点率为80%,估计顾客的投诉次数。


计算结果与分析

(1)先绘制出散点图观察自变量和因变量之间的关系。如下图所示,基本符合线性关系。

# 绘制散点图
import pandas as pd
from statsmodels.formula.api import ols
import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['Songti SC'] # 设置中文字体
plt.rcParams['axes.unicode_minus'] = False     # 正常显示负号
df = pd.read_csv('exercise10_2.csv')

sns.regplot(data = df, x = df['航班准点率'], y = df['投诉次数'],
           fit_reg = True, marker = '+')  # 添加回归线
plt.title('添加回归线和置信带的散点图')
plt.tight_layout()

然后做OLS回归,回归结果如下图所示,回归系数=-4.7006,表示航班准点率每增加1%,投诉次数平均减少4.7次。

# 拟合回归模型
import pandas as pd
from statsmodels.formula.api import ols
df = pd.read_csv('exercise10_2.csv')

model1 = ols('投诉次数 ~ 航班准点率', data = df).fit()
print(model1.summary())

(2)根据OLS回归结果,回归系数对应的P值为0.000,小于0.05,故拒绝拒绝原假设(两个变量之间的线性关系不显著),接受备择假设,即两个变量之间的线性关系显著。

(3)根据估计的回归方程,如果航班准点率为80%,顾客的投诉次数的预测值为54.139422。

# 计算航班准点率为80%时的顾客的投诉次数的预测值
model1.predict(exog = dict(航班准点率 = 80))

都读到这里了,不妨关注、点赞一下吧!

标签:显著性,航班,Python,准点,df,投诉,import,回归系数
From: https://blog.csdn.net/lucasluy2020/article/details/139868414

相关文章

  • Python统计实战:一题搞定一元线性回归分析、模型诊断分析
    为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能,从而更快地掌握解决问题所需的能力。(以下练习题来源于《统计学—基于Python》。联系获取完整数据和Python源代码文件。)练习题下面是来自R语言的anscombeh数据集(前3行和后3行......
  • Python统计实战:一题搞定双因子方差分析(交互效应分析)
    为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能,从而更快地掌握解决问题所需的能力。(以下练习题来源于《统计学—基于Python》。联系获取完整数据和Python源代码文件。)练习题城市道路交通管理部门为研究不同路段和不同时段......
  • python web框架哪家强?Flask、Django、FastAPI对比
    前言当你掌握了python的基础知识,并且会用和HTML和CSS编写简单的静态网页。现在你只需再掌握一个pythonweb框架的知识,就可以开始编写一个动态的网站了。目前市面比较流程的pythonweb框架有三个flask、Django、FastAPI。接下来我们对比一下。他们三个各自有什么特点。Flas......
  • Python+selenium+unittest框架实现网易邮箱的自动登录
    文章目录概要整体架构流程技术细节小结概要 本实例只针对简单的账密登录场景做处理,涉及登录方式切换、人机检测部分未作处理,后续会跟进处理。整体架构流程依赖环境    Python3.7    selenium3.141.0    ddt1.6.0        目......
  • Python标注工具labelImg使用Pyinstaller打包成EXE的过程及问题处理
    直接上过程1.在python项目中使用pip命令安装pyinstaller。2.在python编辑器(如Pycharm)终端切换到要打包的.py文件所在目录。3.使用pyinstaller工具命令打包.py文件,如:pyinstallerlabelImg.py--noconsole--workpath.\Pyinstaller\temp --distpath.\Pyinstaller\dist 4.......
  • python pyinstaller打包的exe 反编译问题记录 破解加密
    首先是用pyinstxtractor这个网上很多教程,不详说了。生成一个xxx.exe_extracted目录生成过程中,如果pyinstaller用key加密了,会[!]Error:FailedtodecompressPYZ-00.pyz_extracted\Cython\__init__.pyc,probablyencrypted.Extractingasis. 这个说是fail了,其实可以解......
  • 详解pip换源步骤,打造极速Python开发环境
    在当今日益数字化的世界中,Python及其包管理工具pip已成为开发者们不可缺少的工具。Python的广泛应用,从数据分析到人工智能,从Web开发到科学计算,都离不开大量高质量的库和包的支持。但是,在安装和管理这些库和包时,网络速度和源的可靠性往往成为制约效率的瓶颈。为了解决这一问题,......
  • Python批量保存Excel文件中的图表为图片
    Excel工作簿作为一款功能强大的数据处理与分析工具,被广泛应用于各种领域,不仅能够方便地组织和计算数据,还支持用户创建丰富多彩的图表,直观展示数据背后的洞察与趋势。然而,在报告编制、网页内容制作或分享数据分析成果时,直接嵌入整个Excel文件往往不够便捷,且可能受限于接收者......
  • python中的yield与yield from
    生成器与迭代器在Python中,迭代器就是可以用来迭代(比如for循环中的迭代)操作的对象,任何实现了__next__方法的对象都可以称之为迭代器。classFib:def__init__(self,n)->None:self.prev=0self.cur=1self.n=ndef__next__(self......
  • python rce
    之前学习过了rce在php下的利用,接下来来学习一下python中rce的利用,其根本主要就是执行系统命令的函数有所不同.os模块os是python中用来执行系统命令的包.下面是常用的两个方法.1.os.system:可以用来执行系统命令,但是无法将系统命令执行的结果返回.如果执行成功了会返回0,失败......