首页 > 编程语言 >Python统计实战:两道题掌握一个总体均值、一个总体方差、两个总体均值差、两个总体方差比的区间估计

Python统计实战:两道题掌握一个总体均值、一个总体方差、两个总体均值差、两个总体方差比的区间估计

时间:2024-06-10 19:58:49浏览次数:13  
标签:总体 置信区间 排队 方差 均值 x2 x1

为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能,从而更快地掌握解决问题所需的能力。

(以下练习题来源于《统计学—基于Python》。联系我获取完整数据和Python代码。) 


求解参数(区间估计的基本思路

  • 一看求总体的什么参数(总体均值、总体比例、总体方差)

  • 二看求一个总体的参数还是两个总体的参数(总体均值和总体比例是之差,总体方差是之比)

  • 三看是大样本还是小样本

  • 最后确定采用的估计方法

  • 牢记心中:参数估计是用样本统计量推断总体参数


 习题一

顾客到银行办理业务时往往需要等待一些时间,等待时间的长短与许多因素有关,比如,银行的业务员办理业务的速度、顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队伍;第二种排队方式是顾客在三个业务窗口处排队等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时等待的时间(单位:分钟)如下:

(1)构建第一种排队方式等待时间均值的95%的置信区间。

(2)构建第二种排队方式等待时间方差的95%的置信区间。

(3)构建两种方式排队时间均值之差的95%的置信区间:①假设两个总体方差相等;②假设两个总体方差不相等。

题目分析:

(1)题考查了小样本情况下的一个总体均值的区间估计,需要借助t分布;

(2)题考查了一个总体方差的区间估计,需要借助卡方分布;

(3)题考查了独立小样本情况下,两个总体均值之差的区间估计。特别地,假设了两个总体方差相等和不等两种情况。

Python代码:

import pandas as pd
import numpy as np
import scipy.stats as st
from scipy.stats import chi2
from scipy.stats import t
from statsmodels.stats.weightstats import ttest_ind

exercise6_3 = pd.read_csv('exercise6_3.csv')
# exercise6_3.head()

confidence = 0.95
x1 = exercise6_3['方式1']
x2 = exercise6_3['方式2']
var1 = x1.var()   # 方法1的方差
var2 = x2.var()   # 方法2的方差
n1 = len(x1)
n2 = len(x2)
xbar1 = x1.mean()
xbar2 = x2.mean()

# (1)
interval1 = st.t.interval(confidence, len(x1)-1, loc = np.mean(x1), scale = st.sem(x1))
print(f"第一种排队方式等待时间均值的95%的置信区间:{np.round(interval1, 5)}")

# (2)
LCI = (n2-1)*var2/chi2.ppf(q = (1+confidence)/2, df = n2-1)
UCI = (n2-1)*var2/chi2.ppf(q = (1-confidence)/2, df = n2-1)
print(f"第二种排队方式等待时间方差的95%的置信区间:[{LCI:.5f}, {UCI:.5f}]")

# (3) - ①假设两个总体方差相等
t_value, p_value, df = ttest_ind(x1=x1, x2=x2, alternative = 'two-sided', usevar = 'pooled') # 计算方差的合并估计量
interval2 = t.interval(confidence, df=df, loc = (xbar1-xbar2), scale = (xbar1-xbar2)/t_value)
print(f"两种方式排队时间均值之差的95%的置信区间【假设两个总体方差相等】:{np.round(interval2,4)}")

# (3) - ②假设两个总体方差不相等
t_value, p_value, df = ttest_ind(x1=x1, x2=x2, alternative = 'two-sided', usevar = 'unequal') # 方差不相等
interval3 = t.interval(confidence, df=df, loc = (xbar1-xbar2), scale = (xbar1-xbar2)/t_value)
print(f"两种方式排队时间均值之差的95%的置信区间【假设两个总体方差不相等】:{np.round(interval3,4)}")

计算结果:

第一种排队方式等待时间均值的95%的置信区间:[6.57566 8.32434]

第二种排队方式等待时间方差的95%的置信区间:[1.56996, 11.05952]

两种方式排队时间均值之差的95%的置信区间【假设两个总体方差相等】:[-1.1574  1.7574]

两种方式排队时间均值之差的95%的置信区间【假设两个总体方差不相等】:[-1.1726  1.7726]


习题二

生产工序的方差是工序质量的一个重要测度指标。当方差较大时,需要对工序进行改进以减小方差。下面是两部机器生产的袋装茶重量的数据(单位:克):

计算两个总体方差比的95%的置信区间。

题目分析:

本题考查了两个总体方差比的区间估计,需要借助F分布。

Python代码:

import pandas as pd
import numpy as np
from scipy.stats import f

exercise6_6 = pd.read_csv("exercise6_6.csv")
# exercise6_6.head()
x1 = exercise6_6['机器1']
x2 = exercise6_6['机器2']

confidence = 0.95
var1 = x1.var()
var2 = x2.var()
n1 = len(x1)
n2 = len(x2)

LCI = (var1/var2)/f.ppf(q=(1+confidence)/2, dfn = n1-1, dfd = n2-1)
UCI = (var1/var2)/f.ppf(q=(1-confidence)/2, dfn = n1-1, dfd = n2-1)
print(f"两个总体方差比的95%的置信区间为:[{LCI:.5f} {UCI:.5f}]")

计算结果:

两个总体方差比的95%的置信区间为:[4.05193 24.61011]


都读到这里了,不妨关注、收藏、点赞、转发一下吧!

标签:总体,置信区间,排队,方差,均值,x2,x1
From: https://blog.csdn.net/lucasluy2020/article/details/139581093

相关文章

  • [自适应控制] 广义最小方差控制(GMVC)算法理论及其Matlab实现
     基于[自适应控制],广义最小方差控制(GMVC)算法理论与其Matlab实现,包括代码和参考书籍,适合新手学习,注释清晰,适合入门或者进行二创。模型获取:[自适应控制]广义最小方差控制(GMVC)算法理论及其Matlab实现......
  • [自适应控制] 最小方差控制(MVC)算法理论,及其 Matlab代码 实现
      个人整理了[自适应控制]最小方差控制(MVC)算法理论,并使用Matlab代码进行了实现,效果明显,配备了参考文献与书籍,适合新手学习使用。模型代码获取:  [自适应控制]最小方差控制(MVC)算法理论,及其Matlab代码实现......
  • 数理统计(数值修约、0.5修约、0.2修约、有效数字运算、平均值、中位数、极差、标准差
    数理统计(数值修约、0.5修约、0.2修约、有效数字运算、平均值、中位数、极差、标准差、变异系数)原文:数理统计(数值修约、0.5修约、0.2修约、有效数字运算、平均值、中位数、极差、标准差、变异系数)_修约到0.5怎么修约-CSDN博客一、数值修约:口诀:四舍六入五考虑,五后非零则进......
  • 微前端学习笔记(1):微前端总体架构概述,从微服务发微
    从最初的CS架构,如MFCJavaSwing等,到BS架构,JSPPHP,再到前端后端分离,前端从jquery  GWT-Ext 到Handlebars,再到angularJS/Vue/React,反观java世界,学好SpringMyBatis,一路无忧,哎…… 微服务为了解决庞大的一整块后端服务带来的变更与扩展方面的限制,出现了微服务架构(Mic......
  • 算法金 | 一文读懂K均值(K-Means)聚类算法
    ​大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]1.引言数据分析中聚类算法的作用在数据分析中,聚类算法用于发现数据集中的固有分组,通过将相似对象聚集在一起来揭示数据的结构和模式。这种方法常用于市场细分、社交网络分......
  • 【转载】python画带方差的折线图(csdn上最简洁的代码之一附上)
    版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。原文链接:https://blog.csdn.net/a1920993165/article/details/122277716python画带方差的折线图画好后效果图(直接一个图的)实现代码如下点击查看代码importnumpyasnpimport......
  • Java 集合中的组内平均值计算
    在Java开发中,集合(Collection)是一个重要的数据结构,广泛应用于各种场景。计算集合中的组内平均值是一个常见的操作,尤其是在数据分析、统计和处理时更为重要。本文将深入探讨如何使用Java来计算集合中的组内平均值,涵盖基本概念、具体实现、优化策略和实用示例。集合框架概述Java......
  • 一个python文件做图像 灰度化 反转 通道分离 噪声、滤波 高斯双边滤波 均值偏移滤波
    代码测试可以正常运行。灰度化反转通道分离噪声、滤波高斯双边滤波均值偏移滤波图像二值化Canny边缘检测直线检测圆检测轮廓发现人脸检测测试可以运行代码如下:'''file:ImageMiniLab.pydate:2019/04/1920:00author:itisyan......
  • 仿照股票涨跌字体颜色变化,VBA一键查看学生成绩高或低于平均值
    仿照股票涨跌字体颜色变化,VBA一键查看学生成绩高或低于平均值(VX公众号:Excel潘谆白说VBA)文章目录前言一、效果截图:二、代码如下:前言一张表格,密密码码的分数,千篇一律的颜色,不能一眼看出哪些同学的单科成绩高于或低于平均值。如果把不同分数值字体颜色改变,那......
  • 自动控制: 最小二乘估计(LSE)、加权最小二乘估计(WLS)和线性最小方差估计
    自动控制:最小二乘估计(LSE)、加权最小二乘估计(WLS)和线性最小方差估计在数据分析和机器学习中,参数估计是一个关键步骤。最小二乘估计(LSE)、加权最小二乘估计(WLS)和线性最小方差估计(LMMSE)是几种常见的参数估计方法。这篇博客将详细介绍这些方法及其均方误差(MSE)的计算,并通过Pytho......