首页 > 其他分享 >statistical_c03

statistical_c03

时间:2024-06-10 16:44:09浏览次数:18  
标签:1059 1.1 假设 假设检验 mu statistical text c03

- [1.1.1 引例](#111-引例)
- [1.1.2 假设检验过程](#112-假设检验过程)
- [1.1.3 假设检验的两个错误](#113-假设检验的两个错误)

假设检验

假设检验是统计推断的一个主要部分。其想法和前面的最大似然类似:如果实际观测到得到数据在某假设下不太可能出现则认为该假设错误。

1.1 假设检验

1.1.1 引例

1. 提出声明。 (比如 “食堂的饭菜很好吃”,“菠萝应该放在披萨上”,等等)

  • 我们的例子是某培训机构宣称它们的课程可以提高学生的中考分数。(去年该考试的平均分为 \(1059\),标准差为 \(210\))

2. 提出原假设 \(H_0 \text{(null hypothesis)}\) 和备选假设 \(H_A \text{(alternative hypothesis)}\)

备选假设可以单侧假设也可以是双侧假设

  • 令 \(\mu\) 为该培训机构的学生的平均分;

  • \(H_0: \mu = 1059\)。我们假设该培训机构的学生的平均分与全国的平均分相同(为了产生矛盾);

  • 备选假设是我们想要表达的,即 \(H_A:\mu>1059\),或者说该培训机构的课程可以提高学生们的分数;

  • 上面的备选假设是单侧假设,另一种单侧假设是 \(\mu<1059\)(该培训机构的课程会降低学生们的分数);

  • 双侧假设为 \(\mu\neq 1059\),大于或小于平均分;

3. 选择一个显著性水平 \(\alpha \text{ (significance level)}\)。 (一般为 \(0.05\) 或 \(0.01\))

  • 令 \(\alpha = 0.05\),稍后会解释它的作用;

4. 收集数据。

  • 我们得到了该培训机构中的 \(100\) 学生的成绩,\(x_1,\ldots,x_{100}\),样本均值 \(\overline{x} = 1113\);

5. 计算 \(p\) 值,\(p = P(\text{observing data | } H_0 \text{ is true})\)。

  • 假设 \(H_0\) 为真(该培训机构没有影响),\(\mu = 1059\)(我们做这些假设是想达到概率上的矛盾)。由中心极限定理,\(n=100\) 已经算比较大了,所以这 \(100\) 个样本的样本均值的分布近似均值为 \(1059\),方差为 \(\frac{210^2}{100}\) 的正态分布。

\[\overline{X}\sim N(\mu=1059, \sigma^2 = \frac{210^2}{100}) \]

  • 那么 \(p\) 值就是我们任取一个样本均值,它至少和我们计算得到的均值一样的概率。然后我们对其标准化即可,由此可得到 \(p\) 值为 \(0.0162\)

    \[\begin{align} p &= P(X\geqslant \overline{x}) = P\left(\frac{\overline{X} - \mu}{\sigma/\sqrt{n}}\geqslant \frac{\overline{x} - \mu}{\sigma/\sqrt{n}}\right)\nonumber\\ & = P\left(Z\geqslant \frac{1113 - 1059}{210/\sqrt{100}}\right) = P(Z\geqslant2.14)\approx0.0162\nonumber\\ \end{align} \]

6. 说明你的结论,结合问题背景进行解释。

  • 如果 \(p<\alpha\),“拒绝” 原假设 \(H_0\),选择备选假设 \(H_A\)。(因为,在原假设为真的情况下,观察到的样本发生的概率 \(p\) 比所定的 \(\alpha\) 要小,由此,认为原假设发生的概率较小)

  • 否则,“无法拒绝” 原假设 \(H_0\)。

    因为 \(p=0.0162<0.05=\alpha\),所以当显著性水平 \(\alpha=0.05\) 我们拒绝原假设 \(H_0\)。我们可以说根据统计表明,该培训机构可以让学生在该考试中达到更高的分数。

    如果 \(\alpha=0.01\) 而不是 \(0.05\),则可得到另一个结论:因为 \(p=0.0162>0.01=\alpha\),所以当显著性水平 \(\alpha=0.01\) 我们无法拒绝原假设 \(H_0\)。没有足够的证据表明,该培训机构能够提高学生们的成绩。

    注意,我们永远不会说 “接受” 原假设。

1.1.2 假设检验过程

  1. 提出声明;
  2. 提出原假设 \(H_0\) 和备选假设 \(H_A\);
    • 备选假设可以是单侧的也可以是双侧的

    • 原假设通常是 \(\text{"baseline", "no effect", or "benefit of the doubt"}\)

    • 备选假是你想要证明的论点,往往与原假设相反

  3. 选择一个显著性水平 \(\alpha\);(通常为 \(0.05\) 或 \(0.01\))
  4. 收集数据;
  5. 计算 \(p\) 值,\(p = P(\text{observing data | } H_0 \text{ is true})\);
  6. 说明你的结论,结合问题背景进行解释;
    • 如果 \(p<\alpha\),“拒绝” 原假设 \(H_0\),选择备选假设 \(H_A\)。我们认为在该假设我们的结果具有统计学意义
    • 否则,“无法拒绝” 原假设 \(H_0\)

1.1.3 假设检验的两个错误

在解决假设检验问题时,无论做出否定还是接受原假设 \(H_0\) 的决定都有可能犯错误。

  • 第一类错误:\(H_0\) 成立,但是被拒绝了。(弃真);
  • 第二类错误:\(H_0\) 不成立,但是被

1.2 单个正态总体的均值和方差的假设检验

1.3 两个正态总体的均值和方差的假设检验

参考资料

标签:1059,1.1,假设,假设检验,mu,statistical,text,c03
From: https://www.cnblogs.com/tamtam/p/18240799

相关文章

  • statistical_c02
    1.点估计1.1最大似然估计1.1.1似然函数1.1.2最大似然估计1.1.3最大似然估计例子1.2矩估计(MethodofMoments,MoM)1.2.1矩估计思想1.3估计量的评选标准2.区间估计2.1置信区间2.1.1置信区间引入2.1.2置信区间2.2单个正态总体的均值和方差的......
  • [ABC036D] 塗り絵 题解
    题意题面讲挺清楚的就不简化了。思路树上求方案数,很明显是树上dp。设$dp_{i,0/1}$表示第$i$个点涂成白/黑色的方案数。当前结点如果为白色,那么它的子节点涂成什么颜色都没关系,根据分步乘法原理,将它子结点涂成白/黑色的方案数之和乘起来即可;当前结点如果为黑色,那么它的子......
  • P2392 kkksc03考前临时抱佛脚
    题目链接01背包主要思想1.四个科目需要单独算2.最佳答案=sum/2;每一组数据划分为两部分使得俩部分的差值最少3.将每个科目所有题目的总时间的一半作为背包的容量花费时间看作为体积和价值---求出最大值(这个最大值是小于等于sum/2)4.说明最接近于sum/2的方案,sum-f[sum......
  • AGC039F 做题记录
    link很厉害的一道Ad-hoc题!假定我们填写的矩阵为\(A\)。直接填写\(A\)计算贡献是基本做不到的,考虑挖掘一些神奇的东西。问题转化:考虑\(\prod\limits_{i=1}^n\prod\limits_{j=1}^mf(i,j)\)相当于构造另一个\(B\)矩阵,满足\(B_{i,j}\le\min(A_{i,1...m},A_{1...n,j})......
  • AT_agc038_e [AGC038E] Gachapon 题解
    比较基础的一道题。很容易想到Min-Max容斥:\[E(\max(S))=\sum_{T\subeS}(-1)^{|T|-1}\timesE(\min(T))\]然后发现\(E(\min(T))=\sum_{k\ge0}P(\min(T)\gek)\)。考虑dp,记\(f_{i,j,k}\)表示从前\(i\)个数中选出\(T\),\(\sum_{i\inT}A_i=j,\sum_{i\inT}c_i=k\)且每个......
  • 洛谷题单指南-搜索-P2392 kkksc03考前临时抱佛脚
    原题链接:https://www.luogu.com.cn/problem/P2392解题思路:参考https://www.cnblogs.com/jcwy/p/18003097前面已经给出了二进制法的代码,这里给出DFS的代码100分代码:#include<bits/stdc++.h>usingnamespacestd;constintN=25;ints1,s2,s3,s4;inta[N],b[N],c[......
  • [AGC037B] RGB Balls
    题意有\(n\)个人,\(3\timesn\)个球,球有三种颜色,每种颜色恰好\(n\)个。给每个人每种颜色的球各一个,按照在原序列的顺序分别设为\(p1,p2,p3\)。试求使得\(\sump_3-p_1\)最小的方案数。Sol其实直接考虑就行了,没必要想那么复杂。假设当前的球的颜色为\(R\),之前......
  • [AGC036F] Square Constraints
    [AGC036F]SquareConstraints更好的阅读体验可以看成是求值域两个半圆间的排列的个数。首先对于每个\(i\)设\(L_i,R_i\)表示\(p_i\)取值的下界和上界。如果没有小圆的限制即没有下界,问题很简单:把\(R\)从小到大排序,然后\(\prod_{i=1}^nR_i-i+1\)即为答案,原因显然,因......
  • 洛谷题单指南-暴力枚举-P2392 kkksc03考前临时抱佛脚
    原题链接:https://www.luogu.com.cn/problem/P2392题意解读:由于可以同时计算两道同一科的题目,只需要把某一科题目分两堆,使得两堆总时长之差最小,时长较大的一堆就是完成这一科的最短时间。解题思路:既然直到了要把一科题目分两堆,关键是如何分堆呢?比较容易犯的错是用贪心来解题:把......
  • AWS-SAA C03 题库 —— PART04 131-200
    131.Acompanyisdevelopingafile-sharingapplicationthatwilluseanAmazonS3bucketforstorage.ThecompanywantstoserveallthefilesthroughanAmazonCloudFrontdistribution.Thecompanydoesnotwantthefilestobeaccessiblethroughdirect......