首页 > 其他分享 >假设检验

假设检验

时间:2022-09-30 22:44:54浏览次数:32  
标签:frac text 假设检验 mu 假设 alpha sigma

1 假设检验

基本步骤

  • 建立假设 —— 提出原假设和备择假设

    • 原假设:也称为零假设(\(H_0\)),通常是统计者想要拒绝的假设。
    • 备择假设:也称对立假设(\(H_1\)),通常是统计者想要接受的假设。
    • 类型:当原假设为 \(H_0:\theta=\theta_0\) 时,备择假设可能有三种情况
      • \(H_1:\theta \neq \theta_0\),此时称为双侧假设或双边假设。
      • \(H_1:\theta < \theta_0\) 或 \(H_1:\theta > \theta_0\),此时称为单侧假设或单边假设。

    注:在假设检验中,通常将不宜轻易加以否定的假设作为原假设。

  • 选择检验统计量,给出拒绝域 \(W\)

  • 选择显著性水平
    我们在应用某种检验判断时,可能做出正确的判断,也可能做出错误的判断,因此可能犯两种错误:

    1. 当原假设为真,而样本由于随机性却落入了拒绝域,于是我们做出了拒绝原假设的错误决策,这样的错误称为第一类错误
    2. 当备择假设为真,而样本却落入了接受域,于是我们采取了接受原假设的错误决策,这样的错误称为第二类错误

    因此需要确定一个显著性水平,以尽可能减少错误决策。然而事实证明,我们没法使犯两类错误的概率同时减小,因此通常的做法是仅限制犯第一类错误的概率 \(\alpha\)。
    显著性水平 \(\alpha\),即为在原假设为真时拒绝原假设的概率。例如,显著性水平0.05表示当没有实际差异时得出存在差异,会有5%的风险。

  • 给出拒绝域
    所谓拒绝域,就是样本空间中导致拒绝零假设的全体样本点的集合。在图像上拒绝域即为显著性水平围成的一个区域,如下图

    样本点落入拒绝域中,即认为我们犯第一类错误的概率比事先设定的阈值 \(\alpha\) 还要小,即此时我们做出拒绝原假设的决策是可靠的。反之,如果样本点没有落入拒绝域,即我们犯第一类错误的概率比较大,那么我们此时做出拒绝原假设的决策是不可靠的,因此不能拒绝原假设。

  • 计算P值
    P值——假设检验犯弃真错误(第一类错误)的概率。
    P值的统计学定义为:在一个假设检验中,利用样本观测值能够作出拒绝原假设的最小显著性水平称为检验的P值。
    举个例子,假设我们取显著性水平\(\alpha=0.05\),而检验的\(P\)值为 \(0.03<\alpha\),这说明我们的假设检验犯错的概率比事先设定的阈值\(\alpha\)还要小,即错误拒绝原假设的概率很小,我们有理由拒绝原假设;而如果检验的\(P\)值为 \(0.5>\alpha\),这说明错误拒绝原假设的概率很大,因此我们做出的判断为不能拒绝原假设。
    因而在显著性水平 \(\alpha\) 取0.05的前提下,有

\[\begin{cases} P < 0.05, & 拒绝 \ H_0\\ P \geq 0.05, & 不拒绝 \ H_0\\ \end{cases} \]

2 单正态总体均值的假设检验

三类问题:

\[\begin{array}{cccc} \text{I} & H_0:\mu\leq\mu_0 & \text{vs} & H_1:\mu>\mu_0,\\ \text{II} & H_0:\mu\geq\mu_0 & \text{vs} & H_1:\mu<\mu_0,\\ \text{III} & H_0:\mu=\mu_0 & \text{vs} & H_1:\mu\neq\mu_0. \end{array} \]

2.1 \(\sigma = \sigma_0\) 已知时的 \(u\) 检验

对于正态总体的样本,\(\mu\) 的点估计为 \(\bar x\),且有 \(\bar x \sim N(\mu, \sigma_0^2/n)\),因此构造检验统计量

\[u=\frac{\bar x - \mu_0}{\sigma_0/\sqrt{n}} \]

直接给出拒绝域:

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{u\geq u_{1-\alpha}\},\\ \text{II} & W_{\text{II}}=\{u\leq u_{\alpha}\},\\ \text{III} & W_{\text{III}}=\{|u|\geq u_{1-\alpha/2}\}. \end{array} \]

2.1.1 R语言操作——z检验

要用到的函数:z.test(x, y = NULL, alternative = "two.sided", mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)
注:需要先加载BSDA宏包.

例1:从甲地发送一个信号到乙地. 设乙地接收到的信号值是一个服从正态分布 \(N(\mu,0.2^2)\) 的随机变量,其中 \(\mu\) 为甲地发送的真实信号值. 现甲地重复发送同一信号5次,乙地接收到的信号值为

\[8.05 \quad 8.15 \quad 8.2 \quad 8.1 \quad 8.25 \]

设接收方有理由猜测甲地发送的信号值为8,问能否接受这猜想?

根据题意,总体方差\(\sigma=0.2\),建立假设检验

\[H_0 : \mu=8 \quad \text{vs} \quad H_1:\mu \neq 8 \]

构造统计量

\[u = \frac{\bar x - \mu_0}{\sigma_0/\sqrt{n}} \]

如果手算,已知拒绝域为

\[W=\{|u| \geq u_{1-\alpha/2}\} \]

取显著性水平 \(\alpha=0.05\),则 \(u_{1-\alpha/2}=1.96\),而

\[u_0=\sqrt{5}(8.15-8)/0.2=1.68 \]

因此 \(u_0\) 没有落入拒绝域中,故不能拒绝原假设,认为猜测成立。
下面用 R 求解:

x <- c(8.05, 8.15, 8.2, 8.1, 8.25)
library(BSDA)
z.test(x, mu = 8, sigma.x=0.2) # 默认双侧检验

> z.test(x, mu = 8, sigma.x=0.2)

	One-sample z-Test

data:  x
z = 1.6771, p-value = 0.09353
alternative hypothesis: true mean is not equal to 8
95 percent confidence interval:
 7.974695 8.325305
sample estimates:
mean of x 
     8.15

得 \(t=1.68,P值=0.09>0.05\),因此不拒绝原假设,认为猜测成立.

2.2 \(\sigma\) 未知时的 \(t\) 检验

用样本方差 \(s\) 代替总体方差 \(\sigma\),构造 \(t\) 检验统计量

\[t = \frac{\sqrt{n}(\bar x - \mu_0)}{s} \]

当 \(\mu=\mu_0\) 时,\(t \sim t(n-1)\),从而拒绝域为

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{t\geq t_{1-\alpha}(n-1)\},\\ \text{II} & W_{\text{II}}=\{t\leq t_{\alpha}(n-1)\},\\ \text{III} & W_{\text{III}}=\{|t|\geq t_{1-\alpha/2}(n-1)\}. \end{array} \]

2.2.1 R语言操作

要用到的函数:t.test(x, y = NULL, alternative = c("two sided","less","greater"), mu = 0, paired = TRUE, var.equal = FALSE, conf.level = 0.95,...)


例2:在某超市随机选取10袋标重为10kg的大米,称的重量如下:

\[10.1, \ 10, \ 9.8, \ 10.5, \ 9.7, \ 10.1, \ 9.9, \ 10.2, \ 10.3, \ 9.9 \]

假设所称出的重量服从正态分布,试分析该规格的大米重量是否与标重相符?
:总体方差未知,因此选择 \(t\) 检验,建立假设检验:

\[H_0:\mu=10 \quad \text{vs} \quad H_1:\mu \neq 10 \]

直接用 R 求解

x <- c(10.1, 10, 9.8, 10.5, 9.7, 10.1, 9.9, 10.2, 10.3, 9.9)
t.test(x, mu = 10) # 默认双侧检验

> t.test(x, mu = 10)

	One Sample t-test

data:  x
t = 0.65465, df = 9, p-value = 0.5291
alternative hypothesis: true mean is not equal to 10
95 percent confidence interval:
  9.877225 10.222775
sample estimates:
mean of x 
    10.05

结果分析:\(t=0.65, \ P值 = 0.5291>0.05\),因此不拒绝原假设,说明该规格的大米重量是与标重相符的,\(95\%\)置信区间是\([9.877,10.223]\),说明此规格的大米的平均重量有 \(95\%\) 的可能落在9.877kg到10.223kg之间. 样本均值为 10.05kg,说明这10袋大米的平均质量超过10kg.


例3:某种元件寿命服从\(N(\mu,\sigma^2)\),其中 \(\mu,\sigma\) 均未知,先测得16只元件得寿命如下:

\[159, 280, 101, 212, 224, 379, 179, 264,\\ 222, 362, 168, 250, 149, 260, 485, 170 \]

问是否有理由认为元件的平均寿命大于225h?
:建立假设检验

\[H_0:\mu \leq \mu_0=225 \quad \text{vs} \quad H_1:\mu>\mu_0=225 \]

由于目标是检验元件的平均寿命是否大于225,因此将 \(\mu > 225\) 作为备择假设更有说服力。

利用 R 求解:

x <- c(159, 280, 101, 212, 224, 379, 179, 264,
       222, 362, 168, 250, 149, 260, 485, 170)
t.test(x, alternative = 'greater', mu = 225) # 备择假设是 > ,因此用 greater

> t.test(x, alternative = 'greater', mu = 225)

	One Sample t-test

data:  x
t = 0.66852, df = 15, p-value = 0.257
alternative hypothesis: true mean is greater than 225
95 percent confidence interval:
 198.2321      Inf
sample estimates:
mean of x 
    241.5

例4:从一批灯泡中随机取5只作寿命试验,测得寿命为

\[1050 \quad 1100 \quad 1120 \quad 1250 \quad 1280 \]

设灯泡寿命服从正态分布.
(1) 求灯泡寿命平均值的置信水平为0.95的单侧置信下限;
(2) 求这批灯泡平均寿命大于1000h的概率.

:直接用R求解

x <- c(1050, 1100, 1120, 1250, 1280)
t.test(x, mu = 1000, al = 'g') # greater缩写

> t.test(x, mu = 1000, al = 'g')

	One Sample t-test

data:  x
t = 3.5867, df = 4, p-value = 0.01151
alternative hypothesis: true mean is greater than 1000
95 percent confidence interval:
 1064.9    Inf
sample estimates:
mean of x 
     1160 

因此单侧置信下限为1064.9,即约有95%的灯泡能使用1065h以上. \(P值=0.0115\),因此灯泡平均寿命大于1000h的概率约为\(1-0.0115=0.9885\).

3 两个正态总体均值差的假设检验

考虑三类检验问题

\[\begin{array}{cccc} \text{I} & H_0:\mu_1-\mu_2\leq 0 & \text{vs} & H_1:\mu_1-\mu_2 > 0,\\ \text{II} & H_0:\mu_1-\mu_2\geq 0 & \text{vs} & H_1:\mu_1-\mu_2<0,\\ \text{III} & H_0:\mu_1-\mu_2=0 & \text{vs} & H_1:\mu_1-\mu_2\neq 0. \end{array} \]

3.1 \(\sigma_1,\sigma_2\) 已知时的两样本 \(u\) 检验

\(\mu_1-\mu_2\)的点估计\(\bar x-\bar y\) 满足

\[\bar x-\bar y \sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n} \]

构造统计量

\[u=\frac{\bar x-\bar y}{\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}} \]

直接给出拒绝域:

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{u\geq u_{1-\alpha}\},\\ \text{II} & W_{\text{II}}=\{u\leq u_{\alpha}\},\\ \text{III} & W_{\text{III}}=\{|u|\geq u_{1-\alpha/2}\}. \end{array} \]

R语言代码:z.test(x,y,sigma.x = ,sigma.y = ,alternative = "")

3.2 \(\sigma_1=\sigma_2=\sigma\) 未知时的两样本 \(t\) 检验

首先

\[\bar x-\bar y \sim N\bigg(\mu_1-\mu_2,(\frac{1}{m}+\frac{1}{n})\sigma^2\bigg) \]

检验统计量:

\[t = \frac{(\bar x-\bar y)-(\mu_1-\mu_2)}{s_w\sqrt{\frac{1}{m}+\frac{1}{n}}} \]

其中,

\[s_w=\frac{1}{m+n-2}[\sum_{i=1}^m(x_i-\bar x)^2+\sum_{i=1}^n(y_i-\bar y)^2] \]

拒绝域为

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{t\geq t_{1-\alpha}(m+n-2)\},\\ \text{II} & W_{\text{II}}=\{t\leq t_{\alpha}(m+n-2)\},\\ \text{III} & W_{\text{III}}=\{|t|\geq t_{1-\alpha/2}(m+n-2)\}. \end{array} \]

R 语言代码:t.test(x, y, pair.wise = F, var.equal = T, alternative = "")

3.3 \(\sigma_1,\sigma_2\) 未知且不等时的两样本 \(t\) 检验

检验统计量:

\[t = \frac{(\bar x-\bar y)}{\sqrt{\frac{s_1^2}{m}+\frac{s_2^2}{n}}} \sim t(df) \]

式中,t分布的自由度修正如下:

\[df = \frac{(\frac{s_1^2}{m}+\frac{s_2^2}{n})^2}{\frac{1}{m-1}(\frac{s_1^2}{m})^2+\frac{1}{n-1}(\frac{s_2^2}{n})^2} \]

R语言代码: t.test(x, y, pair.wise=F, var.equal=F, alternative="")

3.4 无额外信息. 先比较 \(\sigma\) 后比较 \(\mu\)

3.4.1 两正太方差比的F检验

三类问题:

\[\begin{array}{cccc} \text{I} & H_0:\sigma_1^2\leq \sigma_2^2 & \text{vs} & H_1:\sigma_1^2> \sigma_2^2,\\ \text{II} & H_0:\sigma_1^2\geq \sigma_2^2 & \text{vs} & H_1:\sigma_1^2< \sigma_2^2,\\ \text{III} & H_0:\sigma_1^2=\sigma_2^2 & \text{vs} & H_1:\sigma_1^2\neq \sigma_2^2. \end{array} \]

构造检验统计量

\[F=\frac{s_x^2}{s_y^2} \]

当 \(\sigma_1^2=\sigma_2^2\) 时,\(F\sim F(m-1,n-1)\),由此得出三类问题的拒绝域为:

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{F\geq F_{1-\alpha}(m-1,n-1)\},\\ \text{II} & W_{\text{II}}=\{F\leq F_{\alpha}(m-1,n-1)\},\\ \text{III} & W_{\text{III}}=\{F\leq F_{\alpha/2}(m-1,n-1) \ 或 \ F\geq F_{1-\alpha/2}(m-1,n-1)\}. \end{array} \]

R语言代码:var.test(x,y,alternative="")

3.5 实例

例5:现有炼炉的标准方法和新方法的钢得率数据,设两样本相互独立,且分别来自正态总体 \(N(\mu_1,\sigma_1^2)\) 和 \(N(\mu_2,\sigma_2^2)\),其中 \(\mu_1,\mu_2\) 和 \(\sigma_1^2,\sigma_2^2\) 未知,问新方法能否提高得率?(取\(\alpha=0.05\))

:先比较总体之间的方差

\[H_0:\sigma_1^2=\sigma_2^2 \quad \text{vs} \quad H_1:\sigma_1^2\neq \sigma_2^2 \]

R 代码:

> x <- c(78.1, 72.4, 76.2, 74.3, 77.4, 78.4, 76.0, 75.5, 76.7, 77.3)
> y <- c(79.1, 81.0, 77.3, 79.1, 80.0, 79.1, 79.1, 77.3, 80.2, 82.1)
> var.test(x, y)

	F test to compare two variances

data:  x and y
F = 1.4945, num df = 9, denom df = 9, p-value = 0.559
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.3712079 6.0167710
sample estimates:
ratio of variances 
          1.494481 

结果分析:\(F=1.49,P值=0.559>0.05\) 因此不拒绝原假设,认为两总体之间的方差没有显著性差异. 可以认为 \(\sigma_1=\sigma_2\).

在进行均值差的检验

\[H_0:\mu_1-\mu_2\geq 0 \quad \text{vs} \quad H_1:\mu_1-\mu_2 < 0 \]

R 代码:

> t.test(x, y, var.equal = T, al = 'l')

	Two Sample t-test

data:  x and y
t = -4.2957, df = 18, p-value = 0.0002176
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
      -Inf -1.908255
sample estimates:
mean of x mean of y 
    76.23     79.43

结果分析:\(t=-4.2957,P值=0.0002<0.05\),因此拒绝原假设,认为新方法能提高得率.

4 成对数据检验

如果数据是成对出现的,即\((X_i,Y_i)(i=1,2,\cdots,n)\),则可以进行成对数据均值差的假设检验,其方法是令

\[Z_i=X_i-Y_i \]

然后对 \(Z\) 作单个总体均值的假设检验.

4.1 实例

例6:现有患者治疗前后血红蛋白的含量数据,试求治疗前后血红蛋白数量是否有显著差异.
:建立假设检验

\[H_0:\mu_1=\mu_2 \quad \text{vs} \quad H_1:\mu_1 \neq \mu_2 \]

R 代码:

> x <- c(11.3, 15.0, 15.0, 13.5, 12.8, 10.0, 11.0, 12.0, 13.0, 12.3)
> y <- c(14.0, 13.8, 14.0, 13.5, 13.5, 12.0, 14.7, 11.4, 13.8, 12.0)
> t.test(x, y, paired = T) # paired = T 表示为成对数据

	Paired t-test

data:  x and y
t = -1.3066, df = 9, p-value = 0.2237
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
 -1.8572881  0.4972881
sample estimates:
mean difference 
          -0.68 

> z <- x - y
> t.test(z, mu=0)

	One Sample t-test

data:  z
t = -1.3066, df = 9, p-value = 0.2237
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 -1.8572881  0.4972881
sample estimates:
mean of x 
    -0.68 

两种方法的检验结果一样,\(t=-1.3066,P值=0.2237>0.05\),因此不拒绝原假设,认为治疗前后没有显著差异.

标签:frac,text,假设检验,mu,假设,alpha,sigma
From: https://www.cnblogs.com/hznudmh/p/16745990.html

相关文章

  • 数理统计(三):假设检验
    假设检验和之前的区间估计、点估计同根同源,只是看待的角度有所区别,围绕的中心是不曾变过的。假设检验原理假设检验的基本原理在于如果原条件是真的现在这种情况的出现......