1 假设检验

基本步骤：

建立假设 —— 提出原假设和备择假设
- 原假设：也称为零假设（\(H_0\)），通常是统计者想要拒绝的假设。
- 备择假设：也称对立假设（\(H_1\)），通常是统计者想要接受的假设。
- 类型：当原假设为 \(H_0:\theta=\theta_0\) 时，备择假设可能有三种情况
  - \(H_1:\theta \neq \theta_0\)，此时称为双侧假设或双边假设。
  - \(H_1:\theta < \theta_0\) 或 \(H_1:\theta > \theta_0\)，此时称为单侧假设或单边假设。
注：在假设检验中，通常将不宜轻易加以否定的假设作为原假设。
选择检验统计量，给出拒绝域 \(W\)
选择显著性水平
我们在应用某种检验判断时，可能做出正确的判断，也可能做出错误的判断，因此可能犯两种错误：
1. 当原假设为真，而样本由于随机性却落入了拒绝域，于是我们做出了拒绝原假设的错误决策，这样的错误称为第一类错误。
2. 当备择假设为真，而样本却落入了接受域，于是我们采取了接受原假设的错误决策，这样的错误称为第二类错误。
因此需要确定一个显著性水平，以尽可能减少错误决策。然而事实证明，我们没法使犯两类错误的概率同时减小，因此通常的做法是仅限制犯第一类错误的概率 \(\alpha\)。
显著性水平 \(\alpha\)，即为在原假设为真时拒绝原假设的概率。例如，显著性水平0.05表示当没有实际差异时得出存在差异，会有5％的风险。
给出拒绝域
所谓拒绝域，就是样本空间中导致拒绝零假设的全体样本点的集合。在图像上拒绝域即为显著性水平围成的一个区域，如下图

样本点落入拒绝域中，即认为我们犯第一类错误的概率比事先设定的阈值 \(\alpha\) 还要小，即此时我们做出拒绝原假设的决策是可靠的。反之，如果样本点没有落入拒绝域，即我们犯第一类错误的概率比较大，那么我们此时做出拒绝原假设的决策是不可靠的，因此不能拒绝原假设。
计算P值
P值——假设检验犯弃真错误（第一类错误）的概率。
P值的统计学定义为：在一个假设检验中，利用样本观测值能够作出拒绝原假设的最小显著性水平称为检验的P值。
举个例子，假设我们取显著性水平\(\alpha=0.05\)，而检验的\(P\)值为 \(0.03<\alpha\)，这说明我们的假设检验犯错的概率比事先设定的阈值\(\alpha\)还要小，即错误拒绝原假设的概率很小，我们有理由拒绝原假设；而如果检验的\(P\)值为 \(0.5>\alpha\)，这说明错误拒绝原假设的概率很大，因此我们做出的判断为不能拒绝原假设。
因而在显著性水平 \(\alpha\) 取0.05的前提下，有

\[\begin{cases} P < 0.05, & 拒绝 \ H_0\\ P \geq 0.05, & 不拒绝 \ H_0\\ \end{cases} \]

2 单正态总体均值的假设检验

三类问题：

\[\begin{array}{cccc} \text{I} & H_0:\mu\leq\mu_0 & \text{vs} & H_1:\mu>\mu_0,\\ \text{II} & H_0:\mu\geq\mu_0 & \text{vs} & H_1:\mu<\mu_0,\\ \text{III} & H_0:\mu=\mu_0 & \text{vs} & H_1:\mu\neq\mu_0. \end{array} \]

2.1 \(\sigma = \sigma_0\) 已知时的 \(u\) 检验

对于正态总体的样本，\(\mu\) 的点估计为 \(\bar x\)，且有 \(\bar x \sim N(\mu, \sigma_0^2/n)\)，因此构造检验统计量

\[u=\frac{\bar x - \mu_0}{\sigma_0/\sqrt{n}} \]

直接给出拒绝域：

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{u\geq u_{1-\alpha}\},\\ \text{II} & W_{\text{II}}=\{u\leq u_{\alpha}\},\\ \text{III} & W_{\text{III}}=\{|u|\geq u_{1-\alpha/2}\}. \end{array} \]

2.1.1 R语言操作——z检验

要用到的函数：z.test(x, y = NULL, alternative = "two.sided", mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)
注：需要先加载BSDA宏包.

例1：从甲地发送一个信号到乙地. 设乙地接收到的信号值是一个服从正态分布 \(N(\mu,0.2^2)\) 的随机变量，其中 \(\mu\) 为甲地发送的真实信号值. 现甲地重复发送同一信号5次，乙地接收到的信号值为

\[8.05 \quad 8.15 \quad 8.2 \quad 8.1 \quad 8.25 \]

设接收方有理由猜测甲地发送的信号值为8，问能否接受这猜想？

解根据题意，总体方差\(\sigma=0.2\)，建立假设检验

\[H_0 : \mu=8 \quad \text{vs} \quad H_1:\mu \neq 8 \]

构造统计量

\[u = \frac{\bar x - \mu_0}{\sigma_0/\sqrt{n}} \]

如果手算，已知拒绝域为

\[W=\{|u| \geq u_{1-\alpha/2}\} \]

取显著性水平 \(\alpha=0.05\)，则 \(u_{1-\alpha/2}=1.96\)，而

\[u_0=\sqrt{5}(8.15-8)/0.2=1.68 \]

因此 \(u_0\) 没有落入拒绝域中，故不能拒绝原假设，认为猜测成立。
下面用 R 求解：

x <- c(8.05, 8.15, 8.2, 8.1, 8.25)
library(BSDA)
z.test(x, mu = 8, sigma.x=0.2) # 默认双侧检验

> z.test(x, mu = 8, sigma.x=0.2)

	One-sample z-Test

data:  x
z = 1.6771, p-value = 0.09353
alternative hypothesis: true mean is not equal to 8
95 percent confidence interval:
 7.974695 8.325305
sample estimates:
mean of x 
     8.15

得 \(t=1.68,P值=0.09>0.05\)，因此不拒绝原假设，认为猜测成立.

2.2 \(\sigma\) 未知时的 \(t\) 检验

用样本方差 \(s\) 代替总体方差 \(\sigma\)，构造 \(t\) 检验统计量

\[t = \frac{\sqrt{n}(\bar x - \mu_0)}{s} \]

当 \(\mu=\mu_0\) 时，\(t \sim t(n-1)\)，从而拒绝域为

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{t\geq t_{1-\alpha}(n-1)\},\\ \text{II} & W_{\text{II}}=\{t\leq t_{\alpha}(n-1)\},\\ \text{III} & W_{\text{III}}=\{|t|\geq t_{1-\alpha/2}(n-1)\}. \end{array} \]

2.2.1 R语言操作

要用到的函数：t.test(x, y = NULL, alternative = c("two sided","less","greater"), mu = 0, paired = TRUE, var.equal = FALSE, conf.level = 0.95,...)

例2：在某超市随机选取10袋标重为10kg的大米，称的重量如下：

\[10.1, \ 10, \ 9.8, \ 10.5, \ 9.7, \ 10.1, \ 9.9, \ 10.2, \ 10.3, \ 9.9 \]

假设所称出的重量服从正态分布，试分析该规格的大米重量是否与标重相符？
解：总体方差未知，因此选择 \(t\) 检验，建立假设检验：

\[H_0:\mu=10 \quad \text{vs} \quad H_1:\mu \neq 10 \]

直接用 R 求解

x <- c(10.1, 10, 9.8, 10.5, 9.7, 10.1, 9.9, 10.2, 10.3, 9.9)
t.test(x, mu = 10) # 默认双侧检验

> t.test(x, mu = 10)

	One Sample t-test

data:  x
t = 0.65465, df = 9, p-value = 0.5291
alternative hypothesis: true mean is not equal to 10
95 percent confidence interval:
  9.877225 10.222775
sample estimates:
mean of x 
    10.05

结果分析：\(t=0.65, \ P值 = 0.5291>0.05\)，因此不拒绝原假设，说明该规格的大米重量是与标重相符的，\(95\%\)置信区间是\([9.877,10.223]\)，说明此规格的大米的平均重量有 \(95\%\) 的可能落在9.877kg到10.223kg之间. 样本均值为 10.05kg，说明这10袋大米的平均质量超过10kg.

例3：某种元件寿命服从\(N(\mu,\sigma^2)\)，其中 \(\mu,\sigma\) 均未知，先测得16只元件得寿命如下：

\[159, 280, 101, 212, 224, 379, 179, 264,\\ 222, 362, 168, 250, 149, 260, 485, 170 \]

问是否有理由认为元件的平均寿命大于225h？
解：建立假设检验

\[H_0:\mu \leq \mu_0=225 \quad \text{vs} \quad H_1:\mu>\mu_0=225 \]

由于目标是检验元件的平均寿命是否大于225，因此将 \(\mu > 225\) 作为备择假设更有说服力。

利用 R 求解：

x <- c(159, 280, 101, 212, 224, 379, 179, 264,
       222, 362, 168, 250, 149, 260, 485, 170)
t.test(x, alternative = 'greater', mu = 225) # 备择假设是 > ，因此用 greater

> t.test(x, alternative = 'greater', mu = 225)

	One Sample t-test

data:  x
t = 0.66852, df = 15, p-value = 0.257
alternative hypothesis: true mean is greater than 225
95 percent confidence interval:
 198.2321      Inf
sample estimates:
mean of x 
    241.5

例4：从一批灯泡中随机取5只作寿命试验，测得寿命为

\[1050 \quad 1100 \quad 1120 \quad 1250 \quad 1280 \]

设灯泡寿命服从正态分布.
(1) 求灯泡寿命平均值的置信水平为0.95的单侧置信下限；
(2) 求这批灯泡平均寿命大于1000h的概率.

解：直接用R求解

x <- c(1050, 1100, 1120, 1250, 1280)
t.test(x, mu = 1000, al = 'g') # greater缩写

> t.test(x, mu = 1000, al = 'g')

	One Sample t-test

data:  x
t = 3.5867, df = 4, p-value = 0.01151
alternative hypothesis: true mean is greater than 1000
95 percent confidence interval:
 1064.9    Inf
sample estimates:
mean of x 
     1160

因此单侧置信下限为1064.9，即约有95%的灯泡能使用1065h以上. \(P值=0.0115\)，因此灯泡平均寿命大于1000h的概率约为\(1-0.0115=0.9885\).

3 两个正态总体均值差的假设检验

考虑三类检验问题

\[\begin{array}{cccc} \text{I} & H_0:\mu_1-\mu_2\leq 0 & \text{vs} & H_1:\mu_1-\mu_2 > 0,\\ \text{II} & H_0:\mu_1-\mu_2\geq 0 & \text{vs} & H_1:\mu_1-\mu_2<0,\\ \text{III} & H_0:\mu_1-\mu_2=0 & \text{vs} & H_1:\mu_1-\mu_2\neq 0. \end{array} \]

3.1 \(\sigma_1,\sigma_2\) 已知时的两样本 \(u\) 检验

\(\mu_1-\mu_2\)的点估计\(\bar x-\bar y\) 满足

\[\bar x-\bar y \sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n} \]

构造统计量

\[u=\frac{\bar x-\bar y}{\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}} \]

直接给出拒绝域：

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{u\geq u_{1-\alpha}\},\\ \text{II} & W_{\text{II}}=\{u\leq u_{\alpha}\},\\ \text{III} & W_{\text{III}}=\{|u|\geq u_{1-\alpha/2}\}. \end{array} \]

R语言代码：z.test(x,y,sigma.x = ,sigma.y = ,alternative = "")

3.2 \(\sigma_1=\sigma_2=\sigma\) 未知时的两样本 \(t\) 检验

首先

\[\bar x-\bar y \sim N\bigg(\mu_1-\mu_2,(\frac{1}{m}+\frac{1}{n})\sigma^2\bigg) \]

检验统计量：

\[t = \frac{(\bar x-\bar y)-(\mu_1-\mu_2)}{s_w\sqrt{\frac{1}{m}+\frac{1}{n}}} \]

其中，

\[s_w=\frac{1}{m+n-2}[\sum_{i=1}^m(x_i-\bar x)^2+\sum_{i=1}^n(y_i-\bar y)^2] \]

拒绝域为

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{t\geq t_{1-\alpha}(m+n-2)\},\\ \text{II} & W_{\text{II}}=\{t\leq t_{\alpha}(m+n-2)\},\\ \text{III} & W_{\text{III}}=\{|t|\geq t_{1-\alpha/2}(m+n-2)\}. \end{array} \]

R 语言代码：t.test(x, y, pair.wise = F, var.equal = T, alternative = "")

3.3 \(\sigma_1,\sigma_2\) 未知且不等时的两样本 \(t\) 检验

检验统计量：

\[t = \frac{(\bar x-\bar y)}{\sqrt{\frac{s_1^2}{m}+\frac{s_2^2}{n}}} \sim t(df) \]

式中，t分布的自由度修正如下：

\[df = \frac{(\frac{s_1^2}{m}+\frac{s_2^2}{n})^2}{\frac{1}{m-1}(\frac{s_1^2}{m})^2+\frac{1}{n-1}(\frac{s_2^2}{n})^2} \]

R语言代码： t.test(x, y, pair.wise=F, var.equal=F, alternative="")

3.4 无额外信息. 先比较 \(\sigma\) 后比较 \(\mu\)

3.4.1 两正太方差比的F检验

三类问题：

\[\begin{array}{cccc} \text{I} & H_0:\sigma_1^2\leq \sigma_2^2 & \text{vs} & H_1:\sigma_1^2> \sigma_2^2,\\ \text{II} & H_0:\sigma_1^2\geq \sigma_2^2 & \text{vs} & H_1:\sigma_1^2< \sigma_2^2,\\ \text{III} & H_0:\sigma_1^2=\sigma_2^2 & \text{vs} & H_1:\sigma_1^2\neq \sigma_2^2. \end{array} \]

构造检验统计量

\[F=\frac{s_x^2}{s_y^2} \]

当 \(\sigma_1^2=\sigma_2^2\) 时，\(F\sim F(m-1,n-1)\)，由此得出三类问题的拒绝域为：

\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{F\geq F_{1-\alpha}(m-1,n-1)\},\\ \text{II} & W_{\text{II}}=\{F\leq F_{\alpha}(m-1,n-1)\},\\ \text{III} & W_{\text{III}}=\{F\leq F_{\alpha/2}(m-1,n-1) \ 或 \ F\geq F_{1-\alpha/2}(m-1,n-1)\}. \end{array} \]

R语言代码：var.test(x,y,alternative="")

3.5 实例

例5：现有炼炉的标准方法和新方法的钢得率数据，设两样本相互独立，且分别来自正态总体 \(N(\mu_1,\sigma_1^2)\) 和 \(N(\mu_2,\sigma_2^2)\)，其中 \(\mu_1,\mu_2\) 和 \(\sigma_1^2,\sigma_2^2\) 未知，问新方法能否提高得率？(取\(\alpha=0.05\))

解：先比较总体之间的方差

\[H_0:\sigma_1^2=\sigma_2^2 \quad \text{vs} \quad H_1:\sigma_1^2\neq \sigma_2^2 \]

R 代码：

> x <- c(78.1, 72.4, 76.2, 74.3, 77.4, 78.4, 76.0, 75.5, 76.7, 77.3)
> y <- c(79.1, 81.0, 77.3, 79.1, 80.0, 79.1, 79.1, 77.3, 80.2, 82.1)
> var.test(x, y)

	F test to compare two variances

data:  x and y
F = 1.4945, num df = 9, denom df = 9, p-value = 0.559
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.3712079 6.0167710
sample estimates:
ratio of variances 
          1.494481

结果分析：\(F=1.49,P值=0.559>0.05\) 因此不拒绝原假设，认为两总体之间的方差没有显著性差异. 可以认为 \(\sigma_1=\sigma_2\).

在进行均值差的检验

\[H_0:\mu_1-\mu_2\geq 0 \quad \text{vs} \quad H_1:\mu_1-\mu_2 < 0 \]

R 代码：

> t.test(x, y, var.equal = T, al = 'l')

	Two Sample t-test

data:  x and y
t = -4.2957, df = 18, p-value = 0.0002176
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
      -Inf -1.908255
sample estimates:
mean of x mean of y 
    76.23     79.43

结果分析：\(t=-4.2957,P值=0.0002<0.05\)，因此拒绝原假设，认为新方法能提高得率.

4 成对数据检验

如果数据是成对出现的，即\((X_i,Y_i)(i=1,2,\cdots,n)\)，则可以进行成对数据均值差的假设检验，其方法是令

\[Z_i=X_i-Y_i \]

然后对 \(Z\) 作单个总体均值的假设检验.

4.1 实例

例6：现有患者治疗前后血红蛋白的含量数据，试求治疗前后血红蛋白数量是否有显著差异.
解：建立假设检验

\[H_0:\mu_1=\mu_2 \quad \text{vs} \quad H_1:\mu_1 \neq \mu_2 \]

R 代码：

> x <- c(11.3, 15.0, 15.0, 13.5, 12.8, 10.0, 11.0, 12.0, 13.0, 12.3)
> y <- c(14.0, 13.8, 14.0, 13.5, 13.5, 12.0, 14.7, 11.4, 13.8, 12.0)
> t.test(x, y, paired = T) # paired = T 表示为成对数据

	Paired t-test

data:  x and y
t = -1.3066, df = 9, p-value = 0.2237
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
 -1.8572881  0.4972881
sample estimates:
mean difference 
          -0.68 

> z <- x - y
> t.test(z, mu=0)

	One Sample t-test

data:  z
t = -1.3066, df = 9, p-value = 0.2237
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 -1.8572881  0.4972881
sample estimates:
mean of x 
    -0.68

两种方法的检验结果一样，\(t=-1.3066,P值=0.2237>0.05\)，因此不拒绝原假设，认为治疗前后没有显著差异.

标签：frac,text,假设检验,mu,假设,alpha,sigma
From： https://www.cnblogs.com/hznudmh/p/16745990.html

假设检验

1 假设检验

2 单正态总体均值的假设检验

2.1 \(\sigma = \sigma_0\) 已知时的 \(u\) 检验

2.1.1 R语言操作——z检验

2.2 \(\sigma\) 未知时的 \(t\) 检验

2.2.1 R语言操作

3 两个正态总体均值差的假设检验

3.1 \(\sigma_1,\sigma_2\) 已知时的两样本 \(u\) 检验

3.2 \(\sigma_1=\sigma_2=\sigma\) 未知时的两样本 \(t\) 检验

3.3 \(\sigma_1,\sigma_2\) 未知且不等时的两样本 \(t\) 检验

3.4 无额外信息. 先比较 \(\sigma\) 后比较 \(\mu\)

3.4.1 两正太方差比的F检验

3.5 实例

4 成对数据检验

4.1 实例

相关文章

赞助商

阅读排行