1 假设检验
基本步骤:
-
建立假设 —— 提出原假设和备择假设
- 原假设:也称为零假设(\(H_0\)),通常是统计者想要拒绝的假设。
- 备择假设:也称对立假设(\(H_1\)),通常是统计者想要接受的假设。
- 类型:当原假设为 \(H_0:\theta=\theta_0\) 时,备择假设可能有三种情况
- \(H_1:\theta \neq \theta_0\),此时称为双侧假设或双边假设。
- \(H_1:\theta < \theta_0\) 或 \(H_1:\theta > \theta_0\),此时称为单侧假设或单边假设。
注:在假设检验中,通常将不宜轻易加以否定的假设作为原假设。
-
选择检验统计量,给出拒绝域 \(W\)
-
选择显著性水平
我们在应用某种检验判断时,可能做出正确的判断,也可能做出错误的判断,因此可能犯两种错误:- 当原假设为真,而样本由于随机性却落入了拒绝域,于是我们做出了拒绝原假设的错误决策,这样的错误称为第一类错误。
- 当备择假设为真,而样本却落入了接受域,于是我们采取了接受原假设的错误决策,这样的错误称为第二类错误。
因此需要确定一个显著性水平,以尽可能减少错误决策。然而事实证明,我们没法使犯两类错误的概率同时减小,因此通常的做法是仅限制犯第一类错误的概率 \(\alpha\)。
显著性水平 \(\alpha\),即为在原假设为真时拒绝原假设的概率。例如,显著性水平0.05表示当没有实际差异时得出存在差异,会有5%的风险。 -
给出拒绝域
所谓拒绝域,就是样本空间中导致拒绝零假设的全体样本点的集合。在图像上拒绝域即为显著性水平围成的一个区域,如下图
样本点落入拒绝域中,即认为我们犯第一类错误的概率比事先设定的阈值 \(\alpha\) 还要小,即此时我们做出拒绝原假设的决策是可靠的。反之,如果样本点没有落入拒绝域,即我们犯第一类错误的概率比较大,那么我们此时做出拒绝原假设的决策是不可靠的,因此不能拒绝原假设。 -
计算P值
P值——假设检验犯弃真错误(第一类错误)的概率。
P值的统计学定义为:在一个假设检验中,利用样本观测值能够作出拒绝原假设的最小显著性水平称为检验的P值。
举个例子,假设我们取显著性水平\(\alpha=0.05\),而检验的\(P\)值为 \(0.03<\alpha\),这说明我们的假设检验犯错的概率比事先设定的阈值\(\alpha\)还要小,即错误拒绝原假设的概率很小,我们有理由拒绝原假设;而如果检验的\(P\)值为 \(0.5>\alpha\),这说明错误拒绝原假设的概率很大,因此我们做出的判断为不能拒绝原假设。
因而在显著性水平 \(\alpha\) 取0.05的前提下,有
2 单正态总体均值的假设检验
三类问题:
\[\begin{array}{cccc} \text{I} & H_0:\mu\leq\mu_0 & \text{vs} & H_1:\mu>\mu_0,\\ \text{II} & H_0:\mu\geq\mu_0 & \text{vs} & H_1:\mu<\mu_0,\\ \text{III} & H_0:\mu=\mu_0 & \text{vs} & H_1:\mu\neq\mu_0. \end{array} \]2.1 \(\sigma = \sigma_0\) 已知时的 \(u\) 检验
对于正态总体的样本,\(\mu\) 的点估计为 \(\bar x\),且有 \(\bar x \sim N(\mu, \sigma_0^2/n)\),因此构造检验统计量
\[u=\frac{\bar x - \mu_0}{\sigma_0/\sqrt{n}} \]直接给出拒绝域:
\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{u\geq u_{1-\alpha}\},\\ \text{II} & W_{\text{II}}=\{u\leq u_{\alpha}\},\\ \text{III} & W_{\text{III}}=\{|u|\geq u_{1-\alpha/2}\}. \end{array} \]2.1.1 R语言操作——z检验
要用到的函数:z.test(x, y = NULL, alternative = "two.sided", mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)
注:需要先加载BSDA宏包.
例1:从甲地发送一个信号到乙地. 设乙地接收到的信号值是一个服从正态分布 \(N(\mu,0.2^2)\) 的随机变量,其中 \(\mu\) 为甲地发送的真实信号值. 现甲地重复发送同一信号5次,乙地接收到的信号值为
\[8.05 \quad 8.15 \quad 8.2 \quad 8.1 \quad 8.25 \]设接收方有理由猜测甲地发送的信号值为8,问能否接受这猜想?
解 根据题意,总体方差\(\sigma=0.2\),建立假设检验
\[H_0 : \mu=8 \quad \text{vs} \quad H_1:\mu \neq 8 \]构造统计量
\[u = \frac{\bar x - \mu_0}{\sigma_0/\sqrt{n}} \]如果手算,已知拒绝域为
\[W=\{|u| \geq u_{1-\alpha/2}\} \]取显著性水平 \(\alpha=0.05\),则 \(u_{1-\alpha/2}=1.96\),而
\[u_0=\sqrt{5}(8.15-8)/0.2=1.68 \]因此 \(u_0\) 没有落入拒绝域中,故不能拒绝原假设,认为猜测成立。
下面用 R 求解:
x <- c(8.05, 8.15, 8.2, 8.1, 8.25)
library(BSDA)
z.test(x, mu = 8, sigma.x=0.2) # 默认双侧检验
> z.test(x, mu = 8, sigma.x=0.2)
One-sample z-Test
data: x
z = 1.6771, p-value = 0.09353
alternative hypothesis: true mean is not equal to 8
95 percent confidence interval:
7.974695 8.325305
sample estimates:
mean of x
8.15
得 \(t=1.68,P值=0.09>0.05\),因此不拒绝原假设,认为猜测成立.
2.2 \(\sigma\) 未知时的 \(t\) 检验
用样本方差 \(s\) 代替总体方差 \(\sigma\),构造 \(t\) 检验统计量
\[t = \frac{\sqrt{n}(\bar x - \mu_0)}{s} \]当 \(\mu=\mu_0\) 时,\(t \sim t(n-1)\),从而拒绝域为
\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{t\geq t_{1-\alpha}(n-1)\},\\ \text{II} & W_{\text{II}}=\{t\leq t_{\alpha}(n-1)\},\\ \text{III} & W_{\text{III}}=\{|t|\geq t_{1-\alpha/2}(n-1)\}. \end{array} \]2.2.1 R语言操作
要用到的函数:t.test(x, y = NULL, alternative = c("two sided","less","greater"), mu = 0, paired = TRUE, var.equal = FALSE, conf.level = 0.95,...)
例2:在某超市随机选取10袋标重为10kg的大米,称的重量如下:
\[10.1, \ 10, \ 9.8, \ 10.5, \ 9.7, \ 10.1, \ 9.9, \ 10.2, \ 10.3, \ 9.9 \]假设所称出的重量服从正态分布,试分析该规格的大米重量是否与标重相符?
解:总体方差未知,因此选择 \(t\) 检验,建立假设检验:
直接用 R 求解
x <- c(10.1, 10, 9.8, 10.5, 9.7, 10.1, 9.9, 10.2, 10.3, 9.9)
t.test(x, mu = 10) # 默认双侧检验
> t.test(x, mu = 10)
One Sample t-test
data: x
t = 0.65465, df = 9, p-value = 0.5291
alternative hypothesis: true mean is not equal to 10
95 percent confidence interval:
9.877225 10.222775
sample estimates:
mean of x
10.05
结果分析:\(t=0.65, \ P值 = 0.5291>0.05\),因此不拒绝原假设,说明该规格的大米重量是与标重相符的,\(95\%\)置信区间是\([9.877,10.223]\),说明此规格的大米的平均重量有 \(95\%\) 的可能落在9.877kg到10.223kg之间. 样本均值为 10.05kg,说明这10袋大米的平均质量超过10kg.
例3:某种元件寿命服从\(N(\mu,\sigma^2)\),其中 \(\mu,\sigma\) 均未知,先测得16只元件得寿命如下:
\[159, 280, 101, 212, 224, 379, 179, 264,\\ 222, 362, 168, 250, 149, 260, 485, 170 \]问是否有理由认为元件的平均寿命大于225h?
解:建立假设检验
由于目标是检验元件的平均寿命是否大于225,因此将 \(\mu > 225\) 作为备择假设更有说服力。
利用 R 求解:
x <- c(159, 280, 101, 212, 224, 379, 179, 264,
222, 362, 168, 250, 149, 260, 485, 170)
t.test(x, alternative = 'greater', mu = 225) # 备择假设是 > ,因此用 greater
> t.test(x, alternative = 'greater', mu = 225)
One Sample t-test
data: x
t = 0.66852, df = 15, p-value = 0.257
alternative hypothesis: true mean is greater than 225
95 percent confidence interval:
198.2321 Inf
sample estimates:
mean of x
241.5
例4:从一批灯泡中随机取5只作寿命试验,测得寿命为
\[1050 \quad 1100 \quad 1120 \quad 1250 \quad 1280 \]设灯泡寿命服从正态分布.
(1) 求灯泡寿命平均值的置信水平为0.95的单侧置信下限;
(2) 求这批灯泡平均寿命大于1000h的概率.
解:直接用R求解
x <- c(1050, 1100, 1120, 1250, 1280)
t.test(x, mu = 1000, al = 'g') # greater缩写
> t.test(x, mu = 1000, al = 'g')
One Sample t-test
data: x
t = 3.5867, df = 4, p-value = 0.01151
alternative hypothesis: true mean is greater than 1000
95 percent confidence interval:
1064.9 Inf
sample estimates:
mean of x
1160
因此单侧置信下限为1064.9,即约有95%的灯泡能使用1065h以上. \(P值=0.0115\),因此灯泡平均寿命大于1000h的概率约为\(1-0.0115=0.9885\).
3 两个正态总体均值差的假设检验
考虑三类检验问题
\[\begin{array}{cccc} \text{I} & H_0:\mu_1-\mu_2\leq 0 & \text{vs} & H_1:\mu_1-\mu_2 > 0,\\ \text{II} & H_0:\mu_1-\mu_2\geq 0 & \text{vs} & H_1:\mu_1-\mu_2<0,\\ \text{III} & H_0:\mu_1-\mu_2=0 & \text{vs} & H_1:\mu_1-\mu_2\neq 0. \end{array} \]3.1 \(\sigma_1,\sigma_2\) 已知时的两样本 \(u\) 检验
\(\mu_1-\mu_2\)的点估计\(\bar x-\bar y\) 满足
\[\bar x-\bar y \sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n} \]构造统计量
\[u=\frac{\bar x-\bar y}{\sqrt{\frac{\sigma_1^2}{m}+\frac{\sigma_2^2}{n}}} \]直接给出拒绝域:
\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{u\geq u_{1-\alpha}\},\\ \text{II} & W_{\text{II}}=\{u\leq u_{\alpha}\},\\ \text{III} & W_{\text{III}}=\{|u|\geq u_{1-\alpha/2}\}. \end{array} \]R语言代码:z.test(x,y,sigma.x = ,sigma.y = ,alternative = "")
3.2 \(\sigma_1=\sigma_2=\sigma\) 未知时的两样本 \(t\) 检验
首先
\[\bar x-\bar y \sim N\bigg(\mu_1-\mu_2,(\frac{1}{m}+\frac{1}{n})\sigma^2\bigg) \]检验统计量:
\[t = \frac{(\bar x-\bar y)-(\mu_1-\mu_2)}{s_w\sqrt{\frac{1}{m}+\frac{1}{n}}} \]其中,
\[s_w=\frac{1}{m+n-2}[\sum_{i=1}^m(x_i-\bar x)^2+\sum_{i=1}^n(y_i-\bar y)^2] \]拒绝域为
\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{t\geq t_{1-\alpha}(m+n-2)\},\\ \text{II} & W_{\text{II}}=\{t\leq t_{\alpha}(m+n-2)\},\\ \text{III} & W_{\text{III}}=\{|t|\geq t_{1-\alpha/2}(m+n-2)\}. \end{array} \]R 语言代码:t.test(x, y, pair.wise = F, var.equal = T, alternative = "")
3.3 \(\sigma_1,\sigma_2\) 未知且不等时的两样本 \(t\) 检验
检验统计量:
\[t = \frac{(\bar x-\bar y)}{\sqrt{\frac{s_1^2}{m}+\frac{s_2^2}{n}}} \sim t(df) \]式中,t分布的自由度修正如下:
\[df = \frac{(\frac{s_1^2}{m}+\frac{s_2^2}{n})^2}{\frac{1}{m-1}(\frac{s_1^2}{m})^2+\frac{1}{n-1}(\frac{s_2^2}{n})^2} \]R语言代码: t.test(x, y, pair.wise=F, var.equal=F, alternative="")
3.4 无额外信息. 先比较 \(\sigma\) 后比较 \(\mu\)
3.4.1 两正太方差比的F检验
三类问题:
\[\begin{array}{cccc} \text{I} & H_0:\sigma_1^2\leq \sigma_2^2 & \text{vs} & H_1:\sigma_1^2> \sigma_2^2,\\ \text{II} & H_0:\sigma_1^2\geq \sigma_2^2 & \text{vs} & H_1:\sigma_1^2< \sigma_2^2,\\ \text{III} & H_0:\sigma_1^2=\sigma_2^2 & \text{vs} & H_1:\sigma_1^2\neq \sigma_2^2. \end{array} \]构造检验统计量
\[F=\frac{s_x^2}{s_y^2} \]当 \(\sigma_1^2=\sigma_2^2\) 时,\(F\sim F(m-1,n-1)\),由此得出三类问题的拒绝域为:
\[\begin{array}{cc} \text{I} & W_{\text{I}}=\{F\geq F_{1-\alpha}(m-1,n-1)\},\\ \text{II} & W_{\text{II}}=\{F\leq F_{\alpha}(m-1,n-1)\},\\ \text{III} & W_{\text{III}}=\{F\leq F_{\alpha/2}(m-1,n-1) \ 或 \ F\geq F_{1-\alpha/2}(m-1,n-1)\}. \end{array} \]R语言代码:var.test(x,y,alternative="")
3.5 实例
例5:现有炼炉的标准方法和新方法的钢得率数据,设两样本相互独立,且分别来自正态总体 \(N(\mu_1,\sigma_1^2)\) 和 \(N(\mu_2,\sigma_2^2)\),其中 \(\mu_1,\mu_2\) 和 \(\sigma_1^2,\sigma_2^2\) 未知,问新方法能否提高得率?(取\(\alpha=0.05\))
解:先比较总体之间的方差
\[H_0:\sigma_1^2=\sigma_2^2 \quad \text{vs} \quad H_1:\sigma_1^2\neq \sigma_2^2 \]R 代码:
> x <- c(78.1, 72.4, 76.2, 74.3, 77.4, 78.4, 76.0, 75.5, 76.7, 77.3)
> y <- c(79.1, 81.0, 77.3, 79.1, 80.0, 79.1, 79.1, 77.3, 80.2, 82.1)
> var.test(x, y)
F test to compare two variances
data: x and y
F = 1.4945, num df = 9, denom df = 9, p-value = 0.559
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.3712079 6.0167710
sample estimates:
ratio of variances
1.494481
结果分析:\(F=1.49,P值=0.559>0.05\) 因此不拒绝原假设,认为两总体之间的方差没有显著性差异. 可以认为 \(\sigma_1=\sigma_2\).
在进行均值差的检验
\[H_0:\mu_1-\mu_2\geq 0 \quad \text{vs} \quad H_1:\mu_1-\mu_2 < 0 \]R 代码:
> t.test(x, y, var.equal = T, al = 'l')
Two Sample t-test
data: x and y
t = -4.2957, df = 18, p-value = 0.0002176
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf -1.908255
sample estimates:
mean of x mean of y
76.23 79.43
结果分析:\(t=-4.2957,P值=0.0002<0.05\),因此拒绝原假设,认为新方法能提高得率.
4 成对数据检验
如果数据是成对出现的,即\((X_i,Y_i)(i=1,2,\cdots,n)\),则可以进行成对数据均值差的假设检验,其方法是令
\[Z_i=X_i-Y_i \]然后对 \(Z\) 作单个总体均值的假设检验.
4.1 实例
例6:现有患者治疗前后血红蛋白的含量数据,试求治疗前后血红蛋白数量是否有显著差异.
解:建立假设检验
R 代码:
> x <- c(11.3, 15.0, 15.0, 13.5, 12.8, 10.0, 11.0, 12.0, 13.0, 12.3)
> y <- c(14.0, 13.8, 14.0, 13.5, 13.5, 12.0, 14.7, 11.4, 13.8, 12.0)
> t.test(x, y, paired = T) # paired = T 表示为成对数据
Paired t-test
data: x and y
t = -1.3066, df = 9, p-value = 0.2237
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
-1.8572881 0.4972881
sample estimates:
mean difference
-0.68
> z <- x - y
> t.test(z, mu=0)
One Sample t-test
data: z
t = -1.3066, df = 9, p-value = 0.2237
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
-1.8572881 0.4972881
sample estimates:
mean of x
-0.68
两种方法的检验结果一样,\(t=-1.3066,P值=0.2237>0.05\),因此不拒绝原假设,认为治疗前后没有显著差异.
标签:frac,text,假设检验,mu,假设,alpha,sigma From: https://www.cnblogs.com/hznudmh/p/16745990.html