目录
三大分布密度函数推导
下面方程的解\(\sum_{j=v}^{n} C_{n}^{i} \underline{p}'(1-\underline{p})^{n-1}=\alpha / 2\),\(\sum_{j=0}^{\infty} C_{n}' \overline{p}'(1-\overline{p})^{n-i}=\alpha / 2\),其中r为实际观察值,可以指出\(p=r\left[(n-r+1) F_{2(n-r+1), 2 r}(\alpha / 2)+r\right]^{-1} \quad(3.51)\),\(\overline{p}= (r+1) F_{2(r+1), 2(n-r)}(\alpha / 2)[n-r+(r+1) F_{2(r+1), 2(n-r)}(\alpha / 2)]^{-1}. \quad(3.52)\)。
例3.16从某批产品中随机地抽了20个样品,发现其中有6个是次品,求这批产品其次品率的区间估计\((\alpha=10 \%)\)。解由公式(3.51)和(3.52)得\(\underline{p}=6\left[(20-6+1) F_{30,12}(0.05)+6\right]^{-1}=0.139\),\(\overline{p} =(6+1) F_{14,28}(0.05)\left[20-6+(6+1) F_{14,28}(0.05)\right]^{-1}=0.507\),次品率p的区间估计为(0.139,0.507)。
第六节\(\chi^{2}\)分布、t分布和F分布密度的推导
前三节我们已分别介绍了\(\chi^{2}\)分布、t分布和F分布的定义、性质和应用,但是没有导出它们的分布密度,因为在推导过程中需要用到较多的数学知识,对于许多实际工作者,不一定需要花许多时间来弄清它们密度的来源,故我们把这部分内容抽出来单独辟为一节,没有兴趣的同志可以跳过此节。
一、\(\chi^{2}\)分布密度的推导
令\(Y_{1}, \cdots, Y_{n}\),独立同分布,且\(Y,\)服从标准正态分布\(N(0,1)\),由定义3.3,\(X=Y_{1}^{2}+\cdots+Y_{n}^{2} \sim \chi_{n}^{2}\)。运用例1.18中使用的典型手法,令\(h(x)\)为任一非负函数,使得\(h(X)\)为一随机变量,则\(E[h(X)]=\int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} h\left(y_{1}^{2}+\cdots+y_{n}^{2}\right)\left(\frac{1}{\sqrt{2 \pi}}\right)^{n} \cdot e^{-\frac{1}{2}\left(y_{1}^{2}+\cdots+y_{n}^{2}\right)} d y_{1} \cdots d y_{n}\)。作多维球坐标变换:
\(\begin{cases}y_{1}=r \cos \theta_{1} \\ y_{2}=r \sin \theta_{1} \cos \theta_{2} \\ y_{3}=r \sin \theta_{1} \sin \theta_{2} \cos \theta_{3} & 0 \leq r<\infty \\ \cdots \cdots & 0 \leq \theta_{i} \leq \pi, i=1, \cdots, n-2 \\ y_{n-1}=r \sin \theta_{1} \cdots \sin \theta_{n-2} \cos \theta_{n-1} & 0 \leq \theta_{n-1} \leq 2 \pi \\ y_{n}=r \sin \theta_{1} \cdots \sin \theta_{n-2} \sin \theta_{n-1} \end{cases}\)。
为了求这个变换的雅可比行列式,直接按定义计算并非是轻而易举之事。求这个行列式有三种计算方法:一种是微积分学教程第三卷第二分册(人民教育出版社,1964,第411 - 412页)介绍的方法,技巧性较高;另一种方法是对n用归纳法来求,方法简单;第三种方法是用矩阵微商的方法,把n个变元之间的雅可比行列式化为n个一元函数之雅可比的乘积(见“多元分析资料汇编”,中国科学院应用数学研究所概率统计咨询服务部,1983,第105页),鉴于本书的性质,这里不准备给出证明。变换的雅可比行列式为\(J=r^{n-1} \sin ^{n-2} \theta_{1} \sin ^{n-3} \theta_{2} \cdots \sin ^{2} \theta_{n-3} \sin \theta_{n-2} \quad(3.54)\)。
其实,我们可以避开直接求(3.54)的矛盾,由定义有\(J=\left|\begin{array}{ccc} \frac{\partial y_{1}}{\partial r} & \frac{\partial y_{1}}{\partial \theta_{1}} & \cdots & \frac{\partial y_{1}}{\partial \theta_{n-1}} \\ \vdots & \vdots & \vdots \\ \frac{\partial y_{n}}{\partial r} & \frac{\partial y_{n}}{\partial \theta_{1}} & \cdots & \frac{\partial y_{n}}{\partial \theta_{n-1}}\end{array}\right|_{+}=r^{n-1} c\),因为其中从第二列开始直至最后一列,每列均可提出一个因子r,将r提出后剩余部分仅与\(\theta_{1}, \cdots \theta_{n-1}\)有关,记成c,由此\(E[h(X)]=\int_{0}^{\infty} d r \int_{0}^{\pi} \cdots \int_{0}^{\pi} d \theta_{1} \cdots d \theta_{n-2} \int_{0}^{2 \pi} h\left(r^{2}\right)\left(\frac{1}{\sqrt{2 \pi}}\right)^{n} \cdot e^{-\frac{1}{2} r^{2}} r^{n-1} c d \theta_{n-1}=c' \int_{0}^{\infty} h\left(r^{2}\right) r^{n-1} e^{-\frac{1}{2} r^{2}} d r \quad\left(c'\right.\)为常数\()=c'' \int_{0}^{\infty} h(u) u^{\frac{n}{2}-1} e^{-\frac{1}{2} u} d u \quad\left(c''\right.\)为常数\()\),故X的分布密度为。
为了求\(c''\),应有\(c'' x^{\frac{n}{2}-1} e^{-\frac{1}{2} x}\),\(1 =c'' \int_{0}^{\infty} x^{\frac{n}{2}-1} e^{-\frac{1}{2} x} d x \quad(=c'' 2^{n / 2} \int_{0}^{\infty} y^{\frac{n}{2}-1} e^{-y} d y=c'' 2^{n / 2} \Gamma(n / 2)\),即\(c''=(2^{n / 2} \Gamma(n / 2))^{-1}\),这就证明了(3.20)式。
推导(3.20)式还可以直接用归纳法,主要利用以下几件事实:
(1)由例1.18知\(\chi^{2}\)的分布密度为\(\frac{1}{\sqrt{2 \pi}} x^{-1 / 2} e^{-x / 2}\);
(2)若随机变量X和Y独立,各有分布密度\(f_{1}(x)\)和\(f_{2}(y)\),则\(Z=X+Y\)有分布密度\(f(z)=\int_{-\infty}^{\infty} f_{1}(z-x) f_{2}(x) d x\);
(3)利用上面两个事实对n作归纳法便可导出(3.20)式,其中用到贝塔函数的简单性质。
有兴趣的读者可以去试试看,此外,在文献[22]第九章还给出了\(\chi^{2}\)分布的其它推导法。
二、t分布密度的推导
设\(X \sim N(0,1)\)与\(Y \sim \chi_{n}^{2}\)独立,则随机变量\(T=\frac{\sqrt{n} X}{\sqrt{Y}}\)的分布是具有n个自由度的t分布。由假设条件可知X和Y的联合分布密度是\(C_{n} e^{-x^{2} / 2} e^{-y / 2} y^{n / 2-1}\),其中\(C_{n}=\frac{1}{\sqrt{2 \pi} 2^{n / 2} \Gamma(n / 2)}\)。令\(h(t)\)为任一非负函数使得\(h(T)\)为一随机变量,于是\(E[h(T)]=C_{n} \int_{-\infty}^{\infty} d x \int_{0}^{\infty} h(\frac{\sqrt{n} x}{\sqrt{y}}) e^{-x^{2} / 2} e^{-y / 2} y^{n / 2-1} d y\)。
作变换\(\left\{\begin{array} { l = \sqrt { n x } / \sqrt { y } \\ y = y \end{array} \quad\right.\)或\(\left\{\begin{array}{l}x=\sqrt{y} t / \sqrt{n} \\ y=y\end{array}\right.\),则变换的雅可比行列式是\(J=\left|\begin{array}{ll} \frac{\partial x}{\partial t} & \frac{\partial x}{\partial y} \\ \frac{\partial y}{\partial t} & \frac{\partial y}{\partial y}\end{array}\right|_{+}=\left|\begin{array}{cc} \sqrt{y} / \sqrt{n} & \frac{1}{2} t y^{-1 / 2} / \sqrt{n} \\ 0 & 1 \end{array}\right|_{+}=\sqrt{y / n}\),代入得\(E[h(T)]=C_{n} \int_{-\infty}^{\infty} h(t) d t \int_{0}^{\infty} e^{-y t^{2} / 2 n} e^{-y / 2} y^{n / 2-1} \sqrt{y / n} d y\)。上式右端第二重积分是\((1 / \sqrt{n})\)乘以\(\int_{0}^{\infty} y^{(n-1) / 2} e^{-\frac{y}{2}\left(1+\frac{t^{2}}{n}\right)} d y \quad\left(\& \leftrightarrow z=\left(1+\frac{t^{2}}{n}\right) y\right)=\int_{0}^{\infty}\left(1+\frac{t^{2}}{n}\right)^{-(n-1) / 2} z^{(n-1) / 2} e^{-z / 2}\left(1+\frac{t^{2}}{n}\right)^{-1} d z=\left(1+\frac{t^{2}}{n}\right)^{-(n+1) / 2} \int_{0}^{\infty} z^{(n+1) / 2-1} e^{-z / 2} d z=\left(1+\frac{t^{2}}{n}\right)^{-(n+1) / 2} \Gamma\left(\frac{n+1}{2}\right) 2^{(n+1) / 2}\)。
上面最后一步利用了积分号内的函数是\(\chi^{2}_{n+1}\)的分布密度(差一个常数),将结果代入到(3.55)中去,得\(E[h(T)]=C_{n}\left(\frac{1}{\sqrt{n}}\right) \Gamma\left(\frac{n+1}{2}\right) 2^{(n+1) / 2} \int_{-\infty}^{\infty} h(t) \cdot\left(1+\frac{t^{2}}{n}\right)^{-(n+1) / 2} d t=\frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n \pi} \Gamma\left(\frac{n}{2}\right)} \int_{-\infty}^{\infty} h(t)\left(1+\frac{t^{2}}{n}\right)^{-(n+1) / 2} d t\),这就证明了(3,32)式。
三、F分布密度的推导
设\(X \sim \chi_{m}^{2}\)与\(Y \sim \chi_{n}^{2}\)独立,则\(F=\frac{(n / m)(X / Y)}\)的分布是自由度为m和n的F分布,由假设条件知X和Y的联合密度为\(C_{m, n} x^{\frac{m}{2}-1} y^{\frac{n}{2}-1} e^{-\frac{1}{2}(x+y)}\),其中\(C_{m, n}^{-1}=2^{(n+m) / 2} \Gamma(m / 2) \Gamma(n / 2)\)。令\(h(f)\)为任一非负函数使得\(h(F)\)为随机变量,于是\(E[h(F)]=\int_{0}^{\infty} \int_{0}^{\infty} h\left(\frac{n}{m} \frac{x}{y}\right) C_{m, n} x^{m / 2-1} y^{n / 2-1} e^{-(x+y) / 2} d x d y\)。
作变换\(\left\{\begin{array}{l}f=\frac{n}{m} \frac{x}{y} \\ y=y\end{array}\right.\)或\(\left\{\begin{array}{l}x=\frac{m}{n} f y \\ y=y\end{array}\right.\),则变换的雅可比行列式为\((m / n) y\),于是\(E[h(F)]=C_{m, n} \int_{0}^{\infty} h(f) d f \int_{0}^{\infty}\left(\frac{m}{n} f y\right)^{m / 2-1} y^{n / 2-1} \cdot e^{-\frac{y}{2}\left(1+\frac{m}{n} f\right)}\left(\frac{m}{n} y\right) d y=C_{m, n}\left(\frac{m}{n}\right)^{m / 2} \int_{0}^{\infty} h(f) f^{m / 2-1} \int_{0}^{\infty} y^{(m+n) / 2-1} \cdot e^{-\frac{y}{2}\left(1+\frac{m}{n} f\right)} d y\)。
令\(z=(1+\frac{m}{n} f) y\),上式右边第二重积分为\(\int_{0}^{\infty}\left(1+\frac{m}{n} f\right)^{-(m+n) / 2} z^{(m+n) / 2-1} e^{-z / 2} d z=\left(1+\frac{m}{n} f\right)^{-(m+n) / 2} \Gamma\left(\frac{m+n}{2}\right) 2^{(m+n) / 2}\),因此\(E[h(F)]=\frac{1}{B\left(\frac{m}{2}, \frac{n}{2}\right)}\left(\frac{m}{n}\right)^{m / 2} \int_{0}^{\infty} h(t) f^{m / 2-1} \cdot\left(1+\frac{m}{n} f\right)^{-(m+n) / 2} d f\),这就证明了(3.38)式。
标签:infty,right,frac,函数,推导,int,partial,三大,left From: https://www.cnblogs.com/redufa/p/18597489