首页 > 其他分享 >Neyman因子分解定理

Neyman因子分解定理

时间:2024-10-28 23:16:10浏览次数:6  
标签:xn 定理 cdots y1 因子 x2 theta x1 Neyman

内容来源
数理统计学导论(原书第7版) 机械工业出版社


因为要计算统计量的 p d f pdf pdf ,一般情况下,用定义直接验证一个统计量的充分性是困难的。

幸运的是,有一个判别充分统计量的充要条件: N e y m a n Neyman Neyman 因子分解定理

定理

设 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1​,X2​,⋯,Xn​ 是来自分布 f ( x ; θ ) f(x;\theta) f(x;θ) 的随机样本

统计量 Y 1 = u 1 ( X 1 , X 2 , ⋯   , X n ) Y_1=u_1(X_1,X_2,\cdots,X_n) Y1​=u1​(X1​,X2​,⋯,Xn​) 是 θ \theta θ 的一个充分统计量的充要条件为:

存在两个非负函数 k 1 , k 2 k_1,k_2 k1​,k2​ ,使得

f ( x 1 , x 2 , ⋯   , x n ; θ ) = k 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] k 2 ( x 1 , x 2 , ⋯   , x n ) f(x_1,x_2,\cdots,x_n;\theta)=k_1[u_1(x_1,x_2,\cdots,x_n);\theta] k_2(x_1,x_2,\cdots,x_n) f(x1​,x2​,⋯,xn​;θ)=k1​[u1​(x1​,x2​,⋯,xn​);θ]k2​(x1​,x2​,⋯,xn​)

其中 k 2 k_2 k2​ 不依赖于 θ \theta θ

证明

假定因子分解成立

做一一变换

y 1 = u 1 ( x 1 , x 2 , ⋯   , x n ) y 2 = u 2 ( x 1 , x 2 , ⋯   , x n ) ⋮ y n = u n ( x 1 , x 2 , ⋯   , x n ) y_1=u_1(x_1,x_2,\cdots,x_n)\\ y_2=u_2(x_1,x_2,\cdots,x_n)\\ \vdots\\ y_n=u_n(x_1,x_2,\cdots,x_n)\\ y1​=u1​(x1​,x2​,⋯,xn​)y2​=u2​(x1​,x2​,⋯,xn​)⋮yn​=un​(x1​,x2​,⋯,xn​)

它们的逆函数为

x 1 = w 1 ( y 1 , y 2 , ⋯   , y n ) x 2 = w 2 ( y 1 , y 2 , ⋯   , y n ) ⋮ x 3 = w 3 ( y 1 , y 2 , ⋯   , y n ) x_1=w_1(y_1,y_2,\cdots,y_n)\\ x_2=w_2(y_1,y_2,\cdots,y_n)\\ \vdots\\ x_3=w_3(y_1,y_2,\cdots,y_n)\\ x1​=w1​(y1​,y2​,⋯,yn​)x2​=w2​(y1​,y2​,⋯,yn​)⋮x3​=w3​(y1​,y2​,⋯,yn​)

对应的雅可比行列式为 J J J

这个一一变换的作用跟画辅助线差不多,没什么特殊要求,怎么简单就怎么构造

于是,统计量 Y 1 , Y 2 , ⋯   , Y n Y_1,Y_2,\cdots,Y_n Y1​,Y2​,⋯,Yn​ 的 p d f pdf pdf 为

g ( y 1 , y 2 , ⋯   , y n ; θ ) = f ( w 1 , w 2 , ⋯   , w n ; θ ) ∣ J ∣ = k 1 ( y 1 ; θ ) k 2 ( w 1 , w 2 , ⋯   , w n ) ∣ J ∣ \begin{align*} g(y_1,y_2,\cdots,y_n;\theta)&=f(w_1,w_2,\cdots,w_n;\theta)|J|\\ &=k_1(y_1;\theta)k_2(w_1,w_2,\cdots,w_n)|J| \end{align*} g(y1​,y2​,⋯,yn​;θ)​=f(w1​,w2​,⋯,wn​;θ)∣J∣=k1​(y1​;θ)k2​(w1​,w2​,⋯,wn​)∣J∣​

那么

f Y 1 ( y 1 ; θ ) = ∫ ⋯ ∫ g ( y 1 , y 2 , ⋯   , y n ; θ ) d y 2 ⋯ d y n = k 1 ( y 1 ; θ ) ∫ ⋯ ∫ ∣ J ∣ k 2 ( w 1 , w 2 , ⋯   , w n ) d y 2 ⋯ d y n \begin{align*} f_{Y_1}(y_1;\theta)&=\int\cdots\int g(y_1,y_2,\cdots,y_n;\theta) \mathrm{d}y_2\cdots\mathrm{d}y_n\\ &=k_1(y_1;\theta)\int\cdots\int|J|k_2(w_1,w_2,\cdots,w_n) \mathrm{d}y_2\cdots\mathrm{d}y_n \end{align*} fY1​​(y1​;θ)​=∫⋯∫g(y1​,y2​,⋯,yn​;θ)dy2​⋯dyn​=k1​(y1​;θ)∫⋯∫∣J∣k2​(w1​,w2​,⋯,wn​)dy2​⋯dyn​​

上式中的积分不是不定积分,积分区域应该是 y 2 y_2 y2​ 到 y n y_n yn​ 各自的定义域,不知道怎么表示就在这里提一下

上式右端, k 2 k_2 k2​ 不依赖于 θ \theta θ ,雅可比行列式 J J J 和积分也不涉及 θ \theta θ 。因此,上式右端的 n − 1 n-1 n−1 重积分仅仅是 y 1 y_1 y1​ 的函数,表示为 m ( y 1 ) m(y_1) m(y1​) 。而且是非负的

那么

f Y 1 ( y 1 ; θ ) = k 1 ( y 1 ; θ ) m ( y 1 ) f_{Y_1}(y_1;\theta)=k_1(y_1;\theta)m(y_1) fY1​​(y1​;θ)=k1​(y1​;θ)m(y1​)

若 m ( y 1 ) = 0 m(y_1)=0 m(y1​)=0 ,则 f Y 1 ( y 1 ; θ ) = 0 f_{Y_1}(y_1;\theta)=0 fY1​​(y1​;θ)=0

若 m ( y 1 ) > 0 m(y_1)>0 m(y1​)>0 ,则

k 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] = f Y 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] m [ u 1 ( x 1 , x 2 , ⋯   , x n ) ] k_1[u_1(x_1,x_2,\cdots,x_n);\theta]=\frac {f_{Y_1}[u_1(x_1,x_2,\cdots,x_n);\theta]} {m[u_1(x_1,x_2,\cdots,x_n)]} k1​[u1​(x1​,x2​,⋯,xn​);θ]=m[u1​(x1​,x2​,⋯,xn​)]fY1​​[u1​(x1​,x2​,⋯,xn​);θ]​

将 k 1 k_1 k1​ 带入因子分解中,得

f ( x 1 , x 2 , ⋯   , x n ; θ ) = f Y 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] m [ u 1 ( x 1 , x 2 , ⋯   , x n ) ] k 2 ( x 1 , x 2 , ⋯   , x n ) f(x_1,x_2,\cdots,x_n;\theta)=\frac {f_{Y_1}[u_1(x_1,x_2,\cdots,x_n);\theta]} {m[u_1(x_1,x_2,\cdots,x_n)]}k_2(x_1,x_2,\cdots,x_n) f(x1​,x2​,⋯,xn​;θ)=m[u1​(x1​,x2​,⋯,xn​)]fY1​​[u1​(x1​,x2​,⋯,xn​);θ]​k2​(x1​,x2​,⋯,xn​)

f ( x 1 , x 2 , ⋯   , x n ; θ ) f Y 1 [ u 1 ( x 1 , x 2 , ⋯   , x n ) ; θ ] = m [ u 1 ( x 1 , x 2 , ⋯   , x n ) ] k 2 ( x 1 , x 2 , ⋯   , x n ) \frac{f(x_1,x_2,\cdots,x_n;\theta)} {f_{Y_1}[u_1(x_1,x_2,\cdots,x_n);\theta]}= \frac{m[u_1(x_1,x_2,\cdots,x_n)]}{k_2(x_1,x_2,\cdots,x_n)} fY1​​[u1​(x1​,x2​,⋯,xn​);θ]f(x1​,x2​,⋯,xn​;θ)​=k2​(x1​,x2​,⋯,xn​)m[u1​(x1​,x2​,⋯,xn​)]​

根据定义, Y 1 Y_1 Y1​ 是参数 θ \theta θ 的充分统计量

反之,如果 Y 1 Y_1 Y1​ 是 θ \theta θ 的一个充分统计量,那么通过将函数 k 1 k_1 k1​ 取成 Y 1 Y_1 Y1​ 的 p d f pdf pdf ,即可实现因子分解。这就完成了定理证明。

设 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1​,X2​,⋯,Xn​ 表示来自分布 N ( θ , σ 2 ) N(\theta,\sigma^2) N(θ,σ2) 的随机样本,方差 σ 2 \sigma^2 σ2 已知

如果 x ‾ = 1 n ∑ x i \overline{x}=\frac{1}{n}\sum x_i x=n1​∑xi​ ,那么

∑ ( x i − θ ) 2 = ∑ [ ( x i − x ‾ ) − ( x ‾ − θ ) ] 2 = ∑ ( x i − x ‾ ) 2 + n ( x ‾ − θ ) 2 \sum(x_i-\theta)^2=\sum[(x_i-\overline{x})-(\overline{x}-\theta)]^2= \sum(x_i-\overline{x})^2+n(\overline{x}-\theta)^2 ∑(xi​−θ)2=∑[(xi​−x)−(x−θ)]2=∑(xi​−x)2+n(x−θ)2

因为

2 ∑ ( x i − x ‾ ) ( x ‾ − θ ) = 2 ( x ‾ − θ ) ∑ ( x i − x ‾ ) = 0 2\sum(x_i-\overline{x})(\overline{x}-\theta)= 2(\overline{x}-\theta)\sum(x_i-\overline{x})=0 2∑(xi​−x)(x−θ)=2(x−θ)∑(xi​−x)=0

所以, X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1​,X2​,⋯,Xn​ 的联合 p d f pdf pdf 就可以写成

( σ 2 π ) − n exp ⁡ [ − ∑ ( x i − θ ) 2 / 2 σ 2 ] = ( σ 2 π ) − n exp ⁡ [ − n ( x ‾ − θ ) 2 / 2 σ 2 ] exp ⁡ [ − ∑ ( x i − x ‾ ) 2 / 2 σ 2 ] \begin{align*} &(\sigma\sqrt{2\pi})^{-n}\exp\left[-\sum(x_i-\theta)^2/2\sigma^2\right]\\ &=(\sigma\sqrt{2\pi})^{-n}\exp[-n(\overline{x}-\theta)^2/2\sigma^2] \exp\left[-\sum(x_i-\overline{x})^2/2\sigma^2\right] \end{align*} ​(σ2π ​)−nexp[−∑(xi​−θ)2/2σ2]=(σ2π ​)−nexp[−n(x−θ)2/2σ2]exp[−∑(xi​−x)2/2σ2]​

其中

k 1 = exp ⁡ [ − n ( x ‾ − θ ) 2 / 2 σ 2 ] , k 2 = ( σ 2 π ) − n exp ⁡ [ − ∑ ( x i − x ‾ ) 2 / 2 σ 2 ] k_1=\exp[-n(\overline{x}-\theta)^2/2\sigma^2], k_2=(\sigma\sqrt{2\pi})^{-n}\exp\left[-\sum(x_i-\overline{x})^2/2\sigma^2\right] k1​=exp[−n(x−θ)2/2σ2],k2​=(σ2π ​)−nexp[−∑(xi​−x)2/2σ2]

所以,样本均值是正态分布的均值的充分统计量

标签:xn,定理,cdots,y1,因子,x2,theta,x1,Neyman
From: https://blog.csdn.net/HEHEE1029/article/details/143299489

相关文章

  • 散列表:哈希表的装载因子对散列冲突有什么影响?
    散列表:哈希表的装载因子对散列冲突有什么影响?哈希表的装载因子对散列冲突有着重要的影响。一、装载因子的定义装载因子是哈希表中已存储的元素个数与哈希表大小的比值。例如,如果一个哈希表中有10个元素,哈希表的大小为20,那么装载因子就是10/20=0.5。二、对散列冲突......
  • 基于遗传算法的智能天线最佳阵列因子计算matlab仿真
    1.课题概述      基于遗传算法的智能天线最佳阵列因子计算。智能天线技术利用自适应阵列处理技术改善无线通信系统的性能,尤其是提高接收信号质量、抑制干扰和增强定位能力。在智能天线的设计中,阵列因子(也称加权向量或波束形成向量)的选择至关重要,它直接影响了阵列的方向性......
  • 基于贝叶斯优化卷积神经网络(Bayes-CNN)的多因子数据分类识别算法matlab仿真
    1.算法运行效果图预览(完整程序运行后无水印) 贝叶斯优化过程  贝叶斯优化后的CNN训练和识别结果 标准的CNN的识别结果 2.算法运行软件版本matlab2022a 3.部分核心程序(完整版代码包含详细中文注释和操作步骤视频)%使用贝叶斯优化算法确定最优的批......
  • 卢卡斯定理学习笔记
    卢卡斯定理对于非负整数\(a\),\(b\)和质数\(p\),有\[C_{a}^{b}\equivC_{a~mod~p}^{b~mod~p}\cdotC_{\lfloor{a/p}\rfloor}^{\lfloor{b/p}\rfloor}~~\left({mod~p}\right)\]证明引理\[\left({1+x}\right)^{p^{\alpha}}\equiv1+x^{p^{\alpha}}~~\left(......
  • SPSS、R 语言因子分析FA、主成分分析PCA对居民消费结构数据可视化分析
    全文链接:https://tecdat.cn/?p=37952原文出处:拓端数据部落公众号分析师:TingMei 在经济发展的大背景下,居民消费结构至关重要。本文围绕居民消费结构展开深入研究,运用SPSS25.0和R语言,以因子分析法和主成分分析法对东北三省居民消费价格指数及全国城镇居民消费性支出指标进......
  • Dilworth 定理与二分图部分理论
    给定一个DAG,定义链:一条链内任意两点之间都存在一条路径反链:任意两点都不存在路径Dilworth定理:最长反链\(=\)最小链覆盖。最小链覆盖内一个点只能归属于一条链,但链不一定是连续的。事实上这个还能转化为“选出若干条(一般定义下的)链,但一个点可以在多条链内”,本质相同。......
  • 鞅与停时定理
    鞅与停时定理呆猫不会数学,要证明也是直接抄别人的,不如直接放一篇(详细证明及介绍主要写点,对鞅与停时定理的理解定理与势能函数对于一个随机过程\(\{X_0,X_1,...,X_t\}\),其中\(X_t\)是终止状态,对于构造出的函数,设为\(\varphi(X_i)\),有以下要求:\(E(\varphi(X_{i+1})-\varphi(X......
  • 质数判断、质因子分解、质数筛
    质数判断、质因子分解、质数筛判断质数常规方法时间复杂度O(根号n)boolisPrime(longn){if(n<=1)returnfalse;longsq=sqrt(n);for(inti=2;i<=sq;++i)if(n%i==0)returnfalse;returntrue;}U148828素......
  • 模板-质因子分解
    版本1:求n的所有质因子,时间复杂度O(sqrt(n))。//例如:12=2*2*3,那么//factor(12,1)=>{2,3}//factor(12,0)=>{2,2,3}std::vector<int>factor(intn,intremoveDup){std::vector<int>ans;for(inti=2;i<=n/i;i++){while(n%i......
  • Transformer 的缩放因子为什么需要开平方根
    目录一、防止过大的注意力分数导致softmax函数饱和二、维度校正三、保持方差稳定在Transformer模型中,缩放因子(scalingfactor)特别设计用于调整注意力分数(attentionscores),它通常是键向量维度的平方根。这一做法主要是出于以下几个原因:一、防止过大的注意力分数导致......