随机变量的定义
随机变量既不随机也不是变量。它是样本集到实数的函数,即\(X:\Omega \to \R\)。在连续世界,我们还需要考虑这样的映射的“可测性”。当\(\mathcal{F}\)是\(\sigma\)-algebra时,我们称\((\Omega,\mathcal{F})\)为可测空间,此时我们称\(f\)是可测函数,当且仅当\(\forall A \in B\),\(X^{-1}(A) \in \mathcal{F}\),其中\(B\)是\(\R\)上的Borel Set(所有开区间生成的\(\sigma\)-algebra)。这样的映射\(X\)就称为随机变量。之所以要强调可测性,在于在连续空间上样本集的幂集可能是不可测的(离散自然不需要考虑),所以我们要求事件集必须能和Borel Set对应上,因为Borel Set本身是可测的。
利用定义来验证一个函数是否是随机变量(可测函数)是困难的。下面我们验证这样的一个事实:\(X\)是随机变量当且仅当\(\forall a\in \R\)集合\(\{\omega \mid X(\omega) \leq a\} \in \mathcal{F}\)恒成立。首先来理解一下这个事实究竟在表达什么。这意味着当我们说“一个随机变量是有意义的”,我们可以等价地认为我们可以取出任何一个能使随机变量小于等于某个实数的样本集合。而只要我们可以取出任何一个能使随机变量小于等于某个实数的样本集合,我们的样本集就能够与Borel Set——一个实数上的可测集——一一对应了。下面我们来证明这个事实。左推右是容易的,因为随机变量已经意味着Borel Set中所有元素都有对应的事件了。右推左:对于随机变量\(X\),我们首先构造实数域上所有能被看作事件经过\(X\)的映射后形成的实数集合,即定义\(G=\{A \subseteq \R\mid X^{-1}(A)\in\mathcal{F}\}\)。如果\(G\)能够包含Borel Set,证明就完成了。也就是我们要证明\(B \subseteq G\)。而我们发现,形如\(A=(-\infty,a]\)的区间都可以看作一列开区间的极限,即可数个开区间的并集,所以这些区间本身就被包含在Borel Set当中。由所有的\(A\)生成的\(\sigma\)-algebra本身就是Borel Set。既然已知所有这样的区间\(A\)都满足\(X^{-1}(A)\in\mathcal{F}\),也就是所有\(A\)都属于\(G\)。因此只要证明\(G\)是一个\(\sigma\)-algebra,那么就证明了\(B \subseteq G\)了。证明\(\sigma\)-algebra只需根据定义验证三条性质。空集是显然的。要证\(A \in G \Rightarrow A^C \in G\):由\(X^{-1}(A)=\{\omega \in \Omega \mid X(w)\in A\} \in \mathcal{F}\),可知\(X^{-1}(A^C)=\{\omega \in \Omega \mid X(\omega) \in A^C\}\)\(=(X^{-1}(A))^C\),因为\(X^{-1}(A)\in \mathcal{F}\)而\(\mathcal{F}\)是\(\sigma\)-algebra,因此\(X^{-1}(A^C) \in \mathcal{F}\)。可数并同理,要证\(A_1,A_2, \cdots \in G \Rightarrow \bigcup\limits_{n \geq 1}A_n \in G\),由\(X^{-1}\left(\bigcup\limits_{n \geq 1}A_n\right)\)\(=\{\omega \mid X(\omega)\in \bigcup\limits_{n\geq 1}A_n\}=\bigcup\limits_{n\geq 1}\{\omega\mid X(\omega)\in A_n\}=\bigcup\limits_{n \geq 1}X^{-1}(A_n)\),因此\(X^{-1}(A_n) \in \mathcal{F} \Rightarrow X^{-1}\left(\bigcup\limits_{n \geq 1}A_n\right) \in \mathcal{F}\)。
累积分布函数(CDF)
由此可见,只要确定了随机变量在所有\((-\infty,a]\)上的取值,Borel Set上任意元素上随机变量的取值也随之确定。所以我们可以用“累积分布函数”来定义随机变量,也即我们只需定义随机变量在所有\((-\infty,a]\)上的取值:\(F_X(a)=P(X \leq a)\)。我们容易发现累积分布函数具有一些性质,例如值域必定属于\([0,1]\),必然单调,一定有负无穷处极限为0,正无穷处极限为1。累积分布函数不一定是连续的,以骰子为例我们就得到一个分段的函数。但我们证明累积分布函数一定是右连续的:这种不对称性正是来自我们在定义随机变量时区间是右闭的,因此从右向左逼近时取值连续,从左到右逼近时就取不到端点了。由此也可见左极限一定存在,只是不一定等于右极限(也即都是第一类间断点)。另外,单调函数的间断点一定只有可数个,因此累积分布函数的间断点也一定只有可数个。
所以容易发现\(P(X = a)\)应当等于\(P(X \leq a)-P(X < a)=F_X(a)-\lim\limits_{k \to a}F_X(k)\),也即随机变量等于某个值的概率等于CDF上该点的值减去其左极限:\(P(X=a)=F_X(a)-F_X(a^-)\)。随机变量取某个值的概率不为0时,累积分布函数一定间断。连续的累积分布函数的随机变量在每个值上概率都为0。类似的,\(F_X(b)-F_X(a)=P(X \in (a,b])\),\(P(X > a)=1-F_X(a)\),等等。
最后我们指出,如果一个函数满足①值域属于\([0,1]\);②单调递增;③负无穷处极限为0,正无穷处极限为1;④处处右连续;那么一定存在一个由它作为累积分布函数确定的随机变量。
标签:Set,函数,omega,Borel,mathcal,随机变量 From: https://www.cnblogs.com/qixingzhi/p/17724486.html