文章目录
随机变量的概念
随机事件数量化
- 好处:可以用数学分析的方法来研究随机现象
- 关键:寻找一个实值单值函数 X X X,其定义域是样本空间 Ω \Omega Ω
随机变量
- 设 Ω \Omega Ω是随机试验 E E E的样本空间,若 ∀ ω ∈ Ω \forall \omega \in \Omega ∀ω∈Ω,有唯一的实数值 X ( ω ) X(\omega) X(ω)与之对应,则称 X ( ω ) X(\omega) X(ω)为随机变量,简记为 X X X
- 对任意事件 A A A,可以在样本空间 Ω \Omega Ω上定义函数
X A ( ω ) = { 1 , 当 ω ∈ A 0 , 当 ω ∉ A \Chi_{A}(\omega) = \begin{cases} 1, & 当 \omega \in A \\ 0, & 当 \omega \notin A \end{cases} XA(ω)={1,0,当ω∈A当ω∈/A
- 称 X A ( ω ) \Chi_{A}(\omega) XA(ω)为 A A A的示性函数,显然, X A \Chi_{A} XA是一个随机变量,而“ X A = 1 \Chi_{A} = 1 XA=1”表示事件 A A A发生了,“ X A = 0 \Chi_{A} = 0 XA=0”表示事件 A A A未发生
离散型随机变量及其概率分布
随机变量的分类
- 将随机变量按其可能取值的性质区分为离散型随机变量与非离散型随机变量
- 非离散型又包括连续型和其他类型
离散型随机变量
- 称可能取值是有限个或可列无穷多个的随机变量为离散型随机变量
- 称 P { X = x k } = p k , k = 1 , 2 , ⋯ P\set{X = x_{k}} = p_{k} , k = 1, 2, \cdots P{X=xk}=pk,k=1,2,⋯为离散型随机变量 X X X的概率分布或分布律,分布律也可写成
( x 1 x 2 ⋯ x n ⋯ p 1 p 2 ⋯ p n ⋯ ) \left( \begin{matrix} x_{1} & x_{2} & \cdots & x_{n} & \cdots \\ p_{1} & p_{2} & \cdots & p_{n} & \cdots \end{matrix} \right) (x1p1x2p2⋯⋯xnpn⋯⋯)
X x 1 x 2 ⋯ x n ⋯ P p 1 p 2 ⋯ p n ⋯ \begin{array}{c | c c c c c} X & x_{1} & x_{2} & \cdots & x_{n} & \cdots \\ \hline P & p_{1} & p_{2} & \cdots & p_{n} & \cdots \end{array} XPx1p1x2p2⋯⋯xnpn⋯⋯
离散型随机变量的常见分布
两点分布
- 若随机变量 X X X只可能取 0 0 0和 1 1 1两个值,它的分布律为
X 0 1 P 1 − p p \begin{array}{c | c c} X & 0 & 1 \\ \hline P & 1 - p & p \end{array} XP01−p1p
- 或 P { X = k } = p k ( 1 − p ) 1 − k ( k = 0 , 1 , 0 < p < 1 ) P\set{X = k} = p^{k} (1 - p)^{1 - k} (k = 0, 1 , 0 < p < 1) P{X=k}=pk(1−p)1−k(k=0,1,0<p<1)则称 X X X服从两点分布或 0 − 1 0-1 0−1分布,记为 X ∼ B ( 1 , p ) X \sim B(1, p) X∼B(1,p)
二项分布
- 若随机变量 X X X的分布律为 P { X = k } = C n k p k ( 1 − p ) n − k ( k = 0 , 1 , 2 , ⋯ , n , 0 < p < 1 ) P\set{X = k} = C_{n}^{k} p^{k} (1 - p)^{n - k} (k = 0, 1, 2, \cdots, n , 0 < p < 1) P{X=k}=Cnkpk(1−p)n−k(k=0,1,2,⋯,n,0<p<1),则称 X X X服从二项分布,记为 X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p), n = 1 n = 1 n=1时的二项分布即为两点分布
- 设随机变量 X ∼ B ( n , p ) X \sim B(n, p) X∼B(n,p),若 P { X = k } P\set{X = k} P{X=k}在 X = m X = m X=m处取得最大值,则称 P { X = m } P\set{X = m} P{X=m}为二项分布的中心项, m m m称为最可能成功次数,对于给定的 n n n及 p p p,可以证明 m = [ ( n + 1 ) p ] m = [(n + 1) p] m=[(n+1)p],若 ( n + 1 ) p (n + 1) p (n+1)p为正整数,则 m = ( n + 1 ) p m = (n + 1) p m=(n+1)p及 m = ( n + 1 ) p − 1 m = (n + 1) p - 1 m=(n+1)p−1均为最可能成功次数
泊松分布
泊松定理
- 设随机变量 X n ( n = 1 , 2 , ⋯ ) X_{n} (n = 1, 2, \cdots) Xn(n=1,2,⋯)服从二项分布,设 λ > 0 \lambda > 0 λ>0是一常数, lim n → ∞ n p n = λ \lim\limits_{n \rightarrow \infty}{n p_{n}} = \lambda n→∞limnpn=λ,则对任意固定的 k k k,有 lim n → ∞ C n k p n k ( 1 − p n ) n − k = λ k k ! e − λ \lim\limits_{n \rightarrow \infty}{C_{n}^{k} p_{n}^{k} (1 - p_{n})^{n - k}} = \frac{\lambda^{k}}{k!} e^{- \lambda} n→∞limCnkpnk(1−pn)n−k=k!λke−λ
证明
- C n k p n k ( 1 − p n ) n − k = n ( n − 1 ) ⋯ ( n − k + 1 ) k ! ⋅ ( λ n ) k ( 1 − λ n ) n − k = λ k k ! ( 1 − 1 n ) ( 1 − 2 n ) ⋯ ( 1 − k − 1 n ) ( 1 − λ n ) n − k C_{n}^{k} p_{n}^{k} (1 - p_{n})^{n - k} = \frac{n (n - 1) \cdots (n - k + 1)}{k!} \cdot (\frac{\lambda}{n})^{k} (1 - \frac{\lambda}{n})^{n - k} = \frac{\lambda^{k}}{k!} (1 - \frac{1}{n}) (1 - \frac{2}{n}) \cdots (1 - \frac{k - 1}{n}) (1 - \frac{\lambda}{n})^{n - k} Cnkpnk(1−pn)n−k=k!n(n−1)⋯(n−k+1)⋅(nλ)k(1−nλ)n−k=k!λk(1−n1)(1−n2)⋯(1−nk−1)(1−nλ)n−k
- 而 lim n → ∞ ( 1 − λ n ) n − k = e − λ \lim\limits_{n \rightarrow \infty}{(1 - \frac{\lambda}{n})^{n - k}} = e^{- \lambda} n→∞lim(1−nλ)n−k=e−λ,因此 lim n → ∞ C n k p n k ( 1 − p n ) n − k = λ k k ! e − λ \lim\limits_{n \rightarrow \infty}{C_{n}^{k} p_{n}^{k} (1 - p_{n})^{n - k}} = \frac{\lambda^{k}}{k!} e^{- \lambda} n→∞limCnkpnk(1−pn)n−k=k!λke−λ
泊松分布
-
若随机变量 X X X的分布律为 P { X = k } = λ k k ! e − λ , λ > 0 , k = 0 , 1 , 2 , ⋯ P\set{X = k} = \frac{\lambda^{k}}{k!} e^{- \lambda} , \lambda > 0 , k = 0, 1, 2, \cdots P{X=k}=k!λke−λ,λ>0,k=0,1,2,⋯,则称 X X X服从参数为 λ \lambda λ的泊松分布,记为 X ∼ P ( λ ) X \sim P(\lambda) X∼P(λ)
-
∑ k = 0 ∞ P { X = k } = ∑ k = 0 ∞ λ k k ! e − λ = e − λ ∑ k = 0 ∞ λ k k ! = e − λ ⋅ e λ = 1 \sum\limits_{k = 0}^{\infty}{P\set{X = k}} = \sum\limits_{k = 0}^{\infty}{\frac{\lambda^{k}}{k!} e^{- \lambda}} = e^{- \lambda} \sum\limits_{k = 0}^{\infty}{\frac{\lambda^{k}}{k!}} = e^{- \lambda} · e^{\lambda} = 1 k=0∑∞P{X=k}=k=0∑∞k!λke−λ=e−λk=0∑∞k!λk=e−λ⋅eλ=1
-
当 n n n很大, p p p很小时,二项分布 B ( n , p ) B(n, p) B(n,p)近似于泊松分布 P ( λ ) P(\lambda) P(λ),即 C n k p k ( 1 − p ) n − k ≈ λ k k ! e − λ C_{n}^{k} p^{k} (1 - p)^{n - k} \approx \frac{\lambda^{k}}{k!} e^{- \lambda} Cnkpk(1−p)n−k≈k!λke−λ
超几何分布
-
设有 N N N件产品,其中有 M M M件次品,现从中不放回地任取 n n n件,则在这 n n n件中所含的次品数 X X X是一个随机变量,求 X X X的分布律
-
若 n ≤ M n \leq M n≤M,则 X X X可能取 0 0 0, 1 1 1, 2 2 2, ⋯ \cdots ⋯, n n n,若 n > M n > M n>M,则 X X X可能取 0 0 0, 1 1 1, 2 2 2, ⋯ \cdots ⋯, M M M
-
由古典概型得 P { X = k } = C M k C N − M n − k C N n , k = 0 , 1 , 2 , ⋯ , l P\set{X = k} = \frac{C_{M}^{k} C_{N - M}^{n - k}}{C_{N}^{n}} , k = 0, 1, 2, \cdots, l P{X=k}=CNnCMkCN−Mn−k,k=0,1,2,⋯,l,其中 l = min { M , n } l = \min\set{M, n} l=min{M,n}
-
若随机变量 X X X的概率分布为 P { X = k } = C M k C N − M n − k C N n , k = 0 , 1 , 2 , ⋯ , l , l = min { M , n } P\set{X = k} = \frac{C_{M}^{k} C_{N - M}^{n - k}}{C_{N}^{n}} , k = 0, 1, 2, \cdots, l , l = \min\set{M, n} P{X=k}=CNnCMkCN−Mn−k,k=0,1,2,⋯,l,l=min{M,n},则称 X X X服从超几何分布,记为 X ∼ h ( n , N , M ) X \sim h(n, N, M) X∼h(n,N,M)
几何分布
-
若随机变量 X X X的分布律为 P { X = k } = ( 1 − p ) k − 1 p ( 0 < p < 1 , k = 1 , 2 , ⋯ ) P\set{X = k} = (1 - p)^{k - 1} p (0 < p < 1 , k = 1, 2, \cdots) P{X=k}=(1−p)k−1p(0<p<1,k=1,2,⋯),则称 X X X服从几何分布,记为 X ∼ G ( p ) X \sim G(p) X∼G(p)
-
一般地,在伯努利试验中,事件 A A A首次发生在第 k k k次的概率为 ( 1 − p ) k − 1 p , k = 1 , 2 , ⋯ (1 - p)^{k - 1} p , k = 1, 2, \cdots (1−p)k−1p,k=1,2,⋯,通常称 k k k为事件 A A A的首发生次数
连续型随机变量及其概率分布
连续型随机变量
-
设随机变量 X X X,如果存在非负可积函数 f ( x ) ( − ∞ < x < + ∞ ) f(x) (- \infty < x < + \infty) f(x)(−∞<x<+∞),使得对任意实数 a ≤ b a \leq b a≤b,有 P { a ≤ X ≤ b } = ∫ a b f ( x ) d x P\set{a \leq X \leq b} = \int_{a}^{b}{f(x) dx} P{a≤X≤b}=∫abf(x)dx,则称 X X X为连续型随机变量,称 f ( x ) f(x) f(x)为 X X X的概率密度函数,简称概率密度或密度
-
若 x x x是 f ( x ) f(x) f(x)的连续点,则对 Δ x > 0 \Delta{x} > 0 Δx>0, lim Δ x → 0 P { x ≤ X ≤ x + Δ x } Δ x = lim Δ x → 0 ∫ x x + Δ x f ( t ) d t Δ x = f ( x ) \lim\limits_{\Delta{x} \rightarrow 0}{\frac{P\set{x \leq X \leq x + \Delta{x}}}{\Delta{x}}} = \lim\limits_{\Delta{x} \rightarrow 0}{\frac{\int_{x}^{x + \Delta{x}}{f(t) dt}}{\Delta{x}}} = f(x) Δx→0limΔxP{x≤X≤x+Δx}=Δx→0limΔx∫xx+Δxf(t)dt=f(x),故 X X X的密度 f ( x ) f(x) f(x)在 x x x这一点的值,恰好是 X X X落在区间 [ x , x + Δ x ] [x, x + \Delta{x}] [x,x+Δx]上的概率与区间长度 Δ x \Delta{x} Δx之比的极限,可见,若不计高阶无穷小,有 P { x ≤ X ≤ x + Δ x } ≈ f ( x ) Δ x P\set{x \leq X \leq x + \Delta{x}} \approx f(x) \Delta{x} P{x≤X≤x+Δx}≈f(x)Δx,这表示 X X X落在充分小区间 [ x , x + Δ x ] [x, x + \Delta{x}] [x,x+Δx]上的概率近似地等于 f ( x ) Δ x f(x) \Delta{x} f(x)Δx
-
连续型随机变量取任一指定值的概率是 0 0 0
-
对连续型随机变量 X X X,有 P { a < X ≤ b } = P { a ≤ X ≤ b } = P { a < X < b } = P { a ≤ X < b } P\set{a < X \leq b} = P\set{a \leq X \leq b} = P\set{a < X < b} = P\set{a \leq X < b} P{a<X≤b}=P{a≤X≤b}=P{a<X<b}=P{a≤X<b},即是说,当计算连续型随机变量落在某一区间的概率时,无需考虑区间是否包含端点
零概率事件
- 在概率论中,概率为零的事件称为零概率事件,它与不可能事件是有区别的,不可能事件是零概率事件,但零概率事件并不都是不可能事件
- 事件“ X = a X = a X=a”是零概率事件,但连续型随机变量取任何一点都有可能发生
几乎必然发生的事件
- 一个事件的概率等于 1 1 1,这事件也未必是必然事件,把概率为 1 1 1的事件称为几乎必然发生的事件
连续型随机变量的常见分布
均匀分布
- 设连续型随机变量 X X X在有限区间 [ a , b ] [a, b] [a,b]内取值,且其概率密度为
f ( x ) = { 1 b − a , a ≤ x ≤ b 0 , 其他 f(x) = \begin{cases} \cfrac{1}{b - a} & , a \leq x \leq b \\ 0 & , 其他 \end{cases} f(x)=⎩ ⎨ ⎧b−a10,a≤x≤b,其他
- 则称 X X X在 [ a , b ] [a, b] [a,b]上服从均匀分布,记为 X ∼ U [ a , b ] X \sim U[a, b] X∼U[a,b]
- 均匀分布在实际问题中是常见的,比如,若某汽车站的汽车每 5 5 5分钟一趟,设 X X X为乘客的候车时间,则 X ∼ U [ 0 , 5 ] X \sim U[0, 5] X∼U[0,5]
指数分布
- 若随机变量 X X X具有概率密度
f ( x ) = { λ e − λ x , x ≥ 0 0 , x < 0 f(x) = \begin{cases} \lambda e^{- \lambda x} & , x \geq 0 \\ 0 & , x < 0 \end{cases} f(x)={λe−λx0,x≥0,x<0
- 其中 λ > 0 \lambda > 0 λ>0为常数,则称 X X X服从参数为 λ \lambda λ的指数分布,记为 X ∼ E ( λ ) X \sim E(\lambda) X∼E(λ)
正态分布
-
若随机变量 X X X的概率密度为 f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ f(x) = \frac{1}{\sqrt{2 \pi} \sigma} e^{- \frac{(x - \mu)^{2}}{2 \sigma^{2}}} , - \infty < x < + \infty f(x)=2π σ1e−2σ2(x−μ)2,−∞<x<+∞,其中 μ \mu μ, σ \sigma σ为常数,且 σ > 0 \sigma > 0 σ>0,则称 X X X服从参数为 μ \mu μ和 σ 2 \sigma^{2} σ2的正态分布或高斯分布,记为 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^{2}) X∼N(μ,σ2)
-
正态分布的概率密度曲线 y = f ( x ) y = f(x) y=f(x)是一条关于 x = μ x = \mu x=μ对称的曲线, x = μ ± σ x = \mu \pm \sigma x=μ±σ为其两个拐点的横坐标
-
特别地,当 μ = 0 \mu = 0 μ=0, σ = 1 \sigma = 1 σ=1时称 X X X服从标准正态分布,即 X ∼ N ( 0 , 1 ) X \sim N(0, 1) X∼N(0,1)
-
对标准正态分布,概率密度用 φ ( x ) \varphi(x) φ(x)表示 φ ( x ) = 1 2 π e − x 2 2 , − ∞ < x < + ∞ \varphi(x) = \frac{1}{\sqrt{2 \pi}} e^{- \frac{x^{2}}{2}} , - \infty < x < + \infty φ(x)=2π 1e−2x2,−∞<x<+∞
标签:set,frac,lim,cdots,数理统计,数学,概率论,随机变量,lambda From: https://blog.csdn.net/from__2025_01_01/article/details/145021563