一般数学表示方法
-
概率数学表示方法
\(\large \begin{array}{rl} \\ \bm{X}:& 符合某种概率分布的Random\ Variable(随机变量) \\ \bm{x}:& \bm{rnorm}, 随机变量X的一个实例, , … \\ \bm{f}:& \bm{pdf}, \bm{dnorm}, \text{Probability Distribution Function}\ of\ \text{Random Variable }X, … \\ \bm{F}:& \bm{cdf}, \bm{pnorm}, \text{Cumulative Density Function}\ of\ \text{Random Variable }X, … \\ \bm{P(X=k)}:& \bm{pmd}, \text{Probability Mass Distribution} \\ \end{array}\)
-
常用概率分布
-
Discrete(离散概率分布)
- Discrete Uniform(离散均匀分布)
- Bernoulli(伯努利分布)
- Binomial(二项式分布)
- Poisson(泊松分布)
- Hypergeometric(超几何分布)
- Continuous(连续概率分布)
- Uniform(均匀分布)
- Normal/Gaussian(正态分布)
- Exponential(指数分布)
- Gamma分布
- Beta分布
- Gumbel分布
-
离散概率分布
Discrete Uniform(离散均匀分布)
-
Definition:每次抽样存在多种可能结果,每种结果出现的概率完全一致.
即 X的 Sample Space 为 a finite set \(\large S=\{k_1, k_2, \cdots, k_n\}\),
且 $\large \ P(X=k_i)=\dfrac{1}{n}, \ \forall \ i\ \in [1,\ n], \ i \in N $ -
Example:
- Roll a die(掷骰子):
- Sample Space is a finite set: \(\large S=\{1, 2, \cdots, 6\}\)
- ELO(Equally Likely Outcomes): $P(X=i) = \dfrac{1}{6}, \ \forall i \in {1, 2, \cdots, 6} $
- Roll a die(掷骰子):
-
R代码:
>>> x <- sample(c(1,2,6,8,9), 10000, prob=rep(0.2,5),replace=TRUE) >>> table(x)## 另一种方法:用index >>> idx <- runif(10000,0,5); idx <- ceiling(idx) >>> x <- c(1,2,6,8,9)[idx] >>> table(x)
Bernoulli(伯努利试验)
-
Definition: 仅存在两种可能结果的一次 experiment
-
Example:
- Toss a coin(扔硬币) ONE TIME: H(Head, 正面朝上),T(Tail, 反面朝上)
\(P(X=H) = \pi, \ \ P(X=T) = 1- \pi\)
- Toss a coin(扔硬币) ONE TIME: H(Head, 正面朝上),T(Tail, 反面朝上)
-
R代码:
>>>进行1000次伯努利试验 >>> outcome <- sample(c(“T”,”F”), 1000, prob=c(0.8, 0.2), replace=TRUE) >>> ot <- table(outcome) >>> ot <- ot/sum(ot)
Binomial
-
Definition:
- 重复 n次独立 Bernoulli 的 概率分布就是Binomial(二项式)分布:
- Sample Space 为 \(\large {1, 0}\),
- 出现 \(\large 1\) 的概率是 \(\large p\),
- \(\large n\) 次结果有 \(\large X\) 次的 \(\large 1\),
- \(\large X\) 的可能取值范围是 $\large [1,\ n] \ of \ N $
- 重复 n次独立 Bernoulli 的 概率分布就是Binomial(二项式)分布:
-
Notation: 记作 \(\large X \sim B(n,p)\)
-
p.f. of \(\large Binomial\):
\(\large P(X)= C_n^X \pi^X (1-\pi)^{n-X})\)
\(\large C_n^X = \dfrac{n! }{(n-X)! X!}\) -
\(\large Binomial\) 示例1
一个袋子里有5个乒乓球,其中2个黄球,3个白球,我们进行有放回的摸球游戏。
因此每一次摸到黄球的概率是0.4,摸到白球的概率是0.6。
这个实验有三个特点:- 各次摸球是彼此独立的;
- 每次摸球只有二种可能的结果,或黄或白;
- 每次摸到黄球(或摸到白球)的概率是固定的。
具备这三点后, n次有X次摸到黄球(或白球)的概率分布就是二项分布。
-
Application:
医学研究上的应用医学研究,很多现象的观察结果是以两分类变量来表示的,
如阳性与阴性、治愈与未愈、生存与死亡等等。
如果:- 每个观察对象, Positive结果概率均为 \(\large \pi\),Negative结果概率均为 \(\large (1-\pi)\);
- 而且各个观察对象的结果是相互独立的,
- 重复观察 n个人,
发生Positive结果的人数X的概率分布为二项分布,记作\(\large B(X; n,\pi)\).