事件概率
1.事件
事件是指在某个试验或观察中可能发生的结果或结果的集合。是样本空间的一个子集,可以包含一个或多个样本点,也可以是整个样本空间。事件用大写字母,如 A,B,C 等表示。
1.1 概念
1.1 基本事件
基本事件是指试验中不可再分的最简单的事件。每个基本事件代表一个单一的可能结果。
例子:
- 抛一枚硬币:基本事件是“正面”和“反面”。
- 掷一个六面骰子:基本事件是“1点”、“2点”、“3点”、“4点”、“5点”和“6点”。
1.2 复合事件
复合事件是由多个基本事件组合而成的事件。复合事件代表多个可能结果的集合。
例子:
- 抛两枚硬币:复合事件可以是“至少一个正面”,这个事件包含“正面-正面”、“正面-反面”和“反面-正面”三个基本事件。
- 掷一个六面骰子:复合事件可以是“点数大于3”,这个事件包含“4点”、“5点”和“6点”三个基本事件。
1.3 必然事件
必然事件是指在试验中一定会发生的事件。必然事件的概率为1。在样本空间中,必然事件包括了样本空间中的所有样本点。
例子:
- 掷一个六面骰子:“点数在1到6之间”是一个必然事件。
1.4 不可能事件
不可能事件是指在试验中绝对不会发生的事件。不可能事件的概率为0。通常用∅表示。
例子:
- 掷一个六面骰子:“点数大于6”是一个不可能事件。
1.5 样本空间
样本空间是指试验中所有可能结果的集合。样本空间通常用大写字母 Ω 表示。
例子:
- 抛一枚硬币:样本空间 Ω={正面,反面}。
- 掷一个六面骰子:样本空间 Ω={1,2,3,4,5,6}。
1.6 样本点
样本点是指样本空间中的每一个元素,即每一个可能的结果。样本点通常用小写字母ω表示。
例子:
- 抛一枚硬币:样本点是“正面”和“反面”。
- 掷一个六面骰子:样本点是“1点”、“2点”、“3点”、“4点”、“5点”和“6点”。
注:必然事件和样本空间可以被视为等价的,但理论上它们是不同的概念。必然事件是事件的一个实例,而样本空间是定义这些事件的基础集合。
1.2 事件间的关系
1.2.1 包含关系
包含关系是指一个事件是另一个事件的子集。如果事件 A 包含在事件 B 中,那么 A 发生时,B 必然发生,即:A⊆B
1.2.2 并集
并事件是指两个或多个事件中至少有一个事件发生的情况。事件 A 和事件 B 的并事件记作 A∪B或A+B,表示 A 或 B 发生。
A
+
B
⊃
A
,
A
+
A
=
A
,
A
+
∅
=
A
,
A
+
Ω
=
Ω
A+B\supset A,A+A=A,A+∅=A,A+ Ω= Ω
A+B⊃A,A+A=A,A+∅=A,A+Ω=Ω
1.2.3 交集
交事件是指两个或多个事件同时发生的情况。事件A 和事件 B 的交事件记作 A∩B或AB,表示 A 和 B 同时发生。
A
B
⊂
A
,
A
A
=
A
,
A
∅
=
∅
,
A
Ω
=
A
AB⊂A,AA=A,A∅=∅,AΩ=A
AB⊂A,AA=A,A∅=∅,AΩ=A
1.2.4 差集
如果事件 A 发生而事件 B 不发生,则表示这些事件的差集发生了。即将事件A中的A和B的公共部分去掉。事件 A 和 B 的差集表示为 A−B
A
−
B
=
A
−
A
B
A-B=A-AB
A−B=A−AB
1.2.5 互斥事件
互斥事件是指两个事件不能同时发生。如果事件A 和事件 B 是互斥事件,那么 A 和 B 的交集为空集,即:AB=∅
例子:
- 抛一枚硬币:事件“正面”和事件“反面”是互斥事件。
- 掷一个六面骰子:事件“点数为1”和事件“点数为2”是互斥事件。
1.2.6 对立事件
对立事件是指两个事件互为对立,即一个事件发生时,另一个事件必然不发生。如果事件 A 和事件 B 是对立事件,那么 A 和 B 的并集是样本空间,且 A 和 B 的交集为空集,即:
A+B=Ω且AB=∅
通常,事件 A 的对立事件记作
A
c
或
A
‾
A^c 或 \overline A
Ac或A
A − B = A − A B = A B ‾ A-B=A-AB=A\overline B A−B=A−AB=AB
例子:
- 抛一枚硬币:事件“正面”和事件“反面”是对立事件。
- 掷一个六面骰子:事件“点数为1”和事件“点数不为1”是对立事件。
互斥和对立事件的区别:
1.两个事件对立,则一定是互斥事件
2.互斥事件适用于多个事件,对立适用于两个事件
3.互斥事件,A和B不能同时发生,也可以都不发生;对立事件有且只有一个发生。
1.2.7 完备事件组
是一组事件,它们满足以下两个条件:
- 互斥性:完备事件组中的任意两个事件不能同时发生。也就是说,这些事件两两互斥。
- 完备性:完备事件组中的事件涵盖了样本空间中所有可能的结果,并且至少有一个事件必然发生。换句话说,这些事件的并集是整个样本空间,且它们的并集是必然事件。
用数学术语来说,如果有一个样本空间 Ω 和一个事件集合 {A1,A2,…,An},那么这个事件集合是完备的,如果:
-
对于所有的 i≠j,有
A i ∩ A j = ∅ A_i∩A_j=∅ Ai∩Aj=∅
(互斥性)。 -
⋃ i = 1 n A i = Ω ⋃_{i=1}^{n}A_i=Ω i=1⋃nAi=Ω
(完备性)。
例子:
假设我们掷一个公平的六面骰子,样本空间是 Ω={1,2,3,4,5,6}。
- {1,2,3,4,5,6}是一个完备事件组。
- 这些事件两两互斥,并且它们的并集包含了所有可能的结果,即整个样本空间。
1.3 运算律
1.3.1 交换律
交换律是指事件的并集和交集运算满足交换性,即运算的顺序不影响结果。
-
并集的交换律:
A∪B=B∪A
-
交集的交换律:
A∩B=B∩A
例子:
- 事件 A 和事件 B 的并集:A∪B=B∪A。
- 事件 A 和事件 B 的交集:A∩B=B∩A。
1.3.2 结合律
结合律是指事件的并集和交集运算满足结合性,即多个事件的运算顺序不影响结果。
-
并集的结合律:
(A∪B)∪C=A∪(B∪C)
-
交集的结合律:
(A∩B)∩C=A∩(B∩C)
例子:
- 事件 A、事件 B 和事件 C 的并集:(A∪B)∪C=A∪(B∪C)。
- 事件 A、事件 B 和事件 CC 的交集:(A∩B)∩C=A∩(B∩C)。
1.3.3 分配律
分配律是指事件的并集和交集运算满足分配性,即一个运算对另一个运算的分配关系。
-
并集对交集的分配律:
A∪(B∩C)=(A∪B)∩(A∪C)
-
交集对并集的分配律:
A∩(B∪C)=(A∩B)∪(A∩C)
例子:
- 事件 A、事件 B 和事件C 的并集对交集的分配:A∪(B∩C)=(A∪B)∩(A∪C)。
- 事件 A、事件 B 和事件 C 的交集对并集的分配:A∩(B∪C)=(A∩B)∪(A∩C)。
1.4.4 对偶律
对偶律是指事件的补集运算的对偶关系,即并集的补集和交集的补集之间的关系。
-
第一对偶律:
( A ∪ B ) ‾ = A ‾ ∩ B ‾ \overline {(A∪B)}=\overline A∩\overline B (A∪B)=A∩B -
第二对偶律:
( A ∩ B ) ‾ = A ‾ ∪ B ‾ \overline {(A∩B)}=\overline A∪\overline B (A∩B)=A∪B
2.概率
2.1 定义
对于一个事件 A,其概率 P(A) 定义为:
P
(
A
)
=
事件
A
包含的基本事件数
样本空间中的基本事件总数
P(A)=\dfrac{事件 A 包含的基本事件数}{样本空间中的基本事件总数}
P(A)=样本空间中的基本事件总数事件A包含的基本事件数
2.2 古典模型
古典概率模型,也称为古典模型或等可能模型,是一种概率论中用于计算随机事件发生概率的方法。它基于以下假设:
- 有限性:样本空间是有限的,即所有可能的结果可以被列举出来。
- 等可能性:样本空间中的每个基本事件(样本点)出现的可能性是相等的。
在古典模型中,一个事件的概率可以通过以下公式计算:
P
(
A
)
=
事件
A
包含的基本事件数
样本空间中的基本事件总数
P(A)=\dfrac{事件 A 包含的基本事件数}{样本空间中的基本事件总数}
P(A)=样本空间中的基本事件总数事件A包含的基本事件数
古典模型的步骤:
- 确定样本空间:列出随机试验所有可能的结果。
- 计数:计算样本空间中基本事件的总数。
- 识别事件:确定事件 A 包含的基本事件数。
- 计算概率:使用上述公式计算事件 A 的概率。
例子:
假设我们掷一个公平的六面骰子,想要计算掷得奇数(1、3、5)的概率。
- 样本空间:Ω={1,2,3,4,5,6}
- 基本事件总数:6(因为骰子有六个面)
- 事件 A 包含的基本事件数:3(因为有三个奇数:1、3、5)
因此,掷得奇数的概率 P(A) 为:
P
(
A
)
=
3
6
=
1
2
P(A)=\dfrac{3}{6}=\dfrac{1}{2}
P(A)=63=21
2.3 排列(不重复排列)
排列的定义
给定一个包含 n 个元素的集合,从中选择 r 个不同元素(r≤n)进行排列,意味着这 r 个元素的顺序是重要的。
排列的符号
排列通常用 P(n,r)表示,读作“n 个中取 r个的排列数”。
排列的公式
排列数的计算公式是:
P
(
n
,
r
)
=
n
!
(
n
−
r
)
!
P(n,r)=\dfrac{n!}{(n−r)!}
P(n,r)=(n−r)!n!
其中 n!(n的阶乘)表示从 n 到 1 的所有正整数的乘积,即
n
!
=
n
×
(
n
−
1
)
×
(
n
−
2
)
×
…
×
1
n!=n×(n−1)×(n−2)×…×1
n!=n×(n−1)×(n−2)×…×1
排列的计算
- 如果 r=n,即从 n 个元素中选择 n 个元素进行全排列,排列数为 n!。
- 如果 r=0,即从 n 个元素中选择 0 个元素进行排列,排列数为 1,因为空集的排列只有一种。
- 如果 r>n,排列数为 0,因为不可能从 n 个元素中选择超过 n 个元素。
示例
假设有一个集合 {1,2,3,4},我们要计算从这个集合中选择 3 个元素进行排列的数量。
解:由题意可知:
n=4,r=3
排列数为:
P
(
4
,
3
)
=
4
!
(
4
−
3
)
!
=
4
×
3
×
2
×
1
1
=
24
P(4,3)=\dfrac{4!}{(4−3)!}=\dfrac{4×3×2×1}{1}=24
P(4,3)=(4−3)!4!=14×3×2×1=24
这意味着有 24 种不同的方式将集合 {1,2,3,4} 中的 3 个元素进行排列。
2.4 组合
组合的定义
给定一个包含 n 个元素的集合,从中选择 r 个不同元素(r≤n)进行组合,意味着这 r 个元素的顺序并不重要。
组合的符号
组合通常用
C
(
n
,
r
)
或
(
n
r
)
C(n,r)或 \begin{pmatrix} n \\ r \end{pmatrix}
C(n,r)或(nr)
表示,读作“n 选 r”或“二项式系数”。
组合的公式
组合数的计算公式是:
C
(
n
,
r
)
=
(
n
r
)
=
P
(
n
,
r
)
r
!
=
n
!
r
!
(
n
−
r
)
!
C(n,r)=\begin{pmatrix} n \\ r \end{pmatrix}=\dfrac{P(n,r)}{r!}=\dfrac{n!}{r!(n−r)!}
C(n,r)=(nr)=r!P(n,r)=r!(n−r)!n!
组合的性质
- 对称性:C(n,r)=C(n,n−r)
- 边界条件:C(n,0)=C(n,n)=1
- 当 r>n 时,C(n,r)=0
示例
假设有一个集合 {1,2,3,4},我们要计算从这个集合中选择 2 个元素进行组合的数量。
解:
n=4,r=2
组合数为:
C
(
4
,
2
)
=
(
4
2
)
=
4
!
2
!
(
4
−
2
)
!
=
4
×
3
2
×
1
=
6
C(4,2)=\begin{pmatrix}4\\2\end{pmatrix}=\dfrac{4!}{2!(4−2)!}=\dfrac{4×3}{2×1}=6
C(4,2)=(42)=2!(4−2)!4!=2×14×3=6
这意味着有 6 种不同的方式从集合 {1,2,3,4}中选择 2 个元素进行组合。
2.5 几何概型
几何概型是概率论中的一个基本概念,它用于处理那些结果可以被表示为几何区域(如线段、平面区域、立体区域等)的随机试验的概率问题。几何概型的基本思想是将概率问题转化为几何区域上的面积、体积或长度等几何量的比值。
几何概型的计算:
几何概型的概率可以通过以下步骤计算:
- 确定样本空间:首先确定样本空间的几何区域,比如长度、面积或体积。
- 度量样本空间:计算样本空间的度量,比如长度、面积或体积。
- 确定事件区域:确定事件对应的几何区域,并计算其度量。
- 计算概率:事件的概率等于事件区域的度量除以样本空间的度量。
几何概型的公式:
如果事件 A 对应的几何区域的度量为 m(A),样本空间 Ω 的度量为 m(Ω),则 A 的概率 P(A)为:
P
(
A
)
=
m
(
A
)
m
(
Ω
)
P(A)=\dfrac{m(A)}{m(Ω)}
P(A)=m(Ω)m(A)
例子
1.在一个单位正方形内随机投点,事件“点落在左半边”的概率:
P
(
左半边
)
=
左半边的面积
单位正方形的面积
=
0.5
1
=
0.5
P(左半边)=\dfrac{左半边的面积}{单位正方形的面积}=\dfrac{0.5}{1}=0.5
P(左半边)=单位正方形的面积左半边的面积=10.5=0.5
2.假设甲和乙约定在6-7点时间段内到达某个地点会面,先到者等待15分钟,两人到达的时间是随机的。我们需要确定他们能够相遇的概率。
解:
将1小时换算为60分钟,时间段表示为数轴上的0到60之间的区间。
甲到达的时间用 x 表示,乙到达的时间用 y 表示,其中 0≤x,y≤60。
样本空间 Ω 可以表示为一个边长为60的正方形,其中 (x,y)表示甲和乙到达的时间。
可能甲先到,也可能乙先到,甲和乙相遇,这意味着甲和乙到达的时间差不超过15分钟,即 ∣x−y∣≤15。
∣
x
−
y
∣
≤
15
=
>
{
x
−
y
≤
15
,
x
−
y
≥
0
y
−
x
≤
15
,
x
−
y
<
0
|x−y|≤15=>\begin{cases}x-y\leq 15,x-y\geq 0\\y-x\leq 15,x-y<0\end{cases}
∣x−y∣≤15=>{x−y≤15,x−y≥0y−x≤15,x−y<0
根据几何概型,实际上是求图形中阴影部分的面积与整个正方形面积的比值。
阴影面积
=
60
×
60
−
2
×
1
2
×
45
×
45
阴影面积=60\times 60 - 2\times \dfrac{1}{2}\times 45 \times 45
阴影面积=60×60−2×21×45×45
P ( A ) = 阴影面积 总面积 = 60 × 60 − 2 × 1 2 × 45 × 45 60 × 60 = 0.43756 P(A)=\dfrac{阴影面积}{总面积}=\dfrac{60\times 60 - 2\times \dfrac{1}{2}\times 45 \times 45}{60\times60}=0.43756 P(A)=总面积阴影面积=60×6060×60−2×21×45×45=0.43756
2.6 频率
- 定义:频率是一个经验概念,它通过实际观察或实验来确定。频率是某个事件在一系列重复实验中发生的次数与总实验次数之比。
- 性质:频率的值可以是任何非负实数,包括0(事件一次也没发生)和任意正数(事件多次发生)。
- 计算:频率是通过实际计数得到的,例如,如果一个事件发生了 m 次,在 n次独立的重复实验中,其频率为 mn。
- 不确定性:频率是随机的,它随着实验次数的增加而波动,但根据大数定律,当实验次数足够多时,频率会趋近于概率。
概率与频率的关系
- 大数定律:随着实验次数的增加,事件发生的频率趋近于其概率。
- 长期稳定性:在大量重复实验中,频率的稳定性可以作为概率的一个估计。
- 经验估计:在没有理论模型的情况下,可以通过频率来估计概率。
2.7 基本性质(公理化)
- 非负性:对于任意事件 A,有 P(A)≥0。
- 规范性:必然事件的概率为1,即 P(Ω)=1。
- 可加性:对于互斥事件 A 和 B,有 P(A+B)=P(A)+P(B)。
性质1:P(∅)=0
性质2:
P
(
A
‾
)
=
1
−
P
(
A
)
P(\overline A)=1-P(A)
P(A)=1−P(A)
性质3:
P
(
A
−
B
)
=
P
(
A
)
−
P
(
A
B
)
A
⊃
B
,
P
(
A
−
B
)
=
P
(
A
)
−
P
(
B
)
,
且
P
(
A
)
≥
P
(
B
)
P(A-B)=P(A)-P(AB)\\ A\supset B,P(A-B)=P(A)-P(B),且P(A)\geq P(B)
P(A−B)=P(A)−P(AB)A⊃B,P(A−B)=P(A)−P(B),且P(A)≥P(B)
性质4:P(A+B)=P(A)+P(B)-P(AB)
证明:
A+B=A+(B-AB),可根据图形理解。
P(A+B)=P(A+(B-AB))=P(A)+P(B)-P(AB)
注意:性质4是可加性的一般性描述,如果A和B互斥那么AB为空集,则P(AB)=0
另外性质4还适用于多个事件相加:
P
(
A
+
B
+
C
)
=
P
(
A
)
+
P
(
B
)
+
P
(
C
)
−
P
(
A
B
)
−
P
(
A
C
)
−
P
(
B
C
)
+
P
(
A
B
C
)
P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)
P(A+B+C)=P(A)+P(B)+P(C)−P(AB)−P(AC)−P(BC)+P(ABC)
如果A、B、C是互斥事件:则P(AB)=P(AC)=P(BC)=P(ABC)=0
所以:
P
(
A
+
B
+
C
)
=
P
(
A
)
+
P
(
B
)
+
P
(
C
)
P(A+B+C)=P(A)+P(B)+P(C)
P(A+B+C)=P(A)+P(B)+P(C)
解释:
P(A+B+C)相当于三个圆的公共部分,即图中蓝色部分,P(A)+P(B)+P©相当于三个圆相加,但是中间重叠部分(AC、AB、BC)被加了两次,所以需要减掉一次P(AC)、P(AB)、P(BC),在减掉P(AC)、P(AB)、P(BC)时最中间(三色重叠)的部分被减掉了,所以还要再加上P(ABC)
例子
1.假设有事件A、B,事件A的概率P(A)=0.4,事件B的概率P(B)=0.3,P(A+B)=0.6,求
P
(
A
B
‾
)
P(A\overline B)
P(AB)
解:由题目可知:
P
(
A
B
‾
)
=
P
(
A
−
B
)
=
P
(
A
)
−
P
(
A
B
)
=
0.4
−
P
(
A
B
)
P(A\overline B)=P(A-B)=P(A)-P(AB)=0.4-P(AB)
P(AB)=P(A−B)=P(A)−P(AB)=0.4−P(AB)
需要求P(AB),A、B不是互斥事件:
P
(
A
+
B
)
=
P
(
A
)
+
P
(
B
)
−
P
(
A
B
)
=
>
0.6
=
0.4
+
0.3
−
P
(
A
B
)
=
>
P
(
A
B
)
=
0.1
P(A+B)=P(A)+P(B)-P(AB)=>0.6=0.4+0.3-P(AB)=>P(AB)=0.1
P(A+B)=P(A)+P(B)−P(AB)=>0.6=0.4+0.3−P(AB)=>P(AB)=0.1
所以
P
(
A
B
‾
)
=
P
(
A
−
B
)
=
0.4
−
P
(
A
B
)
=
0.4
−
0.1
=
0.3
P(A\overline B)=P(A-B)=0.4-P(AB)=0.4-0.1=0.3
P(AB)=P(A−B)=0.4−P(AB)=0.4−0.1=0.3
2.假设箱子里有4个白球,3个黑球,从箱子中取3个球,求至少取2个白球的概率。
解:该题按照概率定义来做:
P
(
A
)
=
事件
A
包含的基本事件数
样本空间中的基本事件总数
P(A)=\dfrac{事件 A 包含的基本事件数}{样本空间中的基本事件总数}
P(A)=样本空间中的基本事件总数事件A包含的基本事件数
先求样本空间中的基本事件总数:C(7,3)
再求事件包含的基本事件数:题目要取3个求,并且至少2个白球,也就是说要从4个白球中取2个,以及从4个白球中取3个
所以取2个白球的组合为:C(4,2)C(3,1),从4个白球取2个,还要再从3个黑球中取1个,才够3个
取3个白球的组合为:C(4,3),这时已经取够3个,不需要取黑球
所以基本事件数:C(4,2)C(3,1)+C(4,3)
最终概率为:
P
(
A
)
=
C
(
4
,
2
)
C
(
3
,
1
)
+
C
(
4
,
3
)
C
(
7
,
3
)
P(A)=\dfrac{C(4,2)C(3,1)+C(4,3)}{C(7,3)}
P(A)=C(7,3)C(4,2)C(3,1)+C(4,3)
组合计算公式:
C
(
n
,
r
)
=
(
n
r
)
=
P
(
n
,
r
)
r
!
=
n
!
r
!
(
n
−
r
)
!
C(n,r)=\begin{pmatrix} n \\ r \end{pmatrix}=\dfrac{P(n,r)}{r!}=\dfrac{n!}{r!(n−r)!}
C(n,r)=(nr)=r!P(n,r)=r!(n−r)!n!
带入公式:
C
(
4
,
2
)
=
4
!
2
!
(
2
)
!
=
6
C
(
3
,
1
)
=
3
!
1
!
(
2
)
!
=
3
C
(
4
,
3
)
=
4
!
3
!
(
1
)
!
=
4
C
(
7
,
3
)
=
7
!
3
!
(
4
)
!
=
35
C(4,2)=\dfrac{4!}{2!(2)!}=6\\C(3,1)=\dfrac{3!}{1!(2)!}=3\\C(4,3)=\dfrac{4!}{3!(1)!}=4\\C(7,3)=\dfrac{7!}{3!(4)!}=35
C(4,2)=2!(2)!4!=6C(3,1)=1!(2)!3!=3C(4,3)=3!(1)!4!=4C(7,3)=3!(4)!7!=35
P ( A ) = C ( 4 , 2 ) C ( 3 , 1 ) + C ( 4 , 3 ) C ( 7 , 3 ) = 6 × 3 + 4 35 = 0.629 P(A)=\dfrac{C(4,2)C(3,1)+C(4,3)}{C(7,3)}=\dfrac{6\times 3 + 4}{35}=0.629 P(A)=C(7,3)C(4,2)C(3,1)+C(4,3)=356×3+4=0.629
2.8 条件概率
条件概率用于描述在已知某一事件发生的情况下,另一事件发生的概率。条件概率通常表示为 P(A∣B),读作“在事件 B 发生的条件下,事件 A 发生的概率”。
定义
设Ω为样本空间, A和 B 是两个事件,且 P(B)>0。事件 A 在事件 B 发生的条件下的条件概率 P(A∣B) 定义为:
P
(
A
∣
B
)
=
P
(
A
∩
B
)
P
(
B
)
=
P
(
A
B
)
P
(
B
)
P(A∣B)=\dfrac{P(A∩B)}{P(B)}=\dfrac{P(AB)}{P(B)}
P(A∣B)=P(B)P(A∩B)=P(B)P(AB)
说明:
P(A):无条件概率,样本空间为Ω
P(A|B):条件概率,样本空间不再是Ω,而是B或者
Ω
B
Ω_B
ΩB
所以条件概率定义公式中P(B)为B事件发生的总事件数概率,P(A∩B)是在B发生的条件下A发生的事件概率,即A和B共同发生的事件概率
例子
1.假设有编号为1-6的球,B为取编号为偶数球的事件,A1为取1号球事件,A2为取2号球事件,A3为取编号大于4的事件,求
P
(
A
1
)
,
P
(
A
1
∣
B
)
,
P
(
A
2
)
,
P
(
A
2
∣
B
)
,
P
(
A
3
)
,
P
(
A
3
∣
B
)
P(A_1),P(A_1|B),P(A_2),P(A_2|B),P(A_3),P(A_3|B)
P(A1),P(A1∣B),P(A2),P(A2∣B),P(A3),P(A3∣B)
解:
P
(
A
1
)
为从
6
个球中取
1
号球,概率为
P
(
A
1
)
=
1
6
P
(
A
1
∣
B
)
在
B
事件发生的前提下
A
1
发生的概率,
B
的样本空间
Ω
=
{
2
,
4
,
6
}
,事件数为
3
,从
B
中取
1
号球的事件数为
0
,则
P
(
A
1
∣
B
)
=
0
P
(
A
2
)
为从
6
个球中取
2
号球,概率为
P
(
A
2
)
=
1
6
P
(
A
2
∣
B
)
在
B
事件发生的前提下
A
2
发生的概率,
B
的样本空间和事件数同上,从
B
中取
2
号球的事件数为
1
,则
P
(
A
2
∣
B
)
=
1
3
P
(
A
3
)
为从从
6
个球中取编号为
5
、
6
的球,概率为
P
(
A
3
)
=
1
3
P
(
A
3
∣
B
)
在
B
事件发生的前提下
A
3
发生的概率,从
B
中取
5
号球的事件数为
0
,取出
6
号球的事件数为
1
,则
P
(
A
3
∣
B
)
=
0
+
1
3
=
1
3
P(A_1)为从6个球中取1号球,概率为P(A_1)=\dfrac{1}{6}\\ P(A_1|B)在B事件发生的前提下A_1发生的概率,B的样本空间Ω=\{2,4,6\},事件数为3,从B中取1号球的事件数为0,则P(A_1|B)=0\\ P(A_2)为从6个球中取2号球,概率为P(A_2)=\dfrac{1}{6}\\ P(A_2|B)在B事件发生的前提下A_2发生的概率,B的样本空间和事件数同上,从B中取2号球的事件数为1,则P(A_2|B)=\dfrac{1}{3}\\ P(A_3)为从从6个球中取编号为5、6的球,概率为P(A_3)=\dfrac{1}{3}\\ P(A_3|B)在B事件发生的前提下A_3发生的概率,从B中取5号球的事件数为0,取出6号球的事件数为1,则P(A_3|B)=0+\dfrac{1}{3}=\dfrac{1}{3}
P(A1)为从6个球中取1号球,概率为P(A1)=61P(A1∣B)在B事件发生的前提下A1发生的概率,B的样本空间Ω={2,4,6},事件数为3,从B中取1号球的事件数为0,则P(A1∣B)=0P(A2)为从6个球中取2号球,概率为P(A2)=61P(A2∣B)在B事件发生的前提下A2发生的概率,B的样本空间和事件数同上,从B中取2号球的事件数为1,则P(A2∣B)=31P(A3)为从从6个球中取编号为5、6的球,概率为P(A3)=31P(A3∣B)在B事件发生的前提下A3发生的概率,从B中取5号球的事件数为0,取出6号球的事件数为1,则P(A3∣B)=0+31=31
基本性质
-
非负性:对于任意事件 A和B,有 P(A|B)≥0。
-
规范性: P(Ω|B)=1。
-
可加性:对于互斥事件
A 1 、 A 2 、 . . . 、 A n ,有 P ( A 1 + A 2 + . . . + A n ∣ B ) = P ( A 1 ∣ B ) + P ( A 2 ∣ B ) + . . . + P ( A n ∣ B ) A_1、A_2、...、A_n,有 P(A_1+A_2+...+A_n|B)=P(A_1|B)+P(A_2|B)+...+P(A_n|B) A1、A2、...、An,有P(A1+A2+...+An∣B)=P(A1∣B)+P(A2∣B)+...+P(An∣B)
乘法公式
条件概率的乘法公式是:
P
(
A
B
)
=
P
(
B
)
⋅
P
(
A
∣
B
)
P(AB)=P(B)⋅P(A|B)
P(AB)=P(B)⋅P(A∣B)
这个公式说明了事件 A 和事件 B 同时发生的概率等于事件 B 发生的概率乘以在 B 发生的条件下 A 发生的概率。
说明:以上公式可以理解为分几步走,第一步B发生的概率,第二步在B发生的前提下A发生的概率。
补充:如果有A、B、C事件
P
(
A
B
C
)
=
P
(
A
)
P
(
B
∣
A
)
P
(
C
∣
A
B
)
P(ABC)=P(A)P(B|A)P(C|AB)
P(ABC)=P(A)P(B∣A)P(C∣AB)
按照分几步走的逻辑:第一步A发生的概率,第二步在A发生的前提下B的概率,第三步在AB发生的前提下C的概率,相当于每一步都要以前一步作为发生条件。
例子
1.假设有100件产品,次品率为10%,每次取一件不放回,问第三次取到合格品的概率。
解:根据题目可知,次品数位10,总共取3次,第一次和第二次都取到次品,第三次是在前两次取到次品的前提下取到合格品
设A第一次取到次品的事件,B第二次取到次品的事件,C为取到合格品的事件
所以三次共同发生的概率:
P
(
A
B
C
)
=
P
(
A
)
P
(
B
∣
A
)
P
(
C
∣
A
B
)
P(ABC)=P(A)P(B|A)P(C|AB)
P(ABC)=P(A)P(B∣A)P(C∣AB)
分别计算概率:
P
(
A
)
=
10
100
P
(
B
∣
A
)
=
9
99
,因为第一次取走了一个次品,产品总数为
99
,次品总数为
9
P
(
C
∣
A
B
)
=
90
98
,第二次取走一个次品,产品总数为
99
,合格品没变,还是
90
P(A)=\dfrac{10}{100}\\ P(B|A)=\dfrac{9}{99},因为第一次取走了一个次品,产品总数为99,次品总数为9\\ P(C|AB)=\dfrac{90}{98},第二次取走一个次品,产品总数为99,合格品没变,还是90
P(A)=10010P(B∣A)=999,因为第一次取走了一个次品,产品总数为99,次品总数为9P(C∣AB)=9890,第二次取走一个次品,产品总数为99,合格品没变,还是90
所以:
P
(
A
B
C
)
=
P
(
A
)
P
(
B
∣
A
)
P
(
C
∣
A
B
)
=
10
100
×
9
99
×
90
98
=
0.0083
P(ABC)=P(A)P(B|A)P(C|AB)=\dfrac{10}{100}\times \dfrac{9}{99}\times \dfrac{90}{98}=0.0083
P(ABC)=P(A)P(B∣A)P(C∣AB)=10010×999×9890=0.0083
2.9 全概率公式
假设事件 A1,A2,…,An 是样本空间 Ω 的一个完备事件组,即这些事件两两互斥,并且它们的并集是整个样本空间。如果我们想计算事件 B 的概率,可以使用全概率公式:
P
(
B
)
=
P
(
B
∣
A
1
)
P
(
A
1
)
+
P
(
B
∣
A
2
)
P
(
A
2
)
+
.
.
.
+
P
(
B
∣
A
n
)
P
(
B
n
)
=
∑
i
=
1
n
P
(
A
i
)
P
(
B
∣
A
i
)
P(B)=P(B∣A_1)P(A_1)+P(B∣A_2)P(A_2)+...+P(B∣A_n)P(Bn)=\sum _{i=1}^{n}P(A_i)P(B|A_i)
P(B)=P(B∣A1)P(A1)+P(B∣A2)P(A2)+...+P(B∣An)P(Bn)=i=1∑nP(Ai)P(B∣Ai)
计算某一事件的总概率,通过将其分解为多个互斥事件的条件概率之和。
例子
假设有4条生产线
一 | 二 | 三 | 四 | |
---|---|---|---|---|
生产占比 | 15% | 20% | 30% | 35% |
不合格率 | 5% | 4% | 3% | 2% |
求从4条生产线中任意抽一件产品的不合格率
解:
设A1、A2、A3、A4为4条生产线生产的产品,B为不合格的产品
根据全概率公式
P
(
B
)
=
P
(
A
1
)
P
(
B
∣
A
1
)
+
P
(
A
2
)
P
(
B
∣
A
2
)
+
P
(
A
3
)
P
(
B
∣
A
3
)
+
P
(
A
4
)
P
(
B
∣
A
4
)
=
0.15
×
0.05
+
0.2
×
0.04
+
0.3
×
0.03
+
0.35
×
0.02
=
0.0315
P(B)=P(A_1)P(B|A_1)+P(A2)P(B|A_2)+P(A_3)P(B|A_3)+P(A4)P(B|A_4)\\ =0.15\times 0.05+0.2\times 0.04+0.3\times 0.03+0.35\times 0.02=0.0315
P(B)=P(A1)P(B∣A1)+P(A2)P(B∣A2)+P(A3)P(B∣A3)+P(A4)P(B∣A4)=0.15×0.05+0.2×0.04+0.3×0.03+0.35×0.02=0.0315
从上述公式可以看出
P
(
A
1
)
P
(
B
∣
A
1
)
P(A_1)P(B|A_1)
P(A1)P(B∣A1)
就是在第一条生产线上生产出不合格产品的概率,首先求出第一条生产线的概率,再求出在第一条生产线生产的产品的前提下生产出不合格产品的概率,其实就是
P
(
A
1
B
)
P(A_1B)
P(A1B)
2.10 贝叶斯公式
贝叶斯公式描述了在已知其他条件概率的情况下,一个条件概率的计算方法。贝叶斯公式是逆概率理论的核心,它允许我们根据已知的某些概率来更新我们对另一个概率的信念。
例如:感冒、肺炎、白血病的症状都是发烧,在已知病人发烧的情况下,来推理病人发病的原因。可以把感冒、肺炎、白血病理解为原因,发烧是导致的结果,由已知结果推理原因的方法就是贝叶斯公式的核心理论。
定义
如果事件 B1,B2,…,Bn是样本空间 Ω 的一个完备事件组,即这些事件两两互斥且它们的并集是整个样本空间,那么对于任意事件 A,贝叶斯公式可以表示为:
P
(
B
i
∣
A
)
=
P
(
A
∣
B
i
)
P
(
B
i
)
P
(
A
)
=
P
(
A
B
i
)
P
(
A
)
P(B_i∣A)=\dfrac{P(A∣B_i)P(Bi)}{P(A)}=\dfrac{P(AB_i)}{P(A)}
P(Bi∣A)=P(A)P(A∣Bi)P(Bi)=P(A)P(ABi)
其中:
- P(Bi∣A) 是在事件 A 发生的条件下事件 Bi发生的条件概率(后验概率)。
- P(A∣Bi)是在事件 Bi发生的条件下事件 A 发生的条件概率(似然度)。
- P(Bi)是事件 Bi发生的边缘概率(先验概率)。
- P(A)是事件 A 发生的边缘概率(先验概率),可以通过全概率公式计算得出:
P ( A ) = ∑ i = 1 n P ( A ∣ B i ) P ( B i ) P(A)=∑i=1nP(A∣Bi)P(Bi) P(A)=∑i=1nP(A∣Bi)P(Bi)
说明:事件A理解为结果,在已知事件A的条件下,事件Bi发生的概率即为贝叶斯公式。
例子
1.假设有4条生产线
一 | 二 | 三 | 四 | |
---|---|---|---|---|
生产占比 | 15% | 20% | 30% | 35% |
不合格率 | 5% | 4% | 3% | 2% |
已知在抽查中抽检出一个次品,求这个次品是哪条生产线的概率最大。
解:设B事件是抽检次品,A1、A2、A3、A4事件为4条生产线生产的产品
根据贝叶斯公式,在已知B事件的前提下,计算A1、A2、A3、A4事件的概率
P(A)由上一例题计算得出:P(A)=0.0315
第一条生产线的概率:
P
(
A
1
∣
B
)
=
P
(
A
1
B
)
P
(
A
)
=
P
(
A
1
)
P
(
B
∣
A
1
)
P
(
A
)
=
0.15
×
0.05
0.0315
=
0.238
P(A_1|B)=\dfrac{P(A_1B)}{P(A)}=\dfrac{P(A_1)P(B|A_1)}{P(A)}=\dfrac{0.15 \times 0.05}{0.0315}=0.238
P(A1∣B)=P(A)P(A1B)=P(A)P(A1)P(B∣A1)=0.03150.15×0.05=0.238
第二条生产线的概率:
P
(
A
2
∣
B
)
=
P
(
A
2
B
)
P
(
A
)
=
P
(
A
2
)
P
(
B
∣
A
2
)
P
(
A
)
=
0.2
×
0.04
0.0315
=
0.254
P(A_2|B)=\dfrac{P(A_2B)}{P(A)}=\dfrac{P(A_2)P(B|A_2)}{P(A)}=\dfrac{0.2 \times 0.04}{0.0315}=0.254
P(A2∣B)=P(A)P(A2B)=P(A)P(A2)P(B∣A2)=0.03150.2×0.04=0.254
第三条生产线的概率:
P
(
A
3
∣
B
)
=
P
(
A
3
B
)
P
(
A
)
=
P
(
A
3
)
P
(
B
∣
A
3
)
P
(
A
)
=
0.3
×
0.03
0.0315
=
0.286
P(A_3|B)=\dfrac{P(A_3B)}{P(A)}=\dfrac{P(A_3)P(B|A_3)}{P(A)}=\dfrac{0.3 \times 0.03}{0.0315}=0.286
P(A3∣B)=P(A)P(A3B)=P(A)P(A3)P(B∣A3)=0.03150.3×0.03=0.286
第四条生产线的概率:
P
(
A
4
∣
B
)
=
P
(
A
4
B
)
P
(
A
)
=
P
(
A
4
)
P
(
B
∣
A
4
)
P
(
A
)
=
0.35
×
0.02
0.0315
=
0.222
P(A_4|B)=\dfrac{P(A_4B)}{P(A)}=\dfrac{P(A_4)P(B|A_4)}{P(A)}=\dfrac{0.35 \times 0.02}{0.0315}=0.222
P(A4∣B)=P(A)P(A4B)=P(A)P(A4)P(B∣A4)=0.03150.35×0.02=0.222
所以,次品是第三条生产线的概率最大。
2.假设一种病的发病率为0.0004,如果是患者,检查有病的概率是99%,没病的概率是1%,如果是健康的人,检查有病的概率是0.1%,没病的概率是99.9%,问一个人去医院,经过检查有病,并且真有病的概率。
解:
设A为真有病,B为检查有病,根据题意可知,要求出P(A|B)
根据贝叶斯公式:
P
(
A
∣
B
)
=
P
(
A
B
)
P
(
B
)
=
P
(
A
)
P
(
B
∣
A
)
P
(
B
)
P(A|B)=\dfrac{P(AB)}{P(B)}=\dfrac{P(A)P(B|A)}{P(B)}
P(A∣B)=P(B)P(AB)=P(B)P(A)P(B∣A)
其中,P(B)表示被检查出有病的概率,分两种情况:1.是患者被检查有病;2.健康的人被检查有病,这是求全概率:
P
(
B
)
=
P
(
A
)
P
(
B
∣
A
)
+
P
(
A
‾
)
P
(
B
∣
A
‾
)
P(B)=P(A)P(B|A)+P(\overline A)P(B|\overline A)
P(B)=P(A)P(B∣A)+P(A)P(B∣A)
其中,P(A)表示真有病的概率,也就是发病率,即P(A)=0.0004
P
(
A
‾
)
P(\overline A)
P(A)
表示健康人,即:
P
(
A
‾
)
=
0.9996
P(\overline A)=0.9996
P(A)=0.9996
P(B|A)表示在真有病的前提下检查有病的概率:P(B|A)=0.99
P
(
B
∣
A
‾
)
P(B|\overline A)
P(B∣A)
表示没病(健康)的前提下检查有病的概率:
P
(
B
∣
A
‾
)
=
0.001
P(B|\overline A)=0.001
P(B∣A)=0.001
带入公式:
P
(
A
∣
B
)
=
P
(
A
)
P
(
B
∣
A
)
P
(
B
)
=
0.0004
×
0.99
0.0004
×
0.99
+
0.9996
×
0.001
=
0.284
P(A|B)=\dfrac{P(A)P(B|A)}{P(B)}=\dfrac{0.0004\times 0.99}{0.0004\times 0.99 + 0.9996\times 0.001}=0.284
P(A∣B)=P(B)P(A)P(B∣A)=0.0004×0.99+0.9996×0.0010.0004×0.99=0.284
2.11 事件独立性
如果两个事件是独立的,那么一个事件的发生不会影响另一个事件发生的概率。
条件概率与独立性
如果事件 A 和事件 B 是独立的,那么事件 A 在事件 B 发生的条件下的条件概率 P(A∣B)等于事件 A 的先验概率 P(A):
P
(
A
∣
B
)
=
P
(
A
)
P(A∣B)=P(A)
P(A∣B)=P(A)
同样地,事件 B 在事件 A 发生的条件下的条件概率 P(B∣A)等于事件 B 的先验概率 P(B):
P
(
B
∣
A
)
=
P
(
B
)
P(B∣A)=P(B)
P(B∣A)=P(B)
由条件概率公式可知:
P
(
A
∣
B
)
=
P
(
A
B
)
P
(
B
)
=
P
(
A
)
=
>
P
(
A
B
)
=
P
(
A
)
P
(
B
)
P(A|B)=\dfrac{P(AB)}{P(B)}=P(A)=>P(AB)=P(A)P(B)
P(A∣B)=P(B)P(AB)=P(A)=>P(AB)=P(A)P(B)
定义
设 A和 B 是两个事件。如果满足以下条件,则称事件 A 和事件 B 是独立的:
P
(
A
B
)
=
P
(
A
)
⋅
P
(
B
)
P(AB)=P(A)⋅P(B)
P(AB)=P(A)⋅P(B)
其中:
- P(AB)是事件 A 和事件 B 同时发生的概率(联合概率)。
- P(A)是事件 A 发生的概率。
- P(B) 是事件 B 发生的概率。
独立性的性质
-
对称性:如果 A 和 B 独立,那么 B 和 A 也独立。
-
传递性:如果 A 与 B 独立,且 B 与 C 独立,那么 A 与 C 独立(仅当这些事件的联合概率分布是乘性的)。
-
零概率事件:任何事件与零概率事件(P(A)=0)总是独立的。
-
对立事件:如果 A 与 B 独立,那么 A 与其对立事件
B ‾ \overline B B
也独立。
定理
1.P(A)>0,P(B)>0,A、B独立的充分必要条件是P(AB)=P(A)⋅P(B)
2.P(A)>0,P(B)>0,互不相容和独立不会同时出现。
证明:
如果A、B互不相容则P(AB)=0,而P(A)P(B)>0,所以A、B不独立
如果A、B独立则P(AB)=P(A)P(B)>0,所以P(AB)>0,从而A、B步互不相容。
例子
设P(A+B)=0.9,P(A)=0.4,求P(B),条件:1.A、B互不相容;2.A、B独立
解:
1.A、B互不相容,则P(AB)=0
P(A+B)=P(A)+P(B)-P(AB),所以0.9=0.4+P(B),得出P(B)=0.4
2.A、B独立,则P(AB)=P(A)P(B)
P(A+B)=P(A)+P(B)-P(AB)=>0.9=0.4+P(B)-0.4P(B)=>P(B)=5/6
2.11 伯努利模型
伯努利模型是一种基础的概率模型,它描述了一个随机试验只有两种可能结果的情况:成功或失败。在伯努利模型中,每次试验只有两个
可能的结果,通常称为成功和失败。这些结果用事件S和事件F来表示,其中S表示成功,F表示失败。伯努利模型的关键特点是每次试验的
结果是相互独立的,即前一次试验的结果不会影响后一次试验的结果,每次试验中成功的概率为p,失败的概率为1-p,并且这些概率对于
每次试验都保持不变。
伯努利模型在概率论、统计学和随机过程等领域中都有重要的应用。例如,在统计学中,可以使用伯努利模型来建立二元数据的模型,比
如用户是否购买产品、是否点击广告等。在风险分析中,伯努利模型可以用来描述某种事件的发生与否,比如是否发生事故、是否发生自
然灾害等。在金融数学中,伯努利模型可以用来模拟股票价格的上涨和下跌情况。
前置概念
- 伯努利试验:
- 伯努利试验是一种特殊类型的随机试验,其结果只有两种可能:成功或失败。
- 伯努利试验的结果是二元的,通常用1表示成功,用0表示失败。
- n重伯努利试验:
- n重伯努利试验是指伯努利试验重复进行n次,每次试验都是独立的。
- 在n重伯努利试验中,每次试验的成功概率相同,通常用p表示,失败概率为1-p。
定义
设试验成功的概率为 p(0<p<1),失败的概率为 1−p,如果在n重伯努利实验中,成功k次的概率参数为 p 的伯努利分布。
伯努利分布的概率质量函数(PMF)为:
P
n
(
k
)
=
C
n
k
p
k
(
1
−
p
)
n
−
k
P_n(k)=C_n^kp^k(1−p)^{n−k}
Pn(k)=Cnkpk(1−p)n−k
其中,k 是成功的次数,
C
n
k
C_n^k
Cnk
是组合数,表示从n次试验中选择k次成功的不同方式。
上述公式也叫做二项概率公式。
该公式可以用于二项式的展开公式,如:
(
a
+
b
)
n
(a+b)^n
(a+b)n
如果用二项概率公式展开:
(
a
+
b
)
n
=
C
n
n
a
n
+
C
n
n
−
1
a
n
−
1
b
+
C
n
n
−
2
a
n
−
2
b
2
+
.
.
.
+
C
n
0
b
n
(a+b)^n=C_n^na^n+C_n^{n-1}a^{n-1}b+C_n^{n-2}a^{n-2}b^2+...+C_n^0b^n
(a+b)n=Cnnan+Cnn−1an−1b+Cnn−2an−2b2+...+Cn0bn
例子
彩票每周开奖一次,假设中奖概率是十万分之一,一个人买了10年520次,求从未中奖的概率。
解:设中奖概率为p=0.000001,则未中奖概率1-p=0.999999,根据伯努利公式:
P
520
(
0
)
=
C
520
0
p
0
(
1
−
p
)
520
=
1
×
1
×
0.99999
9
520
=
0.99948
P_{520}(0)=C_{520}^{0}p^0(1-p)^{520}=1\times 1\times 0.999999^{520}=0.99948
P520(0)=C5200p0(1−p)520=1×1×0.999999520=0.99948