概率模型常用概率律#
基本概率公理和例子#
第一节的大部分内容涉及我们之前学过的知识,例如概率值介于0到1之间,概率不能为负数等。这里列举了一些明显的概率学公理的应用示例。这些公理简单明了,是我们学习所有概率计算的出发点。
公理1:非负性#
对于任何事件 A,其概率是非负的,即:
P(A)≥0公理2:归一性#
整个样本空间 Ω 的概率为1:
P(Ω)=1公理3:可加性#
对于任何两个互斥事件 A 和 B(即 A∩B=∅),它们的概率之和等于它们并集的概率:
P(A∪B)=P(A)+P(B)应用实例#
以掷骰子为例,考虑事件 A 为掷得的点数大于4(即出现5或6),事件 B 为掷得点数为奇数(即1、3、5)。根据概率公理,我们可以计算这些事件的概率,以及它们的交集和并集的概率等。
例1:硬币抛掷#
依次抛掷三枚硬币,实验结果是由正面和反面组成的长度为3的序列。样本空间为:
Ω={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT}假定上述8种结果的可能性是相同的,即每一个结果的概率为1/8。考虑事件A,即”两个正面向上,一个反面向上”:
A={两个正面向上,一个反面向上}={HHT,HTH,THH}利用概率的可加性公理,事件A的概率等于组成该事件的试验结果的概率之和:
P({HHT,HTH,THH})=P({HHT})+P({HTH})+P({THH})=81+81+81=83.例2:连续概率 - 罗密欧与朱丽叶#
罗密欧和朱丽叶约定在某时刻见面,而每个人到达约会地点的事件都会有延迟,延时时间在0~1小时。第一个到达约会地点的人会在那儿等待15分钟,如果15分钟内对方还不来,则两人无法相见。问他们能够相会的概率有多大。#
答:考虑单位正方形 Ω=[0,1]×[0,1] ,正方形中的每个点的两个坐标分别代表他们可能的延迟时间。每个点都可以是他们的延迟时间,而且是等可能的。由于等可能性的特点,我们将 Ω 的子集出现的概率定义为这个子集的面积。他的概率为 7/16。
德摩根定律De Morgan定律#
(A∩B)C=AC∪BC(A∪B)C=AC∩BC更加一般的形式:
(n⋃Sn)C=n⋂SnC,(n⋂Sn)C=n⋃SnC条件概率#
条件概率定义#
例1.6:在连续三次抛掷一个两面均匀的硬币实验中,我们希望找到 P(A∣B) ,其中 A,B 为:
A={正面出现的次数比反面多的次数}B={第一次抛掷得到正面}样本空间由下列实验结果组成:
Ω={HHH,HHT,HTH,HTT,THH,THT,TTH,TTT}事件B由 {HHH,HHT,HTH,HTT} 组成,所以:
P(B)=84事件 A∩B 为 {HHH,HHT,HTH} ,概率为:
P(A∩B)=83所以:
P(A∣B)=P(B)P(A∩B)=4/83/8=43由于所有的试验结果是等概率的,我们也可以用简化的算法计算 P(A∣B) ,我们不必计算 P(B) 和 P(A∩B) 而直接计算事件 A∩B 中B中的基本事件个数(分别等于3和4),相比即可的3/4。
全概率定理与贝叶斯准则#
全概率定理#
全概率定理,也被称为切面包定理,是对整个样本空间进行分割的一个方法。全概率定理的形象化展示和证明如下:
假设事件 (A_1, A_2, \cdots, A_n) 形成样本空间的一个分割,事件 (B) 可以分解成不相交的 (n) 个事件的合并,即:
B=(A1∩B)∪⋯∪(An∩B)利用可加公理,我们得到:
P(B)=P(A1∩B)+⋯+P(An∩B)利用条件概率的定义,我们有:
P(Ai∩B)=P(Ai)P(B∣Ai)因此:
P(B)=P(A1)P(B∣A1)+⋯+P(An)P(B∣An)例1.13:棋类比赛的概率计算#
你参加一个棋类比赛,其中50%是一类棋手,他们赢的概率为0.3,25%为二类棋手,赢他们的概率为0.4,剩下为三类棋手,你赢他们的概率为0.5。从他们中任选一位跟你PK,你的胜算概率为:
P(B)=P(A1)P(B∣A1)+P(A2)P(B∣A2)+P(A3)P(B∣A3)=0.5×0.3+0.25×0.4+0.25×0.5=0.375贝叶斯准则#
贝叶斯公式是一个非常强大的工具,可以用来从给定的结果推断原因。假设事件 (A_1, \cdots, A_n) 是原因,而 (B) 是由这些原因引起的结果。贝叶斯公式表达为:
P(Ai∣B)=∑k=1nP(Ak)P(B∣Ak)P(Ai)P(B∣Ai)例1.16:雷达探测问题#
假设雷达探测到飞机的成功率为99%。若没有飞机,雷达以10%的概率虚假报警。假设一架飞机以5%的概率出现在该地区。雷达报警且飞机确实出现的概率为:
P(A∣B)=P(A)P(B∣A)+P(Ac)P(B∣Ac)P(A)P(B∣A)=0.05×0.99+0.95×0.100.05×0.99≈0.3426例1.18:假阳性之谜#
对于某种少见病的检测,如果一个人有病,阳性的概率为0.95; 如果没有病,阴性的概率也是0.95。现在假定某一人群中患病的概率为0.001,一个阳性的检测结果表明这个人患病的概率为:
P(A∣B)=P(A)P(B∣A)+P(Ac)P(B∣Ac)P(A)P(B∣A)=0.001×0.95+0.999×0.050.001×0.95=0.0187这个示例显示,即使检测结果为阳性,该人真正患病的概率也只有1.87%。