条件概率

中文名条件概率

表示 P(A|B)

计算决策树

目录导航

基础定义

设 A 与 B 为样本空间 Ω 中的两个事件，其中 P(B)>0。那么在事件 B 发生的条件下，事件 A 发生的条件概率为：

条件概率有时候也称为：后验概率。

举例说明

条件概率的谬论是假设P（A|B）大致等于P（B|A）。数学家John Allen Paulos在他的《数学盲》一书中指出医生、律师以及其他受过很好教育的非统计学家经常会犯这样的错误。这种错误可以通过用实数而不是概率来描述数据的方法来避免。

P（A|B）与P（B|A）的关系如下所示：

。

下面是一个虚构但写实的例子，P（A|B）与P（B|A）的差距可能令人惊讶，同时也相当明显。

若想分辨某些个体是否有重大疾病，以便早期治疗，我们可能会对一大群人进行检验。虽然其益处明显可见，但同时，检验行为有一个地方引起争议，就是有检出假阳性的结果的可能：若有个未得疾病的人，却在初检时被误检为得病，他可能会感到苦恼烦闷，一直持续到更详细的检测显示他并未得病为止。而且就算在告知他其实是健康的人后，也可能因此对他的人生有负面影响。

这个问题的重要性，最适合用条件概率的观点来解释。

假设人群中有1%的人罹患此疾病，而其他人是健康的。我们随机选出任一个体，并将患病以disease、健康以well表示：

，。

假设检验动作实施在未患病的人身上时，有1%的概率其结果为假阳性（阳性以positive表示）。意即：

，而且。

最后，假设检验动作实施在患病的人身上时，有1%的概率其结果为假阴性（阴性以negative表示）。意即：

且。

现在，由计算可知：

是整群人中健康、且测定为阴性者的比率。

是整群人中得病、且测定为阳性者的比率。

是整群人中被测定为假阳性者的比率。

是整群人中被测定为假阴性者的比率。

进一步得出：

是整群人中被测出为阳性者的比率。

是某人被测出为阳性时，实际上真的得了病的概率。

这个例子里面，我们很轻易可以看出P(positive|disease)=99%与P(disease|positive)=50%的差距：前者是你得了病，而被检出为阳性的条件概率；后者是你被检出为阳性，而你实际上真得了病的条件概率。由我们在本例中所选的数字，最终结果可能令人难以接受：被测定为阳性者，其中的半数实际上是假阳性。