在得知检查结果之前,该种癌症的自然发生率很低,1000人中只有1个人有可能患病;而得知检查结果呈阳性之后,概率骤然提高,20个人中就有1个人有可能患病。这绝对是不容小觑的事情。
在类似以上的推算过程中,如果想要深刻理解后验概率的话,需要每天进行练习。在阅读本书的过程中,请读者朋友们多加练习。
第2讲·小结
1.(借助流行病学数据)设定“癌症”、“健康”的先验概率。
2.设定癌症检查的敏感度。也就是设定癌症患者检查结果为阳性或阴性的条件概率,以及健康人检查结果为阳性或阴性的条件概率(使用治疗数据)。
3.由于检查结果呈“阳性”,因此暂不考虑“阴性”情况。
4.对“癌症&阳性”的概率与“健康&阳性”的概率数值,恢复标准化条件(保持之前的比例关系,使相加结果为1)
5.标准化条件下的“癌症&阳性”的数值,即为检查结果为阳性的患者实际患癌的时候概率(贝叶斯逆概率)。
6.在观察检查结果后,先验概率更新为后验概率(贝叶斯更新)。
练习题
答案参见此处
假设现在是流感流行期,由于高烧而前来医院就诊的患者中,有70%患的是流感,30%患的是普通感冒。通过流感检测工具检查出来的阳性-阴性概率总结于以下表格中。
此时,通过以下步骤来推测,在流感检测工具上显示阳性时患流感的概率,以及显示阴性时未患流感的概率。
各个类别的先验概率分别为,
(a)=()、(b)=()
添加信息后的条件概率分别为,
(c)=()、(d)=()
(e)=()、(f)=()
四种互不相同的情况的概率分别为,
(g)=()×()=()
(h)=()×()=()
(i)=()×()=()
(j)=()×()=()
将观察结果为“阳性”的两种可能性的概率进行标准化处理,则
观察结果为“阳性”的情况下,患“流感”的后验概率=()
将观察结果为“阴性”的两种可能性的概率进行标准化处理,则
观察结果为“阴性”的情况下,患“流感”的后验概率=()