奇书网

奇书网>简单统计学 一本正经的胡说八道 > 第4讲 运用概率的概率拓宽推理范围(第2页)

第4讲 运用概率的概率拓宽推理范围(第2页)

4-4第一胎已经生了女孩,因此可以排除掉“不可能的情况”

目前的事实是,这对夫妇“第一胎生了女孩”。因此,第一胎生男孩这种情况被完全排除在外,这一情况反映在图表4-5中,如下所示。

图表4-5根据信息限定可能性

现在已知,这对夫妇所生的第一个孩子是女孩,那么可能性便从6种减少到3种。换言之,这对夫妇属于3种情况中的其中一种。接下来,与之前一样,在保持原有的比例关系的基础上,使相加之和为1,恢复到标准化条件。

(左边长方形的面积):(中间长方形的面积):(右边长方形的面积)

=0。43:0。53:0。63

=0。4:0。5:0。6

=4:5:6

计算比例时,用4+5+6=15这一数字来进行除法运算,使之恢复到“相加之和为1”的状态。

(左边长方形的面积):(中间长方形的面积):(右边长方形的面积)

=415:515:615

=415:13:25

根据上述比例可计算出,后验概率为:

概率为p=0。4的后验概率=415≈0。27

概率为p=0。5的后验概率=13≈0。33

概率为p=0。6的后验概率=25=0。4

4-5贝叶斯推理的过程总结

本讲中介绍的推理方法可用图解总结为图表4-6。

图表4-6关于该夫妇类别的贝叶斯推理过程

从求取类别p的后验概率的过程中,我们能够明白些什么呢?只要看一看关于先验概率和后验概率的图表4-7,就能够自然而然地明白了。

图表4-7关于该夫妇类别的贝叶斯更新

从该图解可以了解到:在生女孩之前,我们可以认为这3个类别的可能性都是对等的,概率分配均为0。33。但是,由于之后增加了“生了女孩”的信息,后验概率就变得不再对等了。p=0。5这一概率虽然仍为0。33,但p=0。4这一概率由0。33减少到0。27,而p=0。6这一概率则由0。33上升到0。4。即,与在增加“生了女孩”这个信息前相比,增加“生了女孩”这个信息之后,推算结果转变为“这对夫妇生女孩相对比较容易”。

接下来,需要指出的是,在这个案例中,客观概率与主观概率实际上是混在一起的。表示类别的概率p是一个客观概率。p=0。4的含义可以解释为:譬如由这对夫妇来投一枚硬币,正面朝上的概率为0。4,而他们抛出了结果为“女孩”,即概率为0。4的这一面。这个结果对于任何人来说,都是一个客观的概率。另一方面,先验概率和后验概率是依存于推算者心理的主观概率。其实,只要想起,最初是通过“理由不充分原理”,把先验概率设定为“对等”的事实,就很容易想通了。“只能先这么办了,暂时就先设定为对等吧”,这也意味着“概率”其实也是一种基于个人心里的想法,用“主观”本身这个词来解释这一现象,应该还是比较贴切的吧。

4-6在计算“第二胎生女孩的概率”时,使用“期待值”

我们通过计算得到的后验概率为:

(类别p=0。4的后验概率)=0。27

(类别p=0。5的后验概率)=0。33

(类别p=0。6的后验概率)=0。4

以上数值为各个类别的概率,换言之,也就是“概率的概率”。数值分为3部分、内容详细,十分难得。但是,它并不能作为“第二胎生女孩的概率是多少”这个问题的答案。于是,让我们最后再来了解一下该如何回答这个问题吧。

在求“这对夫妇第二胎生女孩的概率”时,需要用到“平均值”这一概念。由于这也是概率方面的平均值,专业上把这个数值称为“期待值”。关于期待值的具体内容将会在第18讲进行详细介绍,在这里暂且用图解的方式,对其含义进行简单说明。

首先,在表示所有可能发生的情况(生了女孩的情况)的长方形中,画出填入了后验概率的图。这个图由3个长方形构成的。左边的长方形:纵向长度为类别p=0。4、横向长度为其后验概率0。27。正中的长方形:纵向长度为类别p=0。5、横向长度为其后验概率0。33。右边的长方形:纵向长度为类别p=0。6、横向长度为其后验概率0。4。因此,各个长方形的面积如下:

左边的长方形→0。4×0。27=0。108

正中的长方形→0。5×0。33=0。165

右边的长方形→0。6×0。4=0。24

对于这3个长方形,需要画出一个使横向长度之和与面积之和一致的长方形,即虚线长方形。这个长方形,横边的长度刚好等于1。其理由是,由于3个长方形的横边长度为各类别的后验概率,根据标准化条件进行相加,其结果为1。因此,虚线长方形的纵向边长的长度,与3个长方形的面积之和完全一致。这是“把类别平均化的数值”,即为“类别的期待值”(图表4-8)

图表4-8计算类别的平均值

具体的计算过程如下所示:

热门小说推荐

最新标签