奇书网

奇书网>写给所有人的极简统计学经典语录摘抄 > 第17讲 贝塔分布的性质由两个数字决定(第1页)

第17讲 贝塔分布的性质由两个数字决定(第1页)

第17讲“贝塔分布”的性质由两个数字决定

17-1贝叶斯推理中经常使用的连续型分布——“贝塔分布”

在我们之前介绍的贝叶斯推理中,为实现先验分布而设定的类别是有限的。例如,第1讲中,关于顾客购买商品的推理,分为“来买东西的人”和“随便逛逛的人”两类;第2讲中,癌症检查的结果,分为“癌症”和“健康”两类;第4讲中关于第二胎性别的案例,分为“生女孩的概率为0。4的夫妇”、“生女孩的概率为0。5的夫妇”、“生女孩的概率为0。6的夫妇”这三类。

像上述这样,在有限的类别中进行贝叶斯推理的情况并不少见,但也有很多时候,必须要分为无限个连续的类别才行。例如,第4讲中关于第二胎性别的案例,如果把“生女孩”的概率p仅仅设定为0。4、0。5、0。6这三种的话,显然是不够的。毫无疑问,在这个案例中,概率p的取值范围应该为0≤p≤1。那么,因为类别总共有连续的无限个,所以在设定先验概率时,需要设置为连续型概率分布。

本讲将介绍贝叶斯推理中出现频率很高的“贝塔分布”。理解“贝塔分布”,需要用到微分、积分等难度较大的数学知识,而本书在讲解时会尽量避免这种方式,而是采用直观的图解方法来进行说明。

17-2何为“贝塔分布”

首先介绍“贝塔分布”这一概率分布的概念。从计算公式入手来看:横轴x代表基本事件的数值,纵轴y代表概率的密度。上一讲中已经讲过,概率密度是指“乘以区间的长度后可以转化为概率的量”。

贝塔分布可以用以下公式来表达:

y=(常数)×xα-1(1-x)β-1(0≤x≤1)…(1)

出现在指数部分α和β,应为大于1的自然数,它用来决定贝塔分布的种类。换言之,如果赋予α和β具体的数值,就能够决定一次贝塔分布。当α、β为较小的数值时,贝塔分布的图表为相对简单的模型;反之,当α、β为较大的数值时,贝塔分布的图表则为比较复杂的模型。另外,写着“常数”的部分,是为了使标准化条件(所有事件的概率之和为1)成立,而进行了调整的数值,因此在贝叶斯推理中并不是那么的重要。

接下来,我们通过几个例来理解。

例1:α=1,β=1时,

x0=1,也就是“任何非零数的零次幂为1”。(1)式为

y=(常数)×x0(1-x)0=(常数)×1×1=(常数)(0≤x≤1)

y=(常数)的图像是一条与x轴平行的线段,这与上一讲中的[0,1]-赌盘模型相一致。并且,从标准化条件来考虑的话,(常数)必须为1。于是也可以用以下的(2)式来表达(图表17-1)。

y=1(0≤x≤1)…(2)

例2:α=2,β=1时,

根据上面的(1)式,

y=(常数)×x1(1-x)0(0≤x≤1)

可以得出:

y=(常数)x(0≤x≤1)…(3)

为一次函数,如图表17-2所示,函数的图像为一条向右上方延伸的线段。这里(常数)=2,原因将会在17-4中予以说明。

例3:α=1,β=2时,

根据上面的(1)式,

y=(常数)×x0(1-x)1(0≤x≤1)

可以得出:

y=(常数)(1-x)(0≤x≤1)…(4)

同样为一次函数,如图表17-4所示,函数的图像为一条向右下方延伸的线段。这里(常数)=2,原因将会在17-5节中予以说明。

例4:α=2,β=2时,

根据上面的(1)式,

y=(常数)×x1(1-x)1(0≤x≤1)

可以得出:

y=(常数)×x(1-x)(0≤x≤1)…(5)

为二次函数,如图表17-5所示,函数的图像为抛物线的一部分。这里(常数)=6,原因将会在17-6节中予以说明。

接下来,将对这些例子逐一进行详细说明。

17-3α=1,β=1的例子即为[0,1]-赌盘模型

17-2中已经解说过,α=1、β=1时的贝塔分布,也就是是[0,1]-赌盘模型(均匀分布的一种)。反过来可以说,[0,1]-赌盘模型是贝塔分布的一种,如图表17-1所示。

图表17-1α=1,β=1的贝塔分布的概率分布图

17-4α=2,β=1的例子

热门小说推荐

最新标签