图表1-10有关顾客类别的贝叶斯更新
看这个图表便可了解到,在没有观察到任何行为时,面前的顾客是“来买东西的人”的概率为0。2(先验概率),但观察到“上前询问”这一行为之后,数值便更新为约0。43(后验概率)。也就是说,虽然并不能断定这位顾客就是“来买东西的人”,但这一结果的可能性提高到了以前的两倍,这便是“贝叶斯更新”。
在本书中,上述过程称为“贝叶斯推理”。贝叶斯推理可以总结为:通过观察行动(信息),将先验概率通过贝叶斯更新,转换为后验概率。在本书中,每个案例中进行的推算称为“贝叶斯推理”,而将这些案例中的推算方法整合起来,便是“贝叶斯统计学”。
第1讲·小结
1.设定两个类别(“来买东西的人”和“随便逛逛的人”)的概率(先验概率)。
2.设定类别“来买东西的人”“上前询问”以及“不上前询问”两种行为的概率,和“随便逛逛的人”“上前询问”以及“不上前询问”的概率(条件概率)。这需要一定的经验和数据作为支撑。
3.因为观察到了“上前询问”的行为,因此,可以排除掉“不上前询问”的可能性。
4.使“来买东西的人上前询问”的概率和“随便逛逛的人上前询问”的概率组合,满足标准化条件。也就是说,在保持比例关系的前提下,使其相加之和等于1。
5.还原标准化条件后的“来买东西的人”的概率,也就是观察到“上前询问”行为后,判断“来买东西的人”类别的后验概率。
6.根据观察到的行为,先验概率更新为后验概率。这就是贝叶斯更新。
练习题
答案参见此处
第一次练习,我们先做一个设定全部相同,只改变数值的练习吧。
先验概率的设定
顾客中,“来买东西的人”的比例占全体的40%(0。4),“随便逛逛的人”的比例占全体的60%(0。6)。
有关信息的条件概率的设定
下表提供了各类别的“上前询问”和“不上前询问”的条件概率。
按以下顺序,求观察到“上前询问”这一行为后,“来买东西的人”的后验概率。
各个类别的先验概率分别为,
(a)=()、(b)=()
添加信息后的条件概率分别为,
(c)=()、(d)=()
(e)=()、(f)=()
四种互不相同的情况的概率分别为,
(g)=()×()=()
(h)=()×()=()
(i)=()×()=()
(j)=()×()=()
在观察到“上前询问”的2种情况中,恢复标准化条件,则
观察到“上前询问”的情况下,该顾客为“来买东西的人”的后验概率=()