奇书网

奇书网>博弈论每个人都能成为决策高手蒋文华TXT > 第16章 猜谜博弈 散户如何赢庄家(第1页)

第16章 猜谜博弈 散户如何赢庄家(第1页)

第16章 猜谜博弈:散户如何赢庄家

猜谜博弈

我们来玩一个这样的游戏,在一张白纸上写上一个字,这个字可以写的是“黑”,也可以写的是“白”,我写好后,你来猜这个字。如果我写“黑”被你猜对了,我给你15元。如果我写“白”被你猜对了,我给你5元。如果我写“黑”你猜“白”或我写“白”你猜“黑”(总之只要是你猜错了),你都给我10元(见表16。1)。你觉得你猜对的可能性是大于50%、等于50%还是小于50%?我想,你的答案一般会是等于50%。但正确答案却是你猜对的可能性大于50%。这是为什么呢?原因后续揭晓。

表16。1 猜谜游戏

既然你猜对的可能性会大于50%,那么这个游戏对你我来说公平吗?所谓的公平游戏,就是指双方在博弈中各自的期望收益都是0。也就是说,我们一起玩了100次或1000次以后,理论上两个人应该是不输不赢的。如果你觉得这是一个公平的游戏,或者是对你更有利的游戏(因为你猜对的概率大于50%)。那么,我现在就告诉你,这个游戏对你是不公平的,你会吃亏,并且玩的次数越多,你会亏得越多。此时的你,内心是不是充满了疑惑?那就让我们来揭示猜谜博弈背后的玄机。

纯策略和混合策略

首先介绍两个非常重要的概念:纯策略和混合策略。

如果一个策略规定参与者在每一个给定信息情况下只选择一种特定的行动,我们称该策略为“纯策略”。

如果一个策略规定参与者在给定信息情况下,以某种概率分布随机地选择不同的行动,我们称该策略为“混合策略”。

比如“人不犯我,我不犯人;人若犯我,我必犯人”是一个纯策略。“人不犯我,我80%的可能性不犯人;人若犯我,我90%的可能性会犯人”就是一个混合策略。

当然,每个纯策略其实都是一个“退化”的混合策略,某一特定纯策略的概率为1,其他的则为0。完全的混合策略对每个纯策略都分配了一个不为零的概率。

举一个复杂一点的混合策略案例。在前面“万元陷阱”那一章中,我提到竞技体育就是一个典型的“万元陷阱”。很多运动员为了拿冠军,不惜使用兴奋剂。为了竞赛的公平性和出于保护运动员身体的考虑,国际奥委会在体育比赛过程中会进行兴奋剂检测(dopingtrol)。

兴奋剂检测是指赛前、赛后甚至平时,各级体育组织派专门的检测人员对运动员进行检测,以确定其是否使用了违禁物质或违禁方法。兴奋剂检测有尿液和血液两种取样方式。尿检是主要方式,而血检只是作为一种辅助手段,被用来对付那些在尿样中难于检测的违禁物质和违禁方法。

在体育竞赛开始前,检测机构与有关单项体育联合会和竞赛组委会进行磋商,确定接受检查运动员的数量及挑选受检运动员的方法。选定受检运动员一般以比赛名次、是否破纪录或抽签结果作为取舍标准,也可根据特殊情况任意指定运动员接受检测。

通常采用的办法有以下几种:

1。获得各项目第一名或前几名的运动员必须受检;

2。获得各项目第一名的必须受检,第二至第八名抽检;

3。从各项目的优胜者(如决赛前八名)中以抽签方式决定抽检几人;

4。从各项目的全体参赛者中,以抽签方式决定抽检几人;

5。在集体项目中,从各队中以抽签方式决定各抽检几人;

6。在有纪录的竞赛项目中,凡破世界纪录、洲纪录、全国纪录或运动会纪录者必须受检。

兴奋剂检测除了在比赛时期进行随机抽检以外,还在非比赛时期进行随机抽检,这就是所谓的“飞行检查”。“飞行检查”主要是针对著名运动员和在短期内成绩大幅提高的运动员。由于“飞行检查”的突然性,它已成为当前国际反兴奋剂斗争的“撒手锏”。

例如,国际田联在1993年对27个国家或地区进入世界前20名的优秀运动员进行了476人次的“飞行检查”,其中20人使用了违规药物,占比4。2%。而同年国际田联在比赛期间检查的违规比例仅为0。6%。(1)不难看出,“飞行检查”更能如实反映运动员使用兴奋剂的情况。

随机抽检也会带来一个问题,即一些服药的运动员幸运地“逃脱”了。这会带来事实上的不公平。例如,张三骑车闯红灯,被警察逮了个正着,罚款50元。张三振振有词地争辩道:“那么多人都在闯红灯,为什么你只罚我一个?”警察问:“会钓鱼吗?”张三答:“会。”警察说:“池塘里那么多条鱼,为什么你只钓那几条?”

鉴于随机抽检所带来的不公平问题,经常有人建议,应该对所有参赛的运动员进行兴奋剂检测。我认为,现在还没这么做的原因主要是出于检测成本方面的考虑。在后续有关税收检查的博弈分析中,我们就会发现检查成本严重影响抽查的概率。当然,如果以后兴奋剂的检测成本能够大幅度下降的话,也可能真的会对每位参赛运动员(至少是每位进入决赛的运动员)进行兴奋剂检测。

如果你已经认真学习完前面的内容,你一定会发现,在完全没有兴奋剂检测的情况下,每个运动员都服用兴奋剂是一个占优策略纳什均衡,并且是一个典型的“囚犯困境”。对任何一位运动员来说,只要他想在比赛中获胜,无论其他运动员是否服用兴奋剂,自己服用兴奋剂一定是占优策略。

进一步看,如果兴奋剂检测不是百分之百进行,这必然会给运动员带来侥幸心理,即希望自己成为一个通过服用兴奋剂获胜的幸运儿。当然,运动员也不会每次都服用兴奋剂,那样被抓住的可能性就太大了。因此,国际奥委会和运动员之间博弈的必然结果是,奥委会以某种概率进行随机检测,运动员以某种概率服用兴奋剂,并由此形成一个混合策略纳什均衡。

如果一个混合策略组合使任何一个参与人的混合策略都是相对于其他参与人的混合策略的最佳策略,这组混合策略就构成一个混合策略纳什均衡。

求解猜谜游戏

当我们理解了混合策略和混合策略纳什均衡以后,就可以具体求解一开始提到的那个猜谜游戏了。

这是一个对我有利,对你不利的游戏。在这个游戏中,我们两个人每玩一次,我的期望收益是0。625元,你的期望收益是-0。625元。具体的分析和计算过程分以下6点展开。

1。在猜谜游戏中,我不可能每次都写“黑”或写“白”。如果我每次都写“黑”,你肯定会每次都猜“黑”;如果你每次都猜“黑”,我肯定会每次都写“白”;如果我每次都写“白”,你肯定每次都猜“白”;如果你每次都猜“白”,那我肯定每次都写“黑”。我们绕了一圈后不难看出,在这个猜谜游戏中,我们双方都不会只采取一种纯策略,而是会采取混合策略。我有时写“黑”,有时写“白”;你有时猜“黑”,有时猜“白”。

2。进一步看,我写“黑”或写“白”不可能是随机的。也就是说,我不会50%的概率写“黑”,50%的概率写“白”。因为,同样是被你猜中,我的损失不一样(写“黑”被你猜中,我损失15元;写“白”被你猜中,我只损失5元)。所以,你一定会想到我写“黑”的次数会比写“白”的次数要少。

3。接下来我们需要把我写“黑”的概率计算出来,把你猜“黑”的概率也计算出来。具体的计算过程是先计算期望收益,再计算出在期望收益最大化的情况下,我会选择写“黑”的概率,以及你会选择猜“黑”的概率。

4。计算双方的期望收益。先假设我选择写“黑”的概率是α,选择写“白”的概率是1-α,你猜“黑”的概率是β,你猜“白”的概率是1-β。我的期望收益(用Π我表示)是:

Π我=(-15)αβ+10α(1-β)+10(1-α)β+(-5)(1-α)(1-β)

你的期望收益(用Π你表示)是:

热门小说推荐

最新标签