奇书网

奇书网>博弈论每个人都能成为决策高手蒋文华TXT > 第13章 囚犯困境 没人愿意坐以待毙(第2页)

第13章 囚犯困境 没人愿意坐以待毙(第2页)

对于囚犯困境的原因,人们一般理解为参与人对于自身利益的追求。每个囚犯选择坦白的目的是自己能够少坐牢。如果每个囚犯不是从自己的利益考虑,而是能够为别人的利益考虑,哪怕自己多坐牢也要让对方先出去,那么无论对方选择什么,自己都会选择抗拒,最后的结果就是双方都选择抗拒,博弈的均衡结果是每个人都只坐半年牢。

囚犯困境之所以是一种困境,就在于如果每个人都想少坐牢,选择了坦白,结果是多坐牢;每个人都想多坐牢,选择了抗拒,反而可以少坐牢。博弈的结果违背了博弈的初衷,即事与愿违。

如果我们把囚犯困境的原因归结为囚犯对自身利益的追求(追求自身利益最大化),那么要想避免出现囚犯困境,就应该把囚犯们改造成“毫不利己、专门利人”的人,这几乎是不可能的。因此,表面上看是囚犯对自身利益最大化的追求导致了囚犯困境的产生。其实,真正的原因是:囚犯们在追求自身利益最大化的同时,以更多地损害他人利益为代价。换句话说,就是个人行为的负外部性。这里的关键,不在于囚犯们追求自身利益最大化出了问题,而在于通过什么方式追求自身利益的最大化。

表13。4给出了一个真正意义上的“坦白从宽,抗拒从严”的博弈结果,我称之为“囚犯乐境”。从表13。4中可以看出,两个人都坦白,每个人坐半年牢,两个人都抗拒,每个人坐3年牢,一个坦白一个抗拒,坦白的释放,抗拒的坐5年牢。从四种结果看,只要坦白一定从宽,抗拒一定从严,那么每个人的占优策略是,无论对方坦白还是抗拒,我都选择坦白,由此所形成的占优策略均衡是双方都坦白,这是一个对双方来说最好的结局,每个人只要坐半年牢。

表13。4 囚犯乐境

和表13。2中的四种结局相比,在表13。4中,每个囚犯选择坦白所带来的收益增加是以对方收益的较少减少为代价的。当B选择坦白时,A选择抗拒会坐5年牢,选择坦白会坐半年牢,所以,当A从抗拒变成了坦白时,可以让自己少坐4年半牢,而B会因此多坐半年牢,即从不坐牢变成了坐半年牢;当B选择抗拒时,A选择抗拒会坐3年牢,选择坦白就可以被释放,所以,A从抗拒变成坦白时,可以让自己少坐3年牢,而B会因此多坐2年牢,即从3年牢变成5年牢。这类似于,我采取行动A让自己得到10元的收益,会让你损失5元的收益。同样,你采取行动A也会让自己得到10元的收益,并让我损失5元的收益。那么,当我们都选择行动A,每个人都增加了5元收益。

在表13。2所描述的囚犯困境中,我采取行动A让自己得到5元的收益,会让你损失10元的收益。同样,你采取行动A也会让自己得到5元的收益,并让我损失10元的收益。那么,当我们都选择行动A时,每个人都损失了5元收益。

正是这两者之间的差别导致了在表13。2的描述中,每个人的理性选择导致了“囚犯困境”,在表13。4的描述中,每个人的理性选择并没有导致囚犯困境的出现,甚至出现了“囚犯乐境”。

当然,囚犯困境并不需要囚犯每次选择时都一定让对方遭受更多损失。但是,总损益比较一定是这样的:表13。5给出了另一种博弈结果,当B选择坦白时,A选择坦白相比抗拒会让自己少坐4年牢,B会因为A的选择多坐2年牢,但是,当B选择抗拒时,A选择坦白相比抗拒会让自己少坐1年牢,B却因此需要多坐5年牢。简单加总后,A选择坦白与选择抗拒相比可以少坐5年牢,B因为A选择坦白会多坐7年牢。相对于双方都抗拒,双方都坦白的结果是使各自都多坐了1年牢,总共多坐了2年牢。

表13。5 另一种囚犯困境

以上分析给了我们一个非常重要的启示:损人利己和损己利人本质上是一样的,是一个硬币的正反两面,在一方看来是损人利己的行为,在另一方看来就是损己利人的行为,损人利己和损己利人都有可能导致社会总福利水平的增加和减少。问题的关键是所损失的部分和所得到的部分哪个更多!由此,我们可以理解为什么不应该倡导未成年人勇斗歹徒的行为,也可以理解人们为什么会强烈谴责那些见死不救的行为(特别是在不会危及施救人员生命的情况下)。

如何走出囚犯困境

基于对囚犯困境的原因分析,人类要想走出囚犯困境,可以从以下三方面入手。

第一,要想走出囚犯困境,请努力修改游戏规则。之前的分析告诉我们,如果我们的游戏规则是真的,“坦白从宽,抗拒从严”,那么大家都坦白就不再是一种困境。环境污染也是一种囚犯困境,如果对环境污染征收高额的税收去补贴改善环境的行为,那么保护环境就是每个人的占优策略均衡。

第二,要想走出囚犯困境,请寻求道德的力量。德国著名哲学家康德曾言,有两样东西,我对它们的思考越是深沉和持久,它们在我心灵中唤起的惊奇和敬畏就会日新月异,不断增长,一是我们头顶浩瀚灿烂的星空,二是我们心中崇高的道德法则。这段话告诉我们,当一个人与社会中的其他人打交道时,必须遵守相应的道德准则。如果没有某种道德准则来约束人类的行为,那么人类社会和动物世界就没有了任何区别。

强烈的道德感会让每个博弈的参与者把对方的损益也看作自己损益的一部分。这样一来,你就不会为了让自己多赚1元钱而让他人损失10元钱了。总之,一个群体的道德感越强,越不容易出现囚犯困境。道德感让人类超越了动物世界的丛林法则。

第三,要想走出囚犯困境,请借助于历史的记忆。在重复博弈中,每个参与者都拥有报复或报答的机会。这意味着每个人在博弈的时候都需要考虑未来的收益,而不能只顾眼前的利益。就算没有重复博弈,人类也可以借助于历史记忆,并把对历史的记忆转化为对未来的想象。

本章小结

1。囚犯困境描述的是这么一种博弈类型:每个人追求自己利益最大化的行为选择,导致双方利益最终被损害。

2。囚犯困境的原因在于:每个人让自己利益增加,是以他人利益的更大损失为代价。

3。囚犯困境给了我们一个非常重要的启示是:博弈的均衡结果和事实的真相无关,只取决于博弈的规则!

4。走出囚犯困境的途径包括制度创新、道德教化、历史记忆和不断地重复博弈。

考考你

为什么说经济危机也是一种囚犯困境?

热门小说推荐

最新标签