奇书网

奇书网>博弈智能 > 第二章 困境博弈 两难境地如何选择(第1页)

第二章 困境博弈 两难境地如何选择(第1页)

第二章 困境博弈:两难境地如何选择

谈博弈就必须从囚徒困境谈起,囚徒困境是我们每个人都会在生活中碰到的,如何解决囚徒困境,如何让博弈的最终利益最大化,值得我们探讨和思考。

为什么会互相背叛

囚徒困境反映了个人理性和集体理性的矛盾。

在生活中,不乏有很多囚徒困境的例子。比如有这样一个经典的故事:

两个旅行者麦克和约翰从一个以出产瓷器的著名旅游胜地回来时,他们各买了一个瓷花瓶。提取行李时,发现花瓶被打破了。他们向航空公司索赔。

航空公司估计花瓶的价格在八九十元左右,但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内自己写下花瓶价格。若两人所写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人所写的不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。

如果两人都写100元,他们都会获得100元。但是,给定约翰写100元,麦克改写99元,则他会获得101元。约翰又想,若麦克写99元,他自己写98元,比写100元好,因为这样他获100元,而自己写100元,当麦克写99元时自己却只获97元。而给定约翰写98元,麦克又会写97元……这样,最后落得两个人只写1元的境地。

双输,这往往就是囚徒困境带来的结果。

再有,一个小镇政府有一个为期一年的采购计划,每个月采购一批饮料。如果小镇上的两家饮料公司的报价一致,那么政府就把订单一分为二。否则,政府会把更多的订单给报价低的那个公司。显然,这两家公司都报出同样的高价,才符合其利益。在这种多次博弈中,他们会联合起来出高价吗?如果会,那么在一年12次的博弈中他们会合作几次呢?

假如他们开始签订了合约,都报出一个比较高的价位。不过,显然最后一次他们不需要遵守合约,因为反正以后没有采购计划了,违约也不会有什么坏处。如果是这样,倒数第二次也不需要遵守合约,因为不论怎样倒数第一次都是要违约的,那就不存在是否有惩罚的问题。所以倒推下来,一次合约都不用遵守。两家公司最后可能还是两败俱伤。

如果你有兴趣,还可以做一个实验:选定几个人,让他们都猜一个数字,必须是1~100的整数。条件是谁最接近所有实验者的所猜数字平均值的1/3,谁就可以得到100块钱。

这个时候,每个人都会想:如果一开始其他人都是随机地选择数字,50就会是所有人的猜测。这个时候,猜50的1/3也就是大约17可能会赢。然而,每个人都会猜到17这个数字的时候,大家就会猜测17的1/3,也就是6左右。依次类推,这个游戏中的每一个人最终猜测的结果是唯一最小的数字,那就是1。

囚徒困境反映了个人理性和集体理性的矛盾。如果甲和乙都选择抵赖,各判刑1年,显然比都选择坦白各判刑10年好得多。当然,甲和乙可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。

因为这种协商,并不会影响他们在被审讯的时候所做的决策。虽然有了协议,但乙还是不敢确信甲是否会出卖自己,并且不论甲是否背叛协约,出卖对方肯定是有好处的。反过来甲是这么想的,所以到最后他俩还是会同时出卖对方。

囚徒困境与懦夫困境

一旦陷入“囚徒困境”,任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。

囚徒困境中,从一个故事的角度,为两个囚徒不能合作很可惜。然而在现实生活中,我们都巴不得他们互相指认,否则罪犯就逃脱了法律制裁。其实我们完全可以把囚徒困境作为自己的一种行为策略。

假设你正作为一名士兵身处战场,在战场上遇到了敌军。如果你不怎么爱国,那么活命是你的最高目标。

在战斗打响时,避免成为炮灰的最好办法就是逃跑,让其他人留下来战斗。

当然,假如你这边的其他人也跟着逃跑,那么你的逃跑就更显得明智了,因为当敌军打到你们这边时,你一定不希望只剩下自己在战斗。

因此,不管其他人怎么做,逃跑都是你所能采取的最佳策略。

但是,假如你这边的每个人都逃跑,那么你们大概就只有全军覆没了。

在这种情况下,类似囚徒困境的“懦夫困境”就出现了。

假如你这边的每个人都逃跑,敌军很容易就能把你们一举擒获并加以歼灭。因此,与其每个人都逃跑,不如每个人都留下来更有利。

就个人而言,懦弱一点比较有利;就团体而言,勇敢一点对大家都好。古时部队就有打破这个懦夫困境的方法:在大部分的军队中,假如有士兵在战斗时逃跑,会被就地正法。因此,退缩就会被处决的压力反而对士兵更有帮助,因为这等于帮他们破解了懦夫困境。

古罗马有这样的军规,军队排成直线向前推进的时候,任何士兵,只要发现自己身边的士兵开始落后,就要立即处死这个临阵脱逃者。为使这个规定更可靠,未能处死临阵脱逃者的士兵也会被判处死刑。这么一来,一个士兵宁可向前冲锋陷阵,也不愿意回头捉拿一个临阵脱逃者,否则就有可能赔上自己的性命。

罗马军队这一军规的精神直到今天仍然存在于西点军校的荣誉准则之中。该校的考试无人监考,作弊属于重大过失,作弊者会被立即开除。不过,由于学生们不愿意“告发”自己的同学,学校规定,发现作弊而未能及时告发,同样违反荣誉准则,也会被开除。所以一旦发现有人违反荣誉准则,学生们就会举报,因为他们不想由于自己保持缄默而成为违规者的同伙。

巧用囚徒困境降低博弈成本

囚徒双方都是从自己的利益去考虑,很多时候采取出卖对方的策略,结果被主导者(囚徒困境中的警察角色)所利用,让双方陷入了困境,可以起到降低成本的作用。

比如现在有一个公开招标选择网络公司建立政府网的政府项目,某公司是投标者之一。对于这个公司来说,根据过去的经验能够预算出接手这个项目的真实成本是100万元人民币,然而这个公司并不了解其他竞争对手的真实成本。

该公司根据市场行情推断,其他公司的真实成本在50万~150万元之间。从概率的角度去看,在50万~150元万之间的任何一个,价格都有可能是最终的胜利者。我们简化这个问题,假设每个公司的成本只能是50万~60万元、60万~70万元……120万~130万元、130万~140万元、140万~150万元这样的整数,总共有10种可能,因此最终获得胜利的公司落在这10种价格区间中的任何一个的概率是1/10。

如果这个公司报价90万元,很显然,即使胜出,仍然要亏本10万元,看来100万元的报价是底线,低于这个价格的报价对于该公司毫无意义。当然这只是这一机制的理想状况。实际当中,如果价格低于成本,破坏了市场均衡,毫无疑问会影响项目质量,不但损害中标者利益,最终还会损害招标政府自身利益。

自然从理论上说,该公司投标报价一定要高于100万元,不妨假设报价为120万元,根据这10种价格的概率,其他公司报价低于120万元该公司失败的概率是3/5,即使开价100万,该公司不能中标的概率也有2/5。当然开价120万元胜出时可以赚取20万元利润,而开价100万元时,即使胜出也仅仅是能够弥补成本而已。

由此可见,开出一个较高的价码是该公司的优势策略。每一个投标公司都这么考虑的话,所有公司的报价都会高于实际成本,结果就是所有的开价都被人为抬高。怎样才能让公司投标报价接近于真实成本呢?

问题的关键在于采用某种激励机制来驱动投标者不说谎。如有这样一种激励方式,就是将合同判给开价最低者,却让他付开价第二低者的价格。

热门小说推荐

最新标签