搜索
您的当前位置:首页正文

肖生克的救赎的博弈论论文

来源:欧得旅游网
合作与背叛的博弈

王梓哲

( 辽宁大学外国语学院 辽阳 111000 )

引言

在日常生活中人与人之间时时刻刻都存在着博弈,人与人的关系,人与事的联系及人与物的关联。所以在《肖生克的救赎》这部电影中亦存在着博弈关系。

关键词:纳什均衡、帕累托效率。

一、纳什均衡

纳什均衡定义:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡为博弈论中基础理论,自纳什均衡而后又衍生出子博弈完美均衡、逆推归纳法及贝叶斯纳什均衡等博弈理论。在纳什均衡之后的博弈理论,也可以理解为是在特定的情况下的纳什均衡及推理方法。在电影《肖生克的救赎》中也存在着纳什均衡。

1

在电影中Andy和监狱中的狱警及典狱长合作中就存在纳什均衡的博弈。这个博弈是一个多次长期的纳什均衡博弈。在最开始Andy和监狱的狱警合作,帮助其合理避税。他们的合作通过纳什均衡的分析可以得出合作分为:

合作为1 背叛为2 Andy 狱警 合作 背叛 合作 1,1 2,1 背叛 1,2, 2,2 这是一个动态博弈,在Andy给出策略合作后再由狱警做出最优策略。在最优策略中狱警没必要背叛,因为合作可以给他带来35000美元的利益,所以狱警的最优策略是合作。Andy在监狱中没有地位,总是受到其他犯人欺凌,所以他选择合作并增加合作条件是给在房顶工作的犯人没人3瓶啤酒。这又是一个动态博弈,Andy策略示好再由其他犯人再做出最优策略。所以他与狱警合作是个双重的动态博弈,在最优策略合作中即赢得了狱警的青睐又结交了狱友。和狱警的合作给Andy还带来了其他收益,在他被打伤的时候,狱警为了保护自己的合作对象进而报复那些欺凌Andy的罪犯。由于狱警和Andy的合作也促成了Andy和典狱长的长期多次合作。在Andy和典狱长之间的合作关系比之前的和狱警的合作关系相对复杂,因为是长期的多次的合作关系,所以每一次单次合作的博弈关系与之前和狱警的合作分析

2

是一样的,但是每次合作由于双方的利益条件不同,而合作结果也不同。最初Andy和典狱长的合作由于双方的利益互相之间没有冲突,典狱长让Andy帮他个人理财并且Andy在典狱长的控制之中,而Andy需要的是在监狱中的庇护和一些轻巧的工作,以及他和他的朋友能更好的在监狱里生活,避免狱警的打骂。所以以上的利益确保了两人和做的基础利益互不影响。以及后来Andy在广播室未经允许就公开播放莫扎特的音乐也没有受到处分也是之前合作的回报。这种合作关系直到一个叫Tom的犯人的到来,他带来了一个改变Andy和典狱长之间的博弈关系的信息——Andy其实是没有杀人,他的老婆及情人是另外一个犯人所杀。因为这条消息Andy和典狱长的合作关系受到了影响,由于Andy没有杀人所以终身监禁的判决是不成立的,进而Andy不再受典狱长的控制,典狱长无法继续提供条件和Andy交易,所以典狱长选择了对于他最优策略——让Andy无法澄清罪名,也就是典狱长选择背叛。这使得Andy的最优策略发生改变,本来合作可以得到自由,但是典狱长选择背叛Andy无法获得自由,只能继续和典狱长合作,但是这个合作是为以后合作博弈中的背叛作为铺垫。在Andy越狱成功后视为Andy背叛合作关系,并携带之前合作成果逃走并把典狱长逃税的证据交给有关部门和报社。所以多次合作的纳什均衡的最后取胜的结果是:一报还一报,即每次都采用对手上一次的策略。以下举例说明:

美国学者为此做了一次竞赛,方法是:游戏双方都在不知对方将如何选择的情况下,选择合作或背叛。这些选择放在一起就产生了四个可能的结果,即:合作,合作;合作,背叛;背叛,合作;背叛,背叛。在这个游戏中,如果双方选择合作,双方都能得到较好的结果R,即“对双方合作的奖励”。在这个例子中R

3

为3分,3也可以代表参赛者得到的奖金数。如果一方合作而另一方背叛,那么,背叛者得到“对背叛的诱惑”T=5。而合作者则得到“给笨蛋的报酬”S=0。如果双方都背叛那么双方都得到P=1,即“对双方背叛的惩罚”。

最后取胜的结果是:一报还一报策略。即每次都采用对手上次的策略。 一报还一报策略获胜的原因在于四点:善良性、报复性、宽容性和清晰性 善良性:防止陷入不必要的麻烦,

报复性:使对方试着背叛一次后就不敢再背叛。 宽容性:有助于重新恢复合作。

清晰性:使它容易被对方理解,从而引出长期的合作。

以上事例是让对方不敢背叛,但是在电影中如果仅是简单的报复典狱长会引来更多的麻烦,所以Andy选择放弃宽容性。

二、帕累托效率:

帕累托效率指的是:意大利经济学家帕累托提出的最佳经济效率,其准则是:经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。如果资源已经被充分利用,要想再改善我就必须损害你或别的什么人,要想再改善你就必须损害另外某个人,一句话,要想再改善任何人都必须损害别的人了,这时候就说一个经济已经实现了帕累托效率。

在影片中Tom出现前,Andy和典狱长的资源都已经被充分利用,Andy 需要典狱长提供给他一个相对安逸的生活环境,而典狱长也需要Andy帮他做账以达到合理避税及逃税漏税为自己积累资产,这样的合作已经是资源充分利用了,所以Andy的无罪就是在资源充分利用的前提上进行改善,Andy的无罪会损害典狱长的利益双方的交易平衡已经不存在了,这一事例又迎合了帕累托效率。

4

结论:在非合作性博弈中,个人利益与合作或者背叛有着必然的联

系。双方盈利的情况下,合作成立。一旦一方出现影响双方盈利的举动,相互背叛成立。

[ 参考文献 ]

http://wenku.baidu.com/view/5ec2e058be23482fb4da4c19.html 《博弈论简明教材》 共享人:桃李之争 作者:不详

http://wenku.baidu.com/view/5029f8d9d15abe23482f4daf.html

《博弈论的结论99%会被错用》共享人:淡定的看你哭 作者:红猪

《博弈论与经济学》 作者:克里斯汀·蒙特(法)、丹尼尔·塞拉 译者:张琦

《博弈论基础》 作者:罗伯特·吉本斯 译者:高峰 校注:魏玉根

5

因篇幅问题不能全部显示,请点此查看更多更全内容

Top