重复博弈触发策略

重复博弈触发策略

问:重复博弈的简介
  1. 答:顾名思义,重复博弈(repeated game)是指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”(stage games)。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。 重复博弈是指同样结构的博弈重复许多次。当博弈只进行一次时,每个参与人都只关心一次性的支付;如果博弈是重复多次的,参与人可能会为了长远利益而牺牲眼前的利益,从而选择不同的均衡策略。因此,重复博弈的次数会影响到博弈均衡的结果。
    在重复博弈中,每次博弈的条件、规则和内容都是相同的,但由于有一个长期利益的存在,因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争,即不能象在一次性静态博弈中那样毫不顾及其它博弈方的利益。有时,一方做出一种合作的姿态,可能使其它博弈方在今后阶段采取合作的态度,从而实现共同的长期利益。
    下面给出两个重要定义:
    定义1:可信性是指动态博弈中先行动的博弈方是否该相信后行动的博弈方会采取对自己有利或不利的行为。
    定义2:如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成均衡,则称该策略组合具有子博弈完美性。
    在重复博弈中,可信性同样是非常重要的,也即子博弈完美性仍是判断均衡是否稳定可靠的重要依据,又由于长期利益对短期行为的制约作用,因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的,从而使博弈的均衡结果出现更多的可能性。
问:如何解决囚犯的困境
  1. 答:解决囚犯困境的方法,就是进行重复博弈,也是动态博弈一种。比如,在一次静态博弈中,每一方为了达到自己的占优策略却导致了最坏的结果,即在占优均衡中总体利益和个体利益都下降了。如果采取触发策略进行重复博弈,一个成员背弃承诺,其他的都采取相同的不合作策略,并且一直进行下去,或者采取“以牙还牙”策略进行重复博弈,也就是参与人选择对手在上一时期的策略,这样下去,博弈的均衡解可能就会使总体利益最大。
  2. 答:我先简述一下囚徒困境,两个囚徒被警方分开单独审讯,假设囚徒都是自利的:
    1.两人都坦白,两人同时被判5年
    2.两人都不坦白,两人同时被判2年
    3.两人只有一个人坦白,另一个人不坦白,坦白的人被判1年,不坦白被判7年。
    假设甲现在被审讯,甲就会想,如果乙坦白了,我就必须要坦白,因为5<7
    如果乙没有坦白,那我还是要坦白,因为1<2。也就是说,无论乙的选择是怎样的,甲都会选择坦白。同样,对于乙来说也是同样的考虑过程。最终的结果就是2个囚徒都被判5年。
    这种困境是没法解决的,这是因为假设前提,人是自利的。要解决囚徒困境就是要假设这两个囚徒是团体利益为上者,即追求帕累托最优。
  3. 答:囚徒困境之所以被称为困境是指没有好的解决办法。
    两个人都在考虑对自己最有利的办法,而最后的结果是对两人最不利的。所以就是个困境。
    如果非要说解决办法的话,那就是别让自己成为囚徒,不要陷入囚徒困境。
问:什么是重复博弈,囚徒困境重复100次之后的纳什均衡是多少?
  1. 答:重复博弈是一种特殊的博弈,在博弈中,相同结构的博弈重复多次,甚至无限次。其中,每次博弈称为“阶段博弈”。在每个阶段博弈中,参与人可能同时行动,也可能不同时行动。因为其他参与人过去的行动的历史是可以观测的,因此在重复博弈中,每个参与人可以使自己在每个阶段选择的策略依赖于其他参与人过去的行为。
    至于这题的答案我们可以用逆推归纳法来做。第100次是因为是最后一次所以双方都会选择坦白,同理前面每次都会选择坦白。所以答案就是双方都坦白。r=0.125
  2. 答:以上是耶鲁大学公开课《博弈论》的在线视频网址,有时间可以看一看。
    重复博弈是一种特殊的博弈,在博弈中,相同结构的博弈重复多次,甚至无限次。博弈的结果是(抵赖,抵赖)。r=0.125
    在现实生活中,如果有黑社会存在,囚徒困境一次博弈就可达到最优解。因为如果一人抵赖,而另一人坦白,那么坦白的人出去后将会受到严重制裁,所以都会选择抵赖。
重复博弈触发策略
下载Doc文档

猜你喜欢