生活
重复博弈 、囚徒困境无限次重复博弈
2023-04-19 01:21  浏览:48

动态博弈与重复博弈的区别

动态博弈只是单次博弈中行动方采取行动有先后顺序。一方先选择策略行动了,另一方看到前面一方的行动后再选择自己的策略再行动来完成这次博弈。这只是一次博弈。比如猜拳的规则现在是一方先出,另一方再出,就是动态博弈了。

重复博弈是指多次博弈,可以是静态的也可以是动态的,总之就是所有行动方都行动过后完成了一次博弈,接着再进行相同的博弈,可以选择不同的策略。

比如猜拳,一把猜完再猜一把。

博弈论十大定律

博弈论十大定律如下:

1、囚徒困境。人的一生总要面对很多选择,而且在很多时候你都会面临那种让你进退两难的的抉择。到底何去何从,囚徒困境的博弈虽这里不可能会带给你带来一个明确的答复,但是却能够使你通过这种两难的抉择,引发一种种深深的思考。因为,背叛与合作并不只是道德与良知的核心,更是利益的化身。

2、重复博弈。在博弈论中,按照博弈的次数多少,博弈行为可分为有限次数博弈和无限次数博弈两大类。所谓无限次数博弈,就是博弈双方会把一个博弈行为重复无限多次。由于博弈双方都将顾及长远利益,所以双方在博弈中往往会采取尽量与对方合作的态度。

3、斗鸡博弈。曾经的话说某一天,在斗鸡场上有两只好战的公鸡发生遭遇战。这时,公鸡有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败。如果两只公鸡都前进,则两败俱伤。

4、智猪博弈。生活中,经济学里有一句名言:“天下没有免费的午餐。”它非常形象地说明了任何经济活动都是需要成本的,要获得利益,就得付出一定的代价。可是,世界上真的就没有免费午餐了吗?答案自然是否定的。生活中随处可见的“搭便车”现象,就很生动地告诉我们,天下还是有一些你可以享用的免费午餐。

5、酒吧博弈。如果你的身边有“专业”的彩民朋友,通过观察你会发现,他通常会将以往的zhong,jiang号码进行收集、归纳、总结,然后得出自己所预测的下一期zhong,jiang结果。他们这种行为。其实是一种信息收集与预测的途径,也是概率推算的规则,其原理与酒吧博弈堪称如出一辙。

6、猎鹿博弈。在原始社会,人们靠狩猎为生。为了使问题简化。设想村庄里只有两个猎人,主要的猎物只有两种:鹿和兔子。如果两个猎人齐心合力。忠实地守着自己的岗位,他们就可以共同捕得一头鹿。要是两个猎人各自行动,仅凭一个人的力量,是无法捕到鹿的。但却可以抓住4只兔子。不知道从什么时候开始,“协作”、“团队精神”这样的名词开始频频出现在我们的生活之中。

7、蜈蚣博弈。在现实生活中,人们在尝试做一件事情的时候往往会先对其结果进行分析预判,然后根据可能发生的种种情况而进行合理的选择。但是,即使你的推断逻辑足够严谨,可能得出的结论也会与你的直觉大相径庭。

8、鹰鸽博弈。在与自然博弈的过程之中,鹰与鸽都表现出了各自不同的特点。鹰派注重实力,鸽派更注重道义;鹰派注重利益,鸽派注重信义;鹰派注重眼前,鸽派注重长远;鹰派注重战术,鸽派注重战略;鹰派倾向于求快,鸽派倾向于求稳。但是,鹰派与鸽派到底何者更好一些,恐怕难以一概而论。

9、枪战博弈。这个世界的生存法则是物竞天择,适者生存,而非强者生存。恐龙高大,但它却在地球上绝迹了,相对于强者来说,弱者有更多的选择和妥协,因为懂得适应,他们就有更多的生存机会。

10、情场博弈。恋人,既是你的合作伙伴,也是你的对手,甚至“敌人”。在恋爱的这场不是游戏的“游戏”中,谁能熟练地驾驭游戏或博弈规则,谁就是爱情的赢家。所以,要想成为赢家,就要学会与伙伴一样的恋人合作,还要学会与敌人一样的恋人周旋。面对对手围追堵截的爱情围剿,要学会闪转腾挪的诸多反围剿的手段。

什么是重复博弈

复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托***。囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来***利益(无罪开释),但在无法沟通的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反***共同利益,反而是自己***利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

重复博弈的特征

重复博弈具有三个基本特征:

A、重复博弈的阶段,博弈之间没有“物质”上的联系,即前一个阶段博弈并不改变后一个阶段的博弈的结构;

B、在重复博弈的每一个阶段,所有参与人都观测到该博弈过去的历史;

C、参与人的总收益是所有阶段博弈的收益的贴现值之和或加权平均数。

什么是重复博弈理论

重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。

首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代,被称为“佚名定理”。该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它相当模糊,并且不提供信息。而奥曼认为,完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁(自我破坏或其他)等现象。博弈论和新古典经济学模式的现象,可能一开始看起来是非理性的。

奥曼还考察了许多具体的合作行为,定义了“强均衡”概念,即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出,重复博弈的“强均衡”与一次性博弈的核(更精确的是“6核心”)相一致。为此,奥曼定义和研究了经济理论中极为重要的“一般”合作博弈,即非转移效用(non-transferable utility)博弈,这开拓了该领域的研究空间,因为在此之前,仅有“单边支付”博弈被研究,即每个联盟可以任意在其成员中分享一定数额的赢得。

其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始,奥曼和其他合作者一起,在其学生的辅助下,发展了不完全信息的重复博弈论。1966年,奥曼和m.马希勒(michael maschler)在给美国武器控制和裁军机构的开创性报告中,建立了不完全信息的重复博弈模型。他们指出,信息使用的复杂性实际上可以以一种出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零(zero-sum)和博弈中,其中一个参与者比另一个拥有更多的信息(这就是所谓的单边的不完全信息),拥有更多信息的参与者所使用(并揭露)的信息数量是被精确地决定的;有时是完全揭露或根本没有揭露;有时是部分揭露。这种分析被扩展至更一般的模型,即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。

关于重复博弈和囚徒困境无限次重复博弈的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。

发表评论
0评