第一章囚徒困境与纳什均衡ppt课件.ppt
《第一章囚徒困境与纳什均衡ppt课件.ppt》由会员分享,可在线阅读,更多相关《第一章囚徒困境与纳什均衡ppt课件.ppt(32页珍藏版)》请在三一文库上搜索。
1、第一章 囚徒困境与纳什均衡,赵国洪 13602757107 ,一、经典案例囚徒困境,经典案例囚徒困境,两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”: 如果两人都坦白则各判8年; 如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年; 如果都不坦白则各判年。 这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?,1950年,斯担福大学客座教授、数学家图克(Tucker)为形象地说明博弈过程,构造了著名的“囚徒困境”模型。,经典案例囚徒困境,从表面上看,他们应该互相合作,保持沉默。但他们不得不仔细考虑对方可能采取什么选择。 甲、乙两个人都十分精明,而且都只关
2、心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。 甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。 自然,乙也同样精明,也会如此推理。,经典案例囚徒困境,“囚徒困境” 产生不良结局的原因是囚犯都基于自私的角度考虑,最终导致合作没有产生。 如果你认为对方合作,那你背叛将能得到更多的好处。反过来,如果你认为对方将背叛,那么你也有两个选择,你选择合作,那么你就是“笨蛋”;你选择背叛,就会得到“对双方背叛的惩罚”。无论对
3、方如何行动,你背叛总是好的。相同的逻辑对另一个人也同样适用。 个体的理性导致双方得到的比可能得到的少,这就是“困境”。,经典案例囚徒困境,启示1:在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。 启示2:“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。,经典案例囚徒困境,就是说,对方背叛,你也背叛将会更好些。这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛
4、也能得到更多。你背叛总是好的。 于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合个体理性的选择。 照博弈论的说法,这是本问题的惟一平衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。这一点就是纳什均衡(Nash Equilibrium)。,经典案例囚徒困境,纳什均衡的思想,在博弈达到纳什均衡时,局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优策略,并与其他对手达成了某种暂时的平衡。 这种平衡在外界环境没有变化的情况下,倘若有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳定。
5、,纳什均衡的思想,再简单一点说,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。 在 “囚徒困境”变形的博弈中,A和B都坦白就是一个纳什均衡,这对双方来说都是最优选择。同时在这个博弈中,其均衡对双方来说是全局最优的。当然博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利的结果。,学生的囚徒困境,数十道“减负令”难见效 中小学生课业负担不减反增 仅1985年至2000年的15年里,中央就下达“减负令”4
6、9次。减轻中小学生过重负担喊了20多年,实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。为什么?,三、如何走出“囚徒困境 ” 合作是可能的吗?,促进双方合作可以从三个方面着手: (1)使得未来相对于现在更重要些; (2)改变对策者的四个可能的结果的收益值; (3)教给对策者那些促进合作的准则、事实和技能。,走出囚徒困境的三大途径,地摊、车站、旅游点,这些人群流动性大的地方,不但商品和服务质量最差,而且假货横行,因为在商家和顾客之间“没有明天”一个旅客不大可能因为你的饭菜可口而再次光临,一锤子买卖,不赚白不赚。 在公
7、共汽车上,两个陌生人会为一个坐位争吵,可如果他们认识,就会相互谦让。为什么? 在相互社会联系紧密的人际关系中,人们普遍比较注意礼节、道德 。,未来是否重要?,两个原始人见面,一个拿着兽皮,一个拿着野果,他们都想把对方的东西据为己有。如果他们的见面是偶然的,结果会如何?可如果他们都知道对方生活在附近,结果又会如何? 如果他们的见面是偶然的,可能相互抢劫; 可是如果他们都生活在附近,考虑到对方家族的报复,抢劫的风险就大了。所以他们不去打对方的主意所有权就这样产生了。如果他们确实想得到对方的东西,他们可以选择合作以物易物,交易就这样产生了。,未来是否重要?,从消极的层面看,我们互不侵犯,是为了避免没
8、完没了、两败俱伤的循环报应。,道德、法律、权力利益的划分,都与“还要见面”有关。,相邻的人互相敌对,只会两败俱伤。 两个相邻的国家,如果相互敌对,是一件非常不幸的事。它们不可能“搬家”,又不可能消灭对方(这是现代国际关系准则所不允许的),这个死结就可能缠绕它们许多年。遗憾的是,这样关系的邻国还不少,如巴以、印巴、两伊以及伊拉克和科威特。希腊和土耳其也曾经是这样的世仇,现在关系虽已缓和,但是它们之间的不信任感还是长久不能消除。 中苏交恶的年代,双方都在边境地区陈兵百万,巨大的军费开支和潜在的战争风险对两国都是重负。现在两国关系改善,互信增加,边境军事力量大大减弱,可以说是一个双赢。从这个意义上说
9、,“面向未来”不仅仅是一句外交辞令。,未来是否重要?,增大未来影响的另一方法是使接触更加频繁。在下一步接触很快就会发生的情况下,这一次合作通常更为重要。经常接触有助于促进稳定的合作。 在商业上,专业化公司趋向于限制在与少数几个公司接触以便使这种接触更加频繁。 在小城镇比在大城市容易出现合作便是因为人与人的接触更频繁。 接触更频繁也是婚姻比恋爱相对来说更稳定的原因之一。婚礼就是一个用来庆祝和促进持续关系的公共行为,对婚姻的稳定有促进作用。,增大未来的影响走出“囚徒困境”,分解(问题分解成若干的部分)是促进稳定的合作的一种有效方法。因为分解会增加接触的频率。,增大未来的影响走出“囚徒困境”,将军备
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 囚徒 困境 均衡 ppt 课件
链接地址:https://www.31doc.com/p-2505051.html