新闻资讯
看你所看,想你所想

囚徒的困境读后感

囚徒的困境

作者:威廉·庞德斯通

计算机和博弈论自半个世纪前进入人类历史以来,深刻地改变了我们的生活、工作乃至思维方式,而发明它们的冯·诺依曼瑰丽而传奇的一生亦值得我们细细品味。威廉·庞德斯通以“囚徒的困境”作为探寻这位美籍数学家的生平和20世纪广阔历史的透镜,让读者看到了一位有血有肉、活灵活现的科学家,看到了抽象难懂的数学概念如何变成生活中的思维工具,看到了“二战”之后国际政治舞台上的矛盾和冲突……

囚徒的困境在线阅读地址

囚徒的困境读后感 第(1)篇

博弈论中有个非常重要的模型——囚徒的困境。

它讲述了这样一个场景:两人被指共同犯法的人被警察分别关押。两个囚徒由于单独监禁,不可相互通气和交换信息。警察也没有足够证据证明两人有罪,只好分别跟两个囚徒就面临的坐牢年限进行讨价还价,如下所示:

| A\\B | 坦白 | 抗拒 |

| 坦白 | -8,-8 | 0,-10 |

| 抗拒 | -10,0 | -1,-1 |

那么,两个囚徒(分别为 A 与 B )将做出怎样的选择呢。

从 A 的角度来看,究竟该选择坦白还是抗拒:

+ 如果 B 选择坦白,那么 A 选择坦白则是 -8(坐 8 年牢),选择抗拒则是 -10,那么 A 的选择将会是坦白

+ 如果 B 选择抗拒,那么 A 选择坦白则是 0,选择抗拒则是 -1,那么 A 的选择将会是坦白

所以,A 的选择是坦白。

同样,从 B 的角度来看:

+ 如果 A 选择坦白,那么 B 选择坦白则是 -8(坐 8 年牢),选择抗拒则是 -10,那么 B 的选择将会是坦白

+ 如果 A 选择抗拒,那么 B 选择坦白则是 0,选择抗拒则是 -1,那么 B 的选择将会是坦白

所以,B 的选择是坦白。

总的来讲,A, B 的选择都是坦白,都是选择 -8,坐 8 年牢。它不是最优解,但是是在这个规则下 A, B 各自的最大收益解,这个收益解所在的点被称之为“纳什均衡点”。

另外,在对称的2×2博弈中,根据不同的收益的偏好可以产生四种不同的博弈论模型(囚徒的困境是其中之一)。我们用“CC”表示双方合作时每人的回报,“DD”表示双方互相背叛时的回报。当一方合作,另一方背叛时,孤独的合作者的回报用“CD”表示,孤独的背叛者的回报用“DC”表示。那么这四种博弈论模型可表示为:

DC> DD> CC> CD 僵局

DC> CC> DD> CD 囚徒的困境

DC> CC> CD> DD 胆小鬼

CC> DC> DD> CD 围捕牡鹿

本书以二战后美苏的对峙历程与冯诺依曼的生平来讲述博弈论的起源与发展,并以浅显而丰富的事例来解释多种博弈论模型。另外,仔细思考博弈论中关于利益冲突时,冲突各方做出的权衡和选择,十分有趣,也十分有益。总之,好评,推荐!

转载请注明出处海之美文 » 囚徒的困境读后感

相关推荐

    声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:ailianmeng11@163.com