如何让囚徒走不出困境——三人博弈理论及其应用- 法信- 懂法，更懂 ...

相关文章推荐

鬼畜的钢笔 · 如何让囚徒走不出困境——三人博弈理论及其应用 ...· 4 月前 ·

鬼畜的钢笔 · 發現自己進退兩難？也許你正陷於「囚徒困境」之中！· 4 月前 ·

鬼畜的钢笔 · 囚徒困境是个什么鬼？为什么外卖、单车、充电宝 ...· 4 月前 ·

鬼畜的钢笔 · 博弈论与合作: 互利共赢？ · ...· 4 月前 ·

鬼畜的钢笔 · 经济50人论坛· 4 月前 ·

（广东海洋大学法学院，广东湛江 524088）

摘要：以囚徒困境为代表二人博弈模型在学术界已经被广泛研究并加以应用。囚徒困境理论往往容易形成一种简单化和两极化的固定思维模式。囚徒困境的二人博弈模型实际上是三人博弈模型的简化。而三人博弈模型在现实生活中比二人博弈模型更加贴近现实，更具有解释力。分析三人博弈模型的结构及其理论意义，并以刑事诉讼法为例对三人博弈模型的应用进行探讨很有必要。
关键词：二人博弈；囚徒困境；三人博弈；刑事诉讼法
中图分类号： D909 文献标识码： A 文章编号： 2095-3275（2015）02-0140-06
一、三人博弈模型和三人博弈困境
以囚徒困境为典型的简单二人博弈模型已为我国法学界所熟知并成为不少学者分析和理解诸多社会问题的有用工具。然而在博弈论中，二人博弈只是博弈论的基本模型。三人博弈以及多人博弈模型博弈论诞生之初就受到了其创始人的关注［1］，其理论应用也十分广泛，但在我国法学界却鲜有人讨论。而实际上从三人博弈的分析中却能给我们提供很多二人博弈无法看到的东西。本文将从美国著名哲学家罗伯特·诺奇克（Robert Nozick）提出的三人博弈模型入手来展示三人博弈与二人博弈的不同之处以及这种理论可能给我们带来的新的理论上的启示。
诺奇克提出的三人博弈模型如下：假如现在有A,B,C三人要分10美元，他们中的任何人可以提出任何分配规则，只要这个规则在分配结束的时间到来之前得到了多数人，也就是两个人或者所有人的同意就可以。分配将会怎样进行［2］？
这个问题初看起来很简单。也许最简单的分配方案就是三人均分，但是，作为理性的经济人，博弈者很快就会发现：如果某两个博弈者达成协议，他们的结盟就可以独享这10美元的收益，而被排斥在结盟之外的博弈者将一无所得，这样的分配方案收益大大高于三人均分的收益，更加符合任何两个结盟者的利益。这样，博弈者A和B或许就会达成同盟，提出AB各得5美元，C一无所有的分配方案。但是C很快发现自己的利益被A和B的同盟剥夺了，他会去破坏A和B的联盟，他可以向B提出自己只要4美元，而给B 6美元的结盟方案，虽然C自己少拿了2美元，但他至少可以得到比一无所有好得多的结果。B发现在和C的同盟中自己可以得到更多，他将会放弃和A的同盟转而和C结成同盟。为了对付C的破坏，A可以提出更高的价格，比如说自己只要3美元而给B 7美元，B发现这个报价更优惠，可能又回心转意，投回A的怀抱。为了不使自己一无所获，C进一步报价自己2美元，B 8美元，A报价自己1美元，B 9美元，……
当A的报价低到自己只要1美分而给可能的同盟者B高达9.99美元时（或许更早），A发现或许B不是个很好的结盟伙伴，自己和B的结盟太吃亏了，他或许会转而向C提出结盟的建议，由A和C组成同盟，每人分5美元，B一无所得。B发现A和C结成了同盟，自己很可能一无所有，他将会重复C的竞价策略，开始破坏A和C的同盟，他转而向A或C提出竞价，A或者C发现自己可能分的更多，受到诱惑的其中之一又开始脱离联盟，剩下的人只好又开始新一轮的竞价……
这样，在最后限定的时间到来之时，谁都没法知道最后的分配结果是怎样的。即使有两方达成了协议，谁也没法保证被排斥在结盟之外的一方会不会在最后一秒钟喊出自己只要1美分，而把剩余的9.99美元给自己的结盟伙伴的超低价，更不能保证自己的结盟伙伴在如此高的收益面前不背叛自己。（结盟者当然也可以喊出自己一分钱不要，所有钱全部给自己的结盟者的报价。但这个报价与没有结盟时的结果没有区别，结盟不结盟在这个报价下已经失去了区别而变得无意义。）这样，我们从这个游戏中可以推断出以下结论：如果想要形成结盟，结盟者在该结盟中所获得的收益不能高于与其结盟的盟友所获得的收益［3］，否则结盟者就会有背叛收益较低的结盟转投收益较高的结盟的动力。但即使结盟收益相等，由于有竞争者，或者说“拆台者”的存在，形成哪一个结盟是无法确定的。
那么，在这个博弈的过程中，有没有可能达成三个人均分的可能性呢？毫无疑问，对于每一个博弈者来说，与一无所有的结局相比，得到约3.3的收益是一个好得多的结局。但是，首先，这会降低每一个博弈者可能的最大收益（由5降到约3.3），更重要的是和一个人结成同盟要考虑到一个结盟者背叛的可能性，和两个对手结盟则要考虑两个结盟者背叛的可能性。在没有其他手段确保结盟者会信守承诺的情况下，约束两个人比一个人更难，预期收益可能更低，更加不理智。因此，在没有成本的情况下，博弈者只能一轮一轮地继续着谈判，只有让这个讨价还价的过程无限进行下去自己潜在的亏损才不会变成实际的亏损。虽然我们知道存在着两个人结盟的可能，但我们无法确认会形成的是怎样的同盟。正如诺依曼和摩根斯坦在《博弈论与经济行为》中所言：根本没有联盟形成的情况是不合理的，但具体哪一个联盟形成则依赖其他条件［4］。
这样，我们看到了一种不同于二人博弈的三人博弈过程。博弈中的每一个人不仅仅要和可能的同盟者博弈，还要和“拆台者”进行博弈。这是一个没有那样均衡那样稳定的博弈。虽然每一个人都知道每一个人获得最大收益的可能来源于他和其他另外一个人的结盟，但和谁结盟却是无法确定的。和所有竞争者均分收益固然是一个次优的策略，但无法保证其他两个竞争对手也会选择同样的次优策略，自己的次优策略很可能变成一个危险的劣策略。最后的结果是形成了一个谁也无法预测的结局。这也是另外一个社会两难的例子——三人社会两难［5］。
和二人囚徒困境博弈相比，三人博弈模型中的合作似乎更难出现。因为博弈者不仅仅要考虑结盟者背叛的可能，还要考虑拆台者破坏的可能。拆台者的出现抬高了自己出价的价码。使自己处于腹背受敌的境地。虽然博弈者都知道任何两个人或者多人联盟都会使参与者获得更多收益，但如何形成那个可能的联盟？而这个不稳定的联盟又有什么意义？
二、三人博弈模型的理论寓意——如何让真正的囚徒走不出困境？
博弈论的目的并不在于思想游戏，而在于从理性人的博弈中找到理解现实世界的方法，洞察人类行为背后的理性根源。经典的囚徒困境博弈可以作为实际生活中许多现象的一个抽象概括。在囚徒困境作为博弈论的经典例子被法律经济学家们引入法律的经济分析之后，许多学者已经习惯于用囚徒困境的博弈分析来对现实生活中的法律现象进行解读。而没有注意到三人博弈的不稳定结构同样具有解读这些法律现象背后的理性动机的能力。
应用三人博弈模型的关键在于理解：三人博弈模型实际上是二人博弈模型的扩展，或者说，二人博弈模型是三人博弈模型的简化。我们早已习惯性地把囚徒困境当作一个典型的二人博弈模型，但是，我们仔细想想就会明白，这是因为我们省略掉了另外一个参与博弈的主体——国家。而我们之所以省略掉这样的主体是因为我们认定国家是居于强大的优势地位的，不可收买的，并且不可能与两个囚徒发生互动的第三方。但认真一想我们就会发现，在囚徒困境的特定语境中，囚徒们之所以都选择坦白不正是考虑到另一个囚徒可能被第三人国家收买吗？整个博弈的过程实际上是两个囚徒和国家之间的三方博弈。但由于相对个人而言，我们习惯性的以为国家是如此之强大，以至于我们直接把国家当成了外在于囚徒们的制度约束条件而忽略了囚徒和国家博弈的可能。
然而，国家虽然强大，但在局部的环境中却由于信息的劣势而处在被动之中。即使身在牢房之中，两个小小的囚徒无法改变法律，但却可以利用自己的局部信息优势使国家难以获得必要的信息来逃脱国家的法律制裁。只要两个囚徒能贯彻他们之间的攻守同盟，国家在本身的制度约束之下不一定能在两个配合默契的囚徒面前占什么便宜。这样，当我们跳出囚徒困境的思想束缚再仔细审视这一困境，我们将会发现，囚徒困境完全可以改写成囚徒A,B和国家三人博弈的模型。而且这个三人博弈模型同样可以给我们以理论——尤其是现实生活中的刑事理论上的启示。
在这个三人模型的囚徒困境中，囚徒A,B和国家虽然在力量方面是极其不平等的，但在局部范围内，在信息的掌握方面，囚徒A,B却处在优势地位，只要囚徒A和B合作，那么他们就可以实现其利益最大化。反过来，国家的问题是怎样打破A和B的结盟，实现自己的利益最大化。这样，从国家的角度出发问题就转变成了：怎样让囚徒们永远走不出囚徒困境。或者至少，降低囚徒们走出困境的可能性。在现实中，这个问题也有它的现实意义，那就是对于有可能形成合作并走出囚徒困境的犯罪，比如团伙进行的盗窃、抢夺或者黑社会性质犯罪、贪污贿赂犯罪，团体犯罪等案件怎样让囚徒们无法形成同盟？对于作为维护国家秩序和解决社会争议的社会机构国家来说，这才是最符合国家和社会利益的根本问题，社会学家们要思考的是“怎样走出囚徒困境”以形成社会合作的抽象理论问题，而刑事政策的专家们需要研究的则是“怎样让囚徒走不出困境”的现实问题。