重复囚徒困境：铲除不合作的特权阶级是前提条件 -

重复囚徒困境
(Iterated Prisoner's Dilemma)
：iamanewbee

　　[b]【特权阶级在1978年首先背叛了，所以改良永远没有出路，至于屁民，余下怎么做已经有了答案。要建立人人合作的诚信社会，铲除不合作的特权阶级是前提条件。】[/b]

　　囚徒困境(Prisoner's dilemma)是指以下这个经典实验(在好莱坞的电影里也经常得见):

　　警方逮捕A、B两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别向双方提供以下的选择：

　　若一人认罪并作证检控对方（“背叛”），而对方保持沉默（“合作”），此人将即时获释，对方将判刑5年。
　　若二人都保持沉默（“合作”），则二人同样判刑1年。
　　若二人都互相检举（“背叛”），则二人同样判刑3年。

　　用得益表格的形式就是:

　　A合作B合作: A 1年 B 1年
　　A合作B背叛: A 5年 B 0年
　　A背叛B合作: A 0年 B 5年
　　A背叛B背叛: A 3年 B 3年

　　很显然，如果着眼全体利益，A和B都应该合作(保持沉默)，全体利益达到了最好的2年刑期。但是人的本性是自私的，只会着眼个人利益，无论对方是什么选择，选择背叛(认罪并作证检控对方)都能够把自己刑期降到最低。所以A和B都会选择背叛，最终结果是两人同样判刑3年，全体利益达到了最差的6年刑期。

　　囚徒困境应用到你和唐骏的面试，是同样的结果。你和唐骏都可以选择实报学历(合作)，或者造假学历(背叛)。诚实或者造假的得益表是:

　　你诚实唐诚实: 你继续面试唐继续面试
　　你诚实唐假造: 你面试失败唐继续面试
　　你假造唐诚实: 你继续面试唐面试失败
　　你假造唐假造: 你继续面试唐继续面试

　　从个人利益出发，理性的你和唐骏都会选择假造，最终结果是两人都靠造假学历继续面试。

　　这个例子可以从两个人扩大到N个人，从个人利益出发，每个理性的人都会选择造假学历继续面试，对整个社会的净后果是用人单位受骗而承受最大损失。

　　这个例子也可以从假学历推广到抄袭论文、三聚奶粉、香精香米、地沟油、等等。正如某位网友所说的，"要能赚唐骏这么些钱,骂唐骏的多少龌龊事都做了"。完全正确，人的两个本性---自私和理性---决定了人必然陷入囚徒困境，必然为私利而不顾全体利益。道德、信仰、舆论、法律等等也许能够稍微压抑自私，但无法改变人性，也就无法让人摆脱囚徒困境，这就是为什么中国5千年来(换埃及是7千年，换美国是2百年，等等)改朝换代，实行各种道德信仰舆论法律，弄虚做假毒害全体的行为屡教不改、屡禁不止。

　　万幸的是，摆脱囚徒困境的可能是有的，如果我们引入一个新的变数 --- 重复。

　　重复囚徒困境(Iterated Prisoner's Dilemma)是指A、B两人重复多轮囚徒困境试验，而且每人都知道以前对方所做的决定。这时的每个人都可以制定一套策略，决定每轮试验是否选择合作或者背叛。一个显而易见的策略是“永远背叛”，因为这个策略在每轮试验都是力求个人利益最大化。换言之，“自私的人永不吃亏”。

　　把重复囚徒困境推广到N个人，每个人的策略都是“永远背叛”，整个社会就达到一个平衡，即一个“人人自私”的社会。说这个社会达到一个“平衡”，指的是企图改变这个社会的“微调”都是徒劳的。我们可以假想，在这个人人自私的社会里，其中某人在某轮囚徒试验中选择了“合作”，很显然，在那轮试验中他得到的利益将是会所有人中最小的。而他也对此次的吃亏留下了深刻印象，在下一轮试验中会牢记要“背叛”。

　　把这个结论推广到现实社会，就是: 如果其他人都是唐骏，你想不买假文凭都难！如果人人都在抄袭论文、造三聚奶粉、造香精香米，你不去卖地沟油只能说明你是傻子将被社会所淘汰！

　　万幸的是，1959年以来，无论是理论还是电脑模拟，都已经证明，“永远背叛”并非唯一的一个可以让全体社会达到“平衡”的策略，“人人自私”不是唯一的一个社会平衡态。

　　让我们来看一个叫做“恩怨分明”(tit for tat)策略。这个策略很简单:
　　第一轮试验: 选择“合作”。
　　以后的每轮试验: 选择上一轮试验对方作出的选择。 (如果对方上一轮合作，我就这一轮合作，否则就背叛。)

　　把重复囚徒困境推广到N个人，每个人的策略都是“恩怨分明”，很显然，整个社会就达到一个“平衡”，一个“人人合作”的平衡态。我们可以假想，在这个人人合作的社会里，如果有人选择了“永远背叛”的策略，在第一轮试验中他将是获得利益最大的人，但是在以后的每轮试验中，与他对弈的都会选择背叛，而不与他对弈的继续合作，N轮试验下来，他将是得到利益最小的，而其他合作的人将得到稳定持久的利益。他会对此印象深刻而最终放弃“永远背叛”的策略，整个社会回到“人人合作”的平衡态。

　　把这个结论推广到现实社会，就是: 人人都实报学历、原创论文、供应真奶粉真香米、杜绝地沟油。如果出现唐骏造假文凭，就放他入下一轮面试，然后灌他毒米地沟油!

　　和恩怨分明类似的，以个人利益为出发点却让社会利益达到最大化策略有很多，大致都有如下特点:
　　1. 初始友好: 一开始总是选择合作，而且绝不首先背叛。
　　2. 有效惩罚: 如果对方背叛一定以同样的背叛作为惩罚。
　　3. 愿意宽恕: 如果对方改邪归正从背叛改为合作，就愿意原谅对方回到合作，不永远记仇。
　　4. 绝不嫉妒: 不贪图达到整个社会所有人中的最大的得益者。

　　既然理论上已经证明，“人人合作”的社会是可能的，那么为什么中国还没有实现？要把理论变为现实达到社会“人人合作”的平衡态，有两个关键:

　　1。社会结构允许任何人对任何人实施“恩怨分明”或者类似的策略。

　　可以想象，如果有人可以在某轮试验中选择“背叛”而不为人知，或者为人知晓但别人无法对他实施惩罚，“永远背叛”的策略会大行其道，“人人合作”的平衡态会顷刻垮台。

　　那么中国是否存在选择“背叛”而不为人知？是否存在信息不透明不对称？我想是有的。

　　那么中国是否存在无法对“背叛”实施惩罚？是否存在特权阶级、垄断势力、体制内、仆人？是否存在暴力抗法、有法不依？人情代法？是否总想找熟人走后门绕过法规？我想都是有的。

　　2。全体人群中有足够多的人采用“恩怨分明”或者类似的策略，或者说有足够少的人采用“永远背叛”的策略。

　　如果多数人已经采用“永远背叛”的策略，社会将走向“人人自私”，因为那也是一个平衡态。所以“恩怨分明”者在社会所占比例(即所谓的critical mass)至关重要。这解释了为什么有些国家可以达到“人人合作”的平衡态，有些即使引进了同样的法律、制度等等却不能找到(至少不能很快达到)“人人合作”的平衡态。这也解释了为什么一个国家的贪官污吏携款潜逃到另一个国家却可以奉公守法。等等…

　　那么中国是否已经有过多的人采用“永远背叛”的策略导致社会“人人自私”？我没有统计过，希望没有多到无可挽回的地步吧。

　　综上所述，在中国要达到个人和整体利益同时最大化的“人人合作”的平衡态，有太多需要改变的地方。社会结构需要改变，信息渠道需要透明，特权阶级需要消灭，后门传统需要杜绝，采用“恩怨分明”或者类似的策略需要达到一定高的比例，等等。每件事都不可能一夜成就，每件事都太困难。在可以预见的未来，“永远背叛”的唐骏将继续大行其道，而看清这点的每个人也会出于自身利益最大化的需要而同样采用“永远背叛”策略。

　　囚徒困境，名副其实，非常困境。

「支持！」

注：配图来自网络无版权标志图像，侵删！

声明：文章仅代表个人观点，不代表本站观点—— 责任编辑：wuhe

重复囚徒困境：铲除不合作的特权阶级是前提条件

欢迎扫描下方二维码，订阅网刊微信公众号

心情表态

今日头条

毛主席的光辉不可磨灭，正确性终将被承认！

最新专题

130周年

点击排行